|
دانلود پاورپوینت یادگیری تقویتی
دانلود پاورپوینت یادگیری تقویتی |
|
| دسته بندی | پاورپوینت |
| فرمت فایل | ppt |
| حجم فایل | 61 کیلو بایت |
| تعداد صفحات فایل | 23 |
پاورپوینت یادگیری تقویتی
قسمتی از متون اسلاید ها:
اسلاید 1 ) :
عنوان
از اسلاید 2 ) تا اسلاید 5 )
یادگیری تقویتی
در یک مسئله یادگیری تقویتی با عاملی روبرو هستیم که از طریق سعی و خطا با محیط تعامل کرده و یاد میگیرد تا عملی بهینه را برای رسیدن به هدف انتخاب نماید.
یادگیری تقویتی از اینرو مورد توجه است که راهی برای آموزش عاملها برای انجام یک عمل از طریق دادن پاداش و تنبیه است بدون اینکه لازم باشد نحوه انجام عمل را برای عامل مشخص نمائیم.
دو استراتژی اصلی برای اینکار وجود دارد:
.1 یکی استفاده از الگوریتم های ژنتیکی
.2 و دیگری استفاده از روشهای آماری و dynamic programming
در RL روش دوم مد نظر است
محیط مجموعه ای از S حالت ممکن است.
در هر لحظه t عامل میتواند یکی از A عمل ممکن را انجام دهد.
عامل ممکن است در مقابل عمل و یا مجموعه ای از اعمالی که انجام میدهد پاداش r را دریافت کند. این پاداش ممکن است مثبت و یا منفی ( تنبیه ) باشد.
عامل در محیط حرکت کرده و حالتها و پاداشهای مربوطه را به خاطر می سپارد.
عامل سعی میکند طوری رفتار کند که تابع پاداش را ماکزیمم نماید.