بهینه سازی توابع محک CEC2005 با استفاده از یک الگوریتم فراابتکاری جدید مبتنی بر یادگیری تقویتی

الگوریتم بهینه سازی مبتنی بر یادگیری تقویتی بنام WHH

تاکنون الگوریتم های فراابتکاری متعددی برای مسائل بهینه سازی مختلف معرفی شده است. در الگوریتم های فراابتکاری ایجاد تعادل بین اکتشاف(Exploration) و بهره برداری(Exploitation) یک چالش مهم و تاثیر گذار در عملکرد الگوریتم است. در این پست ما یک مقاله جدید را در متلب پیاده سازی نموده ایم که در آن از یادگیری تقویتی برای حل این چالش مهم استفاده شده است.

در این مقاله یک الگوریتم جدید مبتنی بر یادگیری تقویتی بنام World Hyper-Heuristic ارائه شده است که بصورت داینامیک و هوشمندانه بین اکتشاف و بهره برداری تعادل ایجاد می کند.

در دنیای واقعی، مسائل پیچیده بسیاری در علوم مهندسی وجود دارد. هر مسئله دارای سطحی از پیچیدگی محاسباتی است که از مسائل ساده شروع می شود و به مسائل سخت NP می رسد. مسائل Np-hard پاسخ قطعی ندارند. بنابراین، الگوریتم های فراابتکاری سعی در بهینه سازی مسائل NP-hard دارند. الگوریتم های فراابتکاری مسائل پیچیده را با استفاده از استراتژی های مختلف اکتشاف و بهره برداری، بهینه می کند. الگوریتم‌های موجود نیازمند به تعمیم‌پذیری بیشتر برای انواع مسائل را دارند و دارای محدودیتی برای یک مسئله هستند و همیشه باید متناسب با مسئله پارامترها و استراتژی های آن تنظیم گرددند و ایجاد تعادل بین اکتشاف و بهره برداری در آن ها یک چالش اساسی است. الگوریتم World Hyper-Heuristic، برای حل این مشکل، استخری از استراتژی ها را که برای ایجاد اکتشاف یا بهره برداری هستند در خود جای داده است. این استراتژی ها از الگوریتم های فراابتکاری موجود انتخاب شده اند. بعد از این که استراتژی ها مشخص شدند در ظول الگوریتم با استفاده از دو عملگر پاداش دادن(rewarding) و انتخاب(selection) بصورت داینامیک و متغیر از استراتژی های مختلف براساس پاداشی که گرفته اند از استخر استراتژی ها انتخاب می شوند و به کار گرفته می شوند.

مقاله پایه الگوریتم World Hyper-Heuristic را می توانید ار لینک زیر مشاهده نمایید

World Hyper-Heuristic: A novel reinforcement learning approach for dynamic exploration and exploitation

ما الگوریتم پیشنهادی این مقاله را روی توابع محک CEC2005 در نرم افزار متلب(Matlab) پیاده سازی کرده ایم. البته این کد را خیلی راحت می توان بر سایر بهینه سازی و همچنین توابع محک دیگر نظیر CEC2017، CEC2020 و … به کار گرفت.

کد متلب الگوریتم فراابتکاری WHH را می توانید از لینک زیر خریداری نمایید و همچنین برای توسعه و تغییر در آن یا هرگونه سوال در آن، می توانید با ما در تلگرام در ارتباط باشید:

WHH Matlab Codes for CEC2005

قیمت: ۵۰۰۰۰۰ تومان

دیدگاه ها:



درج دیدگاه