روش بهینه‌سازی ازدحام ذرات - ویکی‌پدیا، دانشنامهٔ آزاد

ازدحام ذرات در جستجوی حداقل جهانی یک تابع

روش بهینه‌سازی ازدحام ذرات (به انگلیسی: Particle swarm optimization) یا به اختصار PSO، یک روش سراسری بهینه‌سازی است که با استفاده از آن می‌توان با مسائلی که جواب آن‌ها یک نقطه یا سطح در فضای n بعدی می‌باشد، برخورد نمود. در اینچنین فضایی، فرضیاتی مطرح می‌شود و یک سرعت ابتدایی به آن‌ها اختصاص داده می‌شود، همچنین کانال‌های ارتباطی بین ذرات در نظر گرفته می‌شود. سپس این ذرات در فضای پاسخ حرکت می‌کنند، و نتایج حاصله بر مبنای یک «ملاک شایستگی» پس از هر بازهٔ زمانی محاسبه می‌شود. با گذشت زمان، ذرات به سمت ذراتی که دارای ملاک شایستگی بالاتری هستند و در گروه ارتباطی یکسانی قرار دارند، شتاب می‌گیرند. علی‌رغم اینکه هر روش در محدوده‌ای از مسائل به خوبی کار می‌کند، این روش در حل مسائل بهینه‌سازی پیوسته موفقیت بسیاری از خود نشان داده‌است.

انواع الگوریتم ازدحام ذرات[ویرایش]

الگوریتم ازدحام ذرات پیوسته[ویرایش]

مقدمه[ویرایش]

الگوریتم PSO یک الگوریتم جستجوی جمعی است که از روی رفتار اجتماعی دسته‌های پرندگان مدل شده‌است. در ابتدا این الگوریتم به منظور کشف الگوهای حاکم بر پرواز هم‌زمان پرندگان و تغییر ناگهانی مسیر آن‌ها و تغییر شکل بهینهٔ دسته به کار گرفته شد. در PSO، ذرات در فضای جستجو جاری می‌شوند. تغییر مکان ذرات در فضای جستجو تحت تأثیر تجربه و دانش خودشان و همسایگانشان است؛ بنابراین موقعیت دیگر توده ذرات روی چگونگی جستجوی یک ذره اثر می‌گذارد. نتیجهٔ مدل‌سازی این رفتار اجتماعی فرایند جستجویی است که ذرات به سمت نواحی موفق میل می‌کنند. ذرات از یکدیگر می‌آموزند و بر مبنای دانش بدست آمده به سمت بهترین همسایگان خود می‌روند اساس کار PSO بر این اصل استوار است که در هر لحظه هر ذره مکان خود را در فضای جستجو با توجه به بهترین مکانی که تاکنون در آن قرار گرفته‌است و بهترین مکانی که در کل همسایگی‌اش وجود دارد، تنظیم می‌کند.

راه حل یک مسأله یک فرد در نظر گرفته می‌شود، یک انسانی که بال دارد و می‌تواند پرواز کند. یک انسان بال‌دار که در فضای مسئله، فضایی که در آن کلی راه‌حل وجود دارد از راه‌حل خوب خوب هست تا راه‌حل بد بد می‌تواند پرواز کند.^[۱]

هوش جمعی[ویرایش]

هوش جمعی خاصیتی است سیستماتیک که در این سیستم، عامل‌ها به‌طور محلی با هم همکاری می‌نمایند و رفتار جمعی تمام عامل‌ها باعث یک همگرایی در نقطهای نزدیک به جواب بهینه سراسری می‌شود نقطه قوت این الگوریتم‌ها عدم نیاز آن‌ها به یک کنترل سراسری می‌باشد. هر ذره) عامل) در این الگوریتم‌ها خود مختاری نسبی دارد که می‌تواند در سراسر فضای جواب‌ها حرکت کند و می‌بایست با سایر ذرات (عامل‌ها) همکاری داشته باشد. دو الگوریتم مشهور هوش جمعی، بهینه‌سازی لانه مورچگان و بهینه‌سازی توده ذرات می‌باشند. از هر دو این الگوریتم‌ها می‌توان برای تعلیم شبکه‌های عصبی بهره برد ^[۲].

اولین الگوریتم ازدحام ذرات[ویرایش]

در سال ۱۹۹۵ ابرهارت و کندی برای اولین بار PSO به عنوان یک روش جستجوی غیر قطعی برای بهینه‌سازی تابعی مطرح گشت این الگوریتم از حرکت دسته جمعی پرندگانی که به دنبال غذا می‌باشند، الهام گرفته شده‌است. گروهی از پرندگان در فضایی به صورت تصادفی دنبال غذا می‌گردند. تنها یک تکه غذا در فضای مورد جستجو وجود دارد. هر راه حل که به آن یک ذره گفته می‌شود، PSO در الگوریتم معادل یک پرنده در الگوریتم حرکت جمعی پرندگان می‌باشد. هر ذره یک مقدار شایستگی دارد که توسط یک تابع شایستگی محاسبه می‌شود. هر چه ذره در فضای جستجو به هدف (غذا در مدل حرکت پرندگان) نزدیکتر باشد، شایستگی بیشتری دارد. همچنین هر ذره دارای یک سرعت است که هدایت حرکت ذره را بر عهده دارد. هر ذره با دنبال کردن ذرات بهینه در حالت فعلی، به حرکت خود در فضای مسئله ادامه می‌دهد.

به ا ین شکل است که گروهٔ از ذرات در آغاز کار به صورت تصادفی به وجود می‌آیند و با به روز کردن نسل‌ها سعی در یافتن راه‌حل بهینه می‌نمایند. در هر گام، هر ذره با استفاده از دو بهترین مقدار به روز می‌شود. اولین مورد، بهترین موقعیتی است که تاکنون ذره موفق به رسیدن به آن شده‌است. موقعیت مذکور شناخته و نگهداری می‌شود که این بهترین مقدار نوستالژی آن ذره نیز گفته می‌شود که آن را با pbest نمایش می‌دهیم. بهترین مقدار دیگری که توسط الگوریتم مورد استفاده قرار می‌گیرد، بهترین موقعیتی است که تاکنون توسط جمعیت ذرات بدست آمده‌است که آن را gbest می‌گوییم (هوش جمعی).

پس از یافتن بهترین مقادیر، سرعت و مکان هر ذره با استفاده از رابطه ۶ و ۷به روز می‌شود.

رابطه 6 $v(t+1)=v(t)+c1*rand(t)*(pbest(t)-position(t)+c2*rand(t)*(gbest(t)-position(t))$

رابطه 7 $position(t+1)=position(t)+v(t+1)$ سمت راست معادله ۶ از سه قسمت تشکیل شده‌است که قسمت اول، سرعت فعلی ذره است ( $v(t)$ ) و قسمت‌های دوم ( $c1*rand(t)*(pbest(t)-position(t))$ ) و سوم ( $c2*rand(t)*(gbest(t)-position(t))$ ) میزان تغییر سرعت ذره و جهت آن به سمت بهترین تجربه شخصی (نوستالژی) و بهترین تجربه گروه (هوش جمعی) را به عهده دارند. اگر قسمت اول را در این معادله در نظر نگیریم ( $v(t)$ )، آنگاه سرعت ذرات تنها با توجه به موقعیت فعلی و بهترین تجربه ذره و بهترین تجربه جمع تعیین می‌شود و عملاً تأثیر سرعت کنونی و لختی آن حذف می‌شود. به این ترتیب، بهترین ذره گروه، در جای خود ثابت می‌ماند و سایرین به سمت آن ذره حرکت می‌کنند. در واقع حرکت دسته جمعی ذرات بدون قسمت اول معادله ۶، پروسه ای خواهد بود که طی آن فضای جستجو به تدریج کوچک می‌شود و جستجویی محلی حول بهترین ذره شکل می‌گیرد. در مقابل اگر فقط قسمت اول معادله ۶ را در نظر بگیریم، ذرات راه عادی خود را می‌روند تا به دیواره محدوده برسند و به نوعی جستجویی سراسری را انجام می‌دهند. پارامترهای c1 و c2 (مقدار آن حدود ۲ است) میزان اهمیت و وزن هوش جمعی و نوستالژی را مشخص می‌کنند. پارامتر $rand(t)$

با صفر قرار دادن یا ندادن پارامترهای c1 و c2 سه حالت مختلف زیر به وجود می‌آید:

هیچ‌کدام از این دو پارامتر را صفر نگذاریم که می‌شود pso با لختی سرعت، هوش جمعی و نوستالژی.
وزن نوستالژی را صفر کنیم و فقط براساس هوش جمعی و لختی عمل کنیم.
وزن هوش جمعی را صفر کنیم و فقط براساس نوستالژی و لختی عمل کنیم.

برای مقداردهی اولیه توسط رابطه ۸ عمل می‌کنیم. سرعت اولیه نیز طبق ۹ صفر است.

رابطه 8 $x(0)=x_{min}+rand(x_{max}-x_{min})$

رابطه 9 $v(0)=0$

شبه کد الگوریتم PSO:

For each particle     Initialize particle End For Do For each particle     Calculate fitness value of the particle fp     /*updating particle’s best fitness value so far)*/     If fp is better than pBest     set current value as the new pBest End For /*updating population’s best fitness value so far)*/ Set gBest to the best fitness value of all particles For each particle     Calculate particle velocity according equation     Update particle position according equation End For While maximum iterations OR minimum error criteria is not attained

اما در مورد شرط توقف باید گفت که راه‌های زیر موجود است:

تعداد تکرار معین
رسیدن به یک شایستگی آستانه
یک تعداد تکرار که شایستگی تغییر نکند (مثلاً اگر بعد از ۱۰ تکرار شایستگی ثابت بود و بهتر نشد).
راه آخر بر اساس چگالی تجمیع اطراف نقطه بهینه است. به این صورت که می‌گوییم اگر ۸۰ درصد ذرات در فاصل‌های کمتر از ۲۰ درصد بیشترین فاصله نسبت به بهترین جواب قرار داشتند، الگوریتم باید متوقف شود.

روش آخر به این صورت است که طبق رابطه ۱۰ می‌توان را بدست آورد. همان‌طور که گفته شد $R_{norm}$ یک مقدار بین ۰ و ۱ است و همین‌طور F بیشترین فاصله بین دو ذره در حالت کنونی است.

رابطه 10 $R_{norm}=\left({\frac {R_{max}}{F}}\right)$

مشکل اساسی اولین الگوریتم ازدحام ذرات[ویرایش]

یک مشکل اساسی فرمول ارائه شده برای الگوریتم ازدحام ذرات اولیه اینست که دائماً سرعت افزایش می‌یابد و هیچ برنامه‌ای برای کاهش آن ارائه نشده‌است، درصورتیکه لازم است هر چه به بهینه سراسری نزدیک می‌شویم سرعت کمتر شود تا ذره ما از بهینه سراسری عبور نکند.

برای این کار چند راه حل ارائه شده‌است.

استفاده از سرعت بیشینه برشی[ویرایش]

در این روش برای جلوگیری از زیاد شدن بیش از اندازه سرعت، یک سرعت بیشینه تعریف می‌شود تا هرگاه سرعت به بیش از آن رسید برش داده شود.

$v\prime (t+1)={\begin{cases}v(t+1)&v(t+1)<v_{max}\\v_{max}&v(t+1)>=v_{max}\end{cases}}$

استفاده از سرعت بیشینه تانژانت هایپربولیکی[ویرایش]

در این روش از یک تابع تانژانت هیپربولیک برای محدود کردن سرعت به یک مقدار خاص استفاده می‌شود. تفاوت این حالت با حالت برشی اینست که در این حالت تابع ما مشتق پذیر در همهٔ نقاط است درحالیکه در حالت برشی مشتق پذیری از بین می‌رود.

$v\prime _{ij}(t+1)=tanh({\frac {v_{ij}(t+1)}{v_{maxj}}})v_{maxj}(t)$

در حالت برشی در نقطه برش مشتق پذیری از بین می‌رود؛ ولی در تانژانت هیپربولیک این مشکل وجود ندارد.

استفاده از ضریب کاهنده سرعت[ویرایش]

در این روش از یک ضریب که باید بین ۰ و ۱ باشد، استفاده می‌شود. در غیر این صورت اگر بیش از ۱ باشد، سرعت افزاینده خواهد بود.

۱۴

حال تعیین کردن خود این یک مسئله است که روش‌های متعددی برای آن وجود دارد.

روش اول:

۱۵

روش دوم:

۱۶

در این روش باید را طوری تعیین کنیم که کمتر از ۱ شود.

روش سوم:

۱۷

برای می‌توان ۰٫۹ را انتخاب کرد و برای مقدار ۰٫۲ مناسب است.

روش چهارم:

در این روش براساس مقدار شایستگی تغییر می‌کند که این روش مناسب تری از روش‌های بالا است.

۱۸
۱۹

که شایستگی راه‌حل بهینه سراسری است.

روش پنجم:

در این روش که جدیدترین روش است یک پارامتر X خی که در کل سرعت ضرب می‌شود.

۲۰
۲۱	+ ,
۲۲	; k ∈[۰٬۱]

استفاده از تابعی برحسب تکرار برای سرعت بیشینه[ویرایش]

در این روش سعی می‌شود تا از یک سرعت بیشینه به صورت تابعی از تکرار استفاده شود. در این روش سرعت بیشینه طبق رابطه ۱۳ برای هر بعد جداگانه حساب می‌شود.

[null 13]

این قابلیت باعث می‌شود که سرعت بیشینه با توجه به نیاز ما برای تنظیم وزن کاوش و انتفاع در هر تکرار مربوطه تعیین شود.

الگوریتم ازدحام ذرات آسنکرون[ویرایش]

الگوریتم ازدحام ذرات گفته شده نوع سنکرون بود، یک نوع دیگری از این الگوریتم وجود دارد که به آن آسنکرون گویند. در این حالت پس از محاسبه شایستگی هریک از ذرات اگر بهینه سراسری عوض شد بلافاصله به‌روزرسانی می‌شود. این کار باعث می‌شود که سرعت همگرایی تا حدودی افزایش یابد؛ ولی امکان پیاده‌سازی موازی را می‌گیرد.

الگوریتم ازدحام ذرات تمام آگاه[ویرایش]

ذرات با اطلاع هم و با هماهنگی حرکت می‌کنند و یک ذره حرکت بقیه را نیز در حرکت خودش دخالت می‌دهد.

۲۳

که یک عدد تصادفی است که به هر سرعت ذره یک‌وزن می‌دهد. در این حالت طبق رابطه هر ذره کاملاً کورکورانه بردار حرکت سایر ذرات را مد نظر قرار می‌دهد و با گرفتن برآیندی از جهت و اندازه حرکت همه، جهت و اندازه خود را بدست می‌آورد.

الگوریتم ازدحام ذرات استخوان خالی[ویرایش]

این الگوریتم نسبت به الگوریتم‌های قبلی خیلی سریع تر همگرا می‌شود و دارای دو نسخه است که در نسخه اول سرعت به شیوه زیر محاسبه می‌شود.

نسخه اول:

۲۴
۲۵
۲۶

نسخه دوم:

در این حالت در نیمی از حالات از روش استخوان خالی و در نیمی از الگوریتم ازدحام ذرات معمول استفاده می‌شود.

۲۷

الگوریتم ازدحام ذرات پیش کشیدن و پس زدن[ویرایش]

در این الگوریتم ذره به سمت بهینه سراسری جذب می‌شود وقتی که به مقدار آستانه اول برسد، دفع می‌شود تا به جستجوی بیشتری بپردازد و این دفع شدن تا جایی ادامه پیدا می‌کند که به آستانه دوم برسد. عملیات جذب شدن با فرمول ۳۲ ولی دفع شدن با فرمول ۳۳ صورت می‌گیرد.

[null 32]
[null 33]

الگوریتم ازدحام ذرات شکار و شکارچی[ویرایش]

هنگامی که ذرات همگرا شوند یک پارامتر ترس اعمال می‌کنیم با احتمال که باعث دور شدن ذرات از بهینه سراسری می‌شود و در نتیجه جستجو بیشتر می‌شود.

۳۴
۳۵

الگوریتم ازدحام ذرات چندشروعه[ویرایش]

در این روش عملاً یک ذره را جهش می‌دهیم. برای وقتی است که مقدار شایستگی در چند تکرار بهبودی ندارد.

جمع‌بندی[ویرایش]

الگوریتم ازدحام ذرات دودویی[ویرایش]

این یکی از الگوریتم‌هایی است که برای مسائل جایگذاری یا عدم جایگذاری استفاده می‌شود. برای این کار باید از یک نگاشت برای تبدیل از پیوسته به دودویی استفاده شود.

۳۶
۳۷

الگوریتم ازدحام ذرات جایگشتی[ویرایش]

برای مطالعه بیشتر[ویرایش]

الگوریتم پرندگان یا اجتماع ذرات چیست؟

پیوند به بیرون[ویرایش]

↑ «ویدیو آموزش الگوریتم بهینه‌سازی ازدحام ذرات». حسگر. ۲۰۲۲-۰۱-۲۱. بایگانی‌شده از اصلی در ۸ فوریه ۲۰۲۲. دریافت‌شده در ۲۰۲۲-۰۲-۰۸.
↑ Khademi Nori, Milad; Yun, Sangseok; Kim, Il-Min (23 May 2021). "Fast Federated Learning by Balancing Communication Trade-Offs". arXiv:2105.11028 [cs.LG].

[1] «ویدیو آموزش الگوریتم بهینه‌سازی ازدحام ذرات». حسگر. ۲۰۲۲-۰۱-۲۱. بایگانی‌شده از اصلی در ۸ فوریه ۲۰۲۲. دریافت‌شده در ۲۰۲۲-۰۲-۰۸.

[FFL-2021-2] Khademi Nori, Milad; Yun, Sangseok; Kim, Il-Min (23 May 2021). "Fast Federated Learning by Balancing Communication Trade-Offs". arXiv:2105.11028 [cs.LG].

[۱]

[۲]

ن ب و سامانه‌های پیچیده
پیش زمینه	برآمدگی (فلسفه علم) خودسازمان‌دهی
رفتار جمعی	Social dynamics اطلاعات اشتراکی Collective action آگاهی جمعی Self-organized criticality تفکر گله‌ای گذار فاز مدلسازی عامل بنیان همگام‌سازی الگوریتم کلونی مورچگان روش بهینه‌سازی ازدحام ذرات رفتار ازدحامی
فرگشت و سازگاری (زیست‌شناسی)	شبکه عصبی مصنوعی رایانش فرگشتی الگوریتم ژنتیک برنامه‌نویسی ژنتیک حیات مصنوعی یادگیری ماشین Evolutionary developmental biology هوش مصنوعی Evolutionary robotics فرگشت‌پذیری
نظریه بازی‌ها	دوراهی زندانی نظریه انتخاب عقلایی عقلانیت محدود Irrational behaviour نظریه بازی تکاملی
علم شبکه	Social network analysis شبکه جهان‌کوچک Community identification مرکزیت Motifs نظریه گراف مقیاس‌پذیری Robustness زیست‌شناسی دستگاه‌ها Dynamic networks سامانه‌های سازگار پیچیده
سامانه غیرخطی	سری زمانی معادله دیفرانسیل معمولی Iterative maps فضای فاز جاذب Stability analysis پویایی‌شناسی جمعیت نظریه آشوب Multistability نظریه انشعاب Coupled map lattices
تشکیل الگو	Spatial fractals Reaction-diffusion systems معادله دیفرانسیل با مشتقات جزئی Dissipative structures پرانشت اتوماتای سلولی Spatial ecology خودجایگزین‌گری Spatial evolutionary biology ژئومورفولوژی
نظریه سامانه‌ها	هم‌ایستایی Operationalization بازخورد خودارجاعی Goal-oriented پویایی‌شناسی سامانه‌ها Sensemaking آنتروپی سایبرنتیک خودنوگری نظریه اطلاعات نظریه محاسبات Complexity measurement