پایان نامه با کلید واژگان ورودي، بندي، FAM، يادگيري

ديگر داراي پيكر بندي ثابتي هستند. براي مثال در شبكه MLP تعداد لايه هاي مخفي و نودهاي آنها بايد ابتدا برآورد شوند از اين رو كه درطي فرايند آموزش قابل تغيير نمي باشند. بنابراين اگرتعداد نودهاي مخفي شبكه كمتر يا بيشتر از تعداد مورد نياز مسئله باشد. دو نوع مشكل اساسي در شبكه رخ مي نمايد. درصورت كم بودن گره ها شبكه قادر به ارايه تقريب مناسبي از پيچيدگي فضاي الگوها نيست24. اگر تعداد گره هاي مياني بيش از حد زياد باشد، به قدري دقيق فضاي مشخصه ها فراگيري شده و شبكه به آن منطبق مي شود كه قابليت تعميم دهي شبكه و با بالتبع آن، درصد صحت كلاسه بندي، بر روي داده ها آزمايش، به شدت كاهش مي يابد25. در هر دو مورد ذكر شده كارايي شبكه بهينه نمي باشد. لذا استفاده از FAM، به سبب انعطاف پذيري ذاتي آن، كه در اكثر شبكه‌هاي عصبي ديگر موجود نيست، كار طراحي را بسيار ساده مي كند. به صورتي كه ديگر به آزمايشهاي فراوان اوليه براي تخمين پارامترهاي مناسب شبكه، نيازي نيست. مزيت ديگر اين شبكه، عدم وابستگي طراحي آن به ريزه كاري هاي فراوان وتنظيم پارامترهاي زياد و پيچيده است. همچنين بازه هاي زماني كوچك براي آموزش و همگرايي سريع از مزاياي ديگر FAM مي باشد. [7،6،4]
كارآيي FAM و ديگر گونه هاي منشعب از آن در بسياري ازمسايل كلاسه بندي، به عنوان سيستم هاي يادگيري دقيق و سريع به اثبات رسيده است، از جمله مي توان به بازشناسي خودكار هدف براساس پروفايل برد را دار [8]، باز شناسي واكه هاي صوتي مستقل از گوينده [9]، بازشناسي دستخت بلا درنگ [10]، بازشناسي سيگنال هاي QRS [11]، تشخيص انواع سرطانهاي سينه و بيماري هاي قلبي [12]، يادگيري وتشخيص ابعاد اشياء سه بعدي از روي سري تصاوير دو بعدي آنها [13]، كلاسه بندي سيگنالهاي نويزي [14] تشخيص فرد الكلي از غير الكلي [15]، تشخيص ناهنجاري هاي ژنتيكي [16]، كه اخيراً بسيار مورد توجه قرار گرفته است، و بسياري موارد ديگر [23،22،21،20،19،18،17] ، اشاره كرد.
مهمترين نقص FAM مربوط به حساسيت آن به هم پوشاني 26 بين خوشه هاي ايجاد شده است. طبيعت خود سامانده بودن آموزش در اين شبكه باعث مي شود كه عليرغم پيوستگي يادگيري نمونه هاي جديد، در مورد نمونه هاي نويزي مشكل ايجاد شود و آنها به اشتباه، خوشة جديد و منحصر به فردي را به خود نسبت دهند از اين حساسيت كه منجر به ايجاد خوشه ها (نودهاي) بيش از حد مورد نياز مي شود. تحت عنوان پديدة تكثير بي روية خوشه ها27 ياد مي شود. افزايش حافظه مورد نياز و پيچيدگي شبكه، بار محاسباتي اضافه و در نتيجه كاهش قابل ملاحظه صحت كلاسه بندي از عواقب رخ نمودن اين پديده مي باشد. [29، 28 و 27 و 26و 25و 24و 16و 9و 7]. افزايش صحت كلاسه بندي و كاهش پيچيدگي و تعداد نودهاي شبكه FAM در سالهاي اخير توجه اكثر محققان را جلب كرده و بيشترين مطالعات بر روي اين موارد متمركز بوده است.
در اين فصل ابتدا با مقدمات و الگوريتم Fuzzy ART و ARTMAP Fuzzy آشنا مي شويم (بخش 2-2). مدلهاي پيشرفته تر مبتني بر FAM كه در آنها ساختار و الگوريتم مدل پايه اصلاح شده و برخي چالشهاي آن در جهت بهبود كلاسه بندي، مرتفع شده است، در بخش بعدي مورد بررسي قرار خواهند گرفت. پيكربندي اين بخش بر اساس سير تكاملي مدلهايي است كه در جهت رفع يا بهبود پديده تكثير بي رويه خوشه ها و افزايش قابليت تعميم دهي28 شبكه FAM مي باشد.
در بخش انتهايي، مروري بر كاربرهاي موفق شبكه هاي عصبي از خانواده ARTMAP و واريته هاي آنها خواهيم داشت و در نهايت خلاصه فصل ارائه خواهد شد.
2-2- پيكربندي و الگوريتم شبكه ART MAP Fuzzy
شبكه عصبي FAM كه يادگيري در آن به صورت افزايشي و با ناظر مي باشد، از اتصال دو ماژول Fuzzy ART با نامهاي ARTa و ARTb پديد آمده است. اين دو ماژول توسط يك ماژول ميدان نگاشت29، كه نودها (كلاسترها) را از ARTa به ARTb، مرتبط مي سازد. به هم متصلند. هر ماژول Fuzzy ART قادر است، به صورت افزايشي و بي ناظر عمل خوشه بندي نمونه هاي m بعدي ورودي را در ناحيه هايي به شكل ابر مستطيلي در فضاي m بعدي مشخصه هاي ورودي، انجام دهد. [4 و 30] هر كدام از اين نواحي ابر مستطيلي، نماينده يك دسته يا خوشه مي باشند. هر خوشه يك نود شبكه را تشكيل مي دهد.
j امين خوشه با برداري از وزنها، نشان داده مي شود كه در ابتدا اين وزنها با 1 مقدار دهي اوليه مي شوند. و در طي فرآيند يادگيري كاهش يافته يا ثابت مي مانند. اين خود يكي از مواردي است كه ابداع كنندگان اين شبكه، به عنوان عامل تكثير بي رويه خوشه از آن ياد مي كنند،‌ چون طي آموزش، عناصر بردارهاي مشخصه ورودي، كه ها را تشكيل مي دهند،‌ فقط مي توانند كوچكتر شوند. يك ماژول FA هميشه به ايجاد نمونه هاي بيشتر و بيشتر تمايل دارد و اين بدان علت است كه ممكن است انطباق الگوهاي ورودي با مقادير بزرگتر، در حالي كه ها در طي يادگيري خيلي كوچك شده باشند. امكان پذير نباشد. از اين رفتار مي توان بانرمال سازي ورودي به يك طول ثابت اجتناب كرد. يك روش ممكن، استفاده از نرمال سازي اقليدسي است كه يك الگوي ورودي A را به ورودي كدگذاري شده I تبديل مي كند.

(2-1)
عيب اين روش، از دست دادن هر اطلاعاتي در مورد طول يك الگوي ورودي است. بنابراين جهت مقداردهي كردن همه الگوهاي ورودي به يك طول ثابت از يك نرمال سازي تغيير يافته كه كدگذاري مكمل30 ناميده مي شود، استفاده مي شود [4]. يك بردار اصلي ، به وسيله افزودن مكمل عناصرش به بردار اصلي، به يك الگوي كد مي شود. اين عمل بعد الگوهاي ورودي و نمونه ها را دو برابر مي كند.

(2-2)

نرم 31 در بردارهاي كدگذاري شده مكمل با بعد يكسان، مستقل از مقادير عناصرش، مقداري ثابت دارد.

(2-3)
خوشه بندي در FA در سه مرحله اساسي انجام مي شود: انتخاب دسته (choice) انطباق دسته يا آزمون مراقبت (match) و آموزش (Adaptation). در مرحله انتخاب دسته يا خوشه،‌تابع انتخاب براي ورودي حاضر I و تك تك هاي موجود كه هر يك نماينده يك نود يا خوشه هستند، محاسبه مي شود.
(2-4)
در اين جا عملگر AND فازي مي باشد، و نيز پارامتر انتخاب32 نام دارد و نماد ، معرف نرم مي باشد.
خوشه اي كه بيشترين مقدار را داشته باشد،‌خوشه منتخب خواهد بود و با نمايش داده مي شود.
هنگامي كه خوشه J انتخاب شد يك آزمون فرضي با نام آزمايش مراقبت33 صورت مي گيرد تا ميزان تطابق خوشه انتخاب شده، با ورودي I،‌مشخص شود. اگر خروجي تابع تطابق از مقدار پارامتر مراقبت بيشتر شد، خوشه انتخابي اصطلاحاً برنده شده است و يادگيري انجام مي شود.

(2-5)
در غير اين صورت،‌ خوشه انتخابي از ليست خوشه هاي قابل جستجو براي ورودي حاضر، خارج مي شود. در نتيجه يك دسته يا خوشه جديد كه تابع انتخاب را بيشينه كند (رابطه 2-4)، مجدداً انتخاب شده و اين پروسه آن قدر ادامه مي يابد تا رابطه 2-5، ارضا شود.

شكل 2-1: شماي كلي ماژول ART: ورودي تحت كدگذاري مكمل وارد مي شود
و نودهاي لايه F2 همان خوشه هاي شبكه هستند
انتخاب مقادير كوچك (نزديك به صفر) براي پارامتر مراقبت باعث افزايش قابليت تعميم دهي شبكه و ايجاد خوشه هاي بزرگتر با تعداد كمتر مي شود و بالعكس. در واقع پارامتر مراقبت تعيين كننده ميزان شباهت مورد نياز بين خوشه يا همان نود انتخابي و ورودي مي باشد كه در صورت محقق شدن اين ميزان از شباهت، آموزش صورت مي گيرد. اگر هيچكدام از نودهاي شبكه معيار مراقبت را ارضا نكنند، شبكه با ايجاد يك نود جديد براي آن ورودي،‌بدون آزمون مراقبت، يادگيري را انجام خواهد داد.
به هر صورت، آموزش با بروزرساني بردار وزن نود يا خوشه برنده (يا جديد) بر اساس رابطه ذيل صورت مي پذيرد.
(2-6)
كه در اين رابطه ، نرخ يادگيري مي باشد. اگر اختيار شود،‌ اصطلاحاً يادگيري سريع انجام مي شود. [4] (شبكه در مد يادگيري سريع است)

شكل 2-2- فلوچارت كلي ماژول ART

در مسئله طبقه بندي الگو، ورودي به بردارهاي مشخصه هاي ورودي و ورودي Ib به ، برچسب آن بردار مي باشد. لذا پارامتر، مراقبت ، با مقداردهي مي شود. در نتيجه هر برچسب يك كلاستر يا نود مخصوص به خود را خواهد داشت. ميدان نگاشت بين و ، ماتريسي از وزنها با نماد مي باشد كه خوشه هاي و را به هم مرتبط مي سازد. J امين سطر ماتريس بر نودهايي از دلالت داردكه در نتيجه برنده شدن خوشه يا نود J ام در ، فعال مي شوند. خروجي ميدان نگاشت بدين صورت خواهد بود:

(2-7)
كه در اين رابطه كه خروجي مي باشد، داراي مختصات بولين بدين شكل مي باشد.

(2-8)

مقدار خروجي است كه پيش بيني مي كند اگر نود J ام در برنده شود، كدام نود از K نود انتخاب مي شود.
حين اجراي فاز آموزش، آزمون مراقبتي مشابه آنچه در اتفاق مي افتد، در ميدان نگاشت هم انجام مي پذيرد تا حداقل مشابهت لازم بين خروجي و J امين سطر ماتريس ،‌ تاييد شود.

(2-9)
در پي ارضا شدن رابطه (2-9) اصطلاحاً روزنانس به وقوع پيوسته و آموزش انجام مي شود. اين آزمون، پيش بيني كلاس صحيح را به واسطه برچسبي كه k امين نود پيروز ، نماينده آن مي باشد، تضمين مي كند. در پي ارضانشدن اين رابطه فرآيند ره گيري تطابق34 فعال شده و شبكه به دنبال يافتن خوشه مناسب ديگري در خواهد بود. اين فرآيند بدين شكل صورت مي گيردكه ميدان نگاشت، را به شكل ذيل افزايش مي دهد.
(2-10)
لذا J امين خوشه ، در آزمون مراقبت مردود شده و از صحنه رقابت خوشه ها حذف مي شود. فرآيند جستجو بين نودهاي آغاز مي شود و تا زمانيكه خوشه مناسبي در پيدا شود، كه با نود صحيح در ارتباط يابد، ادامه مي يابد. در غير اين صورت يك خوشه جديد ايجاد خواهد شد. زماني كه خوشه مناسب پيدا شد. ارتباط وزني آن با نودهاي طبق رابطه ذيل به روز مي شود:
(2-11)
اين فرآيند زمان به وقوع پيوستن رزونانس در ميدان نگاشت صورت مي گيرد. در مورد يادگيري سريع، ارتباط J امين خوشه و K امين نود ، دايمي خواهد بود. به عبارت بهتر به ازاي تمام وروديها، خواهد شد. در فاز آزمايش شبكه، تنها فعال خواهد بود، لذا آزمون مراقبت در ميدان نگاشت انجام نخواهد شد و پيش بيني كلاس صحيح با توجه به وزنهاي ثابت مربوط به نود برنده در ميدان نگاشت انجام مي پذيرد.

شكل 2-3- پيكربندي كلي شبكه عصبي Fuzzy ART MAP

2-3- پيشرفت هاي اخير در زمينه شبكه هاي عصبي بر اساس FAM
پس از طرح الگوريتم و ساختار FAM در مجامع بين المللي و كنفرانس هاي علمي در سال 1992 ميلادي، پيشرفت و نوآوري در زمينه بهينه سازي الگوريتم و پيكربندي اين شبكه ها و واريته هاي آن به شكل روزافزوني گسترش يافت. اين پيشرفت ها را مي توان به دو دسته كلي تقسيم بندي نمود: يكي بهينه سازي ساختار و الگوريتم ابتدايي FAM و ديگري معرفي و بهبود الگوريتمهاي جديد بر پايه FAM. اين تقسيم بندي در واقع كمك مي كند تا بين موارد ذيل تميز ايجاد شود.
• متدهاي نوين آموزش و بهينه سازي FAM
• اصلاح و ساده سازي FAM
• بهينه
سازيهايي كه در آنها تغييرات ايجاد شده، اساساً‌ باعث تغيير ساختار كلي FAM نشده اند، از يك سو و از سوي ديگر تغييراتي كه بر پايه رويكردهاي نوين بنا شده اند.
با اين وجود، باز هم نمي توان در برخي موارد دقيقاً مرز بين اين دو حيطه را مشخص كرد.

2-3-1- اصلاحات و بهينه سازي FAM
متدهاي مختلف آموزش FAM نظير تك كراري35، كامل36 و آموزش همراه با مجموعه ارزيابي37 در [27 و 16] به تفصيل مورد بحث قرار گرفته اند. در روش تك تكراري همه الگوهاي آموزش به صورت يك دنباله و فقط يك بار به شبكه ارائه مي شوند در آموزش به روش آموزش كامل دنباله اي كه از همه الگوهاي يادگيري تشكيل شده به شبكه ارائه خواهد شد و آنقدر اين عمل تكرار مي شود تا شبكه بتواند همه داده هاي آموزش را درست طبقه بندي كند. يا اينكه در وزنهاي شبكه و تعداد نودهاي آن ديگر تغييري حاصل نشود. در آموزش همراه با مجموعه ارزيابي پس از هر تكرار آموزشي، صحت طبقه بندي با استفاده از يك مجموعه داده جداگانه، ارزيابي مي شود و اين فرآيند آنقدر تكرار مي شود تا ديگر بهبودي در درصد صحت كلاسه بندي مشاهده نشود. اين روش آموزش درمحافل علمي يادگيري ماشين، روشي معروف است كه با هدف كاهش جلوگيري از آموزش بيش از حد38 شبكه و همچنين افزايش قابليت تعميم دهي سيستم يادگيري، بناشده است [1]. لذا بر روش آموزش كامل كه تكرار هاي غير ضروري بسيار زيادي دارد و به همين دليل شبكه را مستعد ابتلا به انطباق بيش از حد با الگوها مي كند، برتري دارد. از طرف ديگر در مقالات علمي مرتبط، روش آموزش كامل، بيشتر مدنظر و مورد علاقه محققين بوده و به كرات در آزمايشات مورد استفاده واقع شده است [27، 16، 4].
اين سه روش آموزش، روي پايگاه هاي داده39 مصنوعي و طبيعي مورد آزمايش و مقايسه قرار گرفته اند [27،‌ 16]. در [27] صحت كلاسه بندي پس از ارائه هر 100 نمونه داده آموزشي، با يك مجموعه داده مجزا، مورد ارزيابي قرار گرفته شده است. در پايگاه هاي داده مصنوعي، اگر همپوشاني بين كلاسها متوسط يا بسيار زياد باشد، اين روش آموزش، صحت كلاسه بندي را به شكل فزاينده اي بالا خواهد برد، (درجه همپوشاني بين كلاسي در [27] توسط نويسنده مقاله معين شده است) و شبكه ايجاد شده به طور قابل ملاحظه اي كوچكتر (به دليل ايجاد تعداد نود يا خوشه كمتر) و ساده تر خواهد بود. در پايگاه هاي داده طبيعي، تفاوت قابل ملاحظه اي در صحت كلاسه بندي و تعداد نودهاي ايجاد شده در شبكه،‌ بين روش همراه با داده هاي ارزيابي و آموزش كامل وجود ندارد. درجه صحت طبقه بندي در روش همراه با داده هاي ارزيابي بيشتر از روش تك تكراري مي باشد اما در مقابل، پيچيدگي و اندازه شبكه (تعداد نودهاي آن) در روش اول بيشتر از روش دوم است.
يكي از روشهاي آموزشي نوين براي FAM،‌ استفاده از الگوريتم پرندگان40 ) [32]،‌ است كه يك الگوريتم تصادفي بر اساس جمعيت بوده و به دسته الگوريتم هاي تكاملي تعلق دارد. هر راه حلي در فضاي جستجو، يك ذره يا همان پرنده بوده وجمعيت پرندگان دسته ناميده م

دیدگاهتان را بنویسید