قوانین انطباق
قوانین انطباق از مهمترین اجزای یک الگوریتم انتخاب منفی هستند. در نمایش دودویی، قوانین انطباق متعددی معرفی شده اند مانند: rcb[155]، r-chunks و فاصله همینگ. در نمایش حقیقی فاصله اقلیدسی به عنوان قانون انطباق استفاده می شود. انطباق به این معناست که فاصله یک نقطه داده با یک شناساگر در یک مقدار آستانه[۱۵۶] معین قرار می گیرد. گونزالس[۱۵۷] و همکاران(۲۰۰۳)، قانون انطباق را برای RNSA بر پایه فاصله اقلیدسی ارائه کرد. در این قانون انطباق، اگر فاصله اقلیدسی کمتر از حد آستانه (که شعاع نرمال یا شعاع شناساگر است) باشد به این معناست که دو بردار بر هم انطباق پیدا کرده اند. (ون[۱۵۸] و همکاران ، ۲۰۱۱) نشان داد در فضاهای دارای ابعاد بالا فاصله اقلیدسی مناسب نیست و تمیز دادن بین فضای نرمال و غیر نرمال دشوارتر می شود. به همین سبب فاصله ترتیبی کسری[۱۵۹] را برای محاسبه درجه انطباق بین بردارهای حقیقی ارائه کرد.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
درالگوریتم انتخاب منفی مورد نظر در این پژوهش، نمایش حقیقی و در نتیجه قانون انطباق، فاصله اقلیدسی میباشد. حال با افزودن روشهایی دیگر به الگوریتم انتخاب منفی اصلی، سعی در بهبود کارایی آن داریم. در ادامه به معرفی این روشها می پردازیم.
۴-۱-۱- شناساگر با شعاع متغیر
جی آی و داسکوپتا (۲۰۰۴)، الگوریتم انتخاب منفی با قابلیت تولید شناساگرها با شعاع متغیر با نام
V-detector را ارائه دادند که در آن به طور خودکار شعاع شناساگر بر اساس نزدیکترین همسایه نرمال آن محاسبه شده و به این ترتیب شناساگرها سایز ثابت نداشته و با اندازه های مختلف تولید می شوند. مزایای V-detector نسبت به RNSA با شعاع شناساگر ثابت به قرار زیراست :
به دلیل استفاده از شناساگرهای بزرگتر ، تعداد شناساگرها کمتر شده و زمان تولید شناساگرها و نیز زمان کشف نمونه غیر نرمال کاهش می یابد. همچنین فضای ذخیره سازی کمتری نیاز است.
پوشش حفرهها بهبود می یابد و تعداد حفرهها کمتر می شود. شناساگرهای بزرگتر فضای غیرنرمال وسیع تر را پوشش می دهند و شناساگرهای کوچکتر برای پوشش دهی نواحی حفرهها مورد استفاده قرار می گیرند.
مزیت دیگر این روش نسبت به سایر روشها این است که مقدار پوشش مورد نیاز را به طور خودکار در هنگام تولید شناساگرها تخمین می زند که پوشش تخمین شده [۱۶۰] نام دارد.
الف: شناساگرها با سایز ثابت ب: شناساگرها با سایزهای مختلف
شکل ۴-۲- مفهوم اصلی انتخاب منفی و V-detector(جی آی و داسکوپتا ، ۲۰۰۴).
۴-۱-۲- نمونههای خودی با شعاع متغیر
چنانچه گفته شد، به طور کلی الگوریتم انتخاب منفی شامل دو فاز است : فاز آموزش و فاز تشخیص. در فاز آموزش مشخصات نمونههای خودی (نرمال) سیستم تعریف شده و سپس شناساگرهای کاندید به طور تصادفی تولید میشوند. چنانچه هر یک از شناساگرهای تصادفی درون منطقه نرمال قرار بگیرد حذف میشوند. در فاز تشخیص شناساگرهای معتبر ایجاد شده در فاز آموزش برای تشخیص نمونه های ورودی غیر نرمال به کار گرفته می شوند. برای تولید شناساگرهای با کیفیت نیازمند تعداد زیادی نمونههای خودی هستیم تا شناساگرها را با آنها آموزش دهیم. ولی در بسیاری ازکاربردهای حقیقی، در نظر گرفتن تمام نمونههای خودی پیاده سازی را با مشکل مواجه می کند. به منظور ایجاد و آموزش شناساگرها، ناگزیر به استفاده از تنها بخشی از نمونههای خودی برای ایجاد مشخصاتی از سیستم که نشاندهنده رفتارهای عادی است، میباشیم. در الگوریتم انتخاب منفی مقدار حقیقی[۱۶۱] شعاع نمونههای خودی به این منظور معرفی میشود تا به سایر عناصر اجازه دهد تا اجزایی را که در فاصله نزدیکی به اندازه شعاع مدنظر نمونه خودی از مرکز نمونه خودی[۱۶۲] است را به عنوان داده خودی در نظر گرفته که نشاندهنده تنوعهای مجاز از دادههای خودی است. به عبارتی عناصری که در محدوده شعاع داده خودی قرار دارد به عنوان داده خودی در نظر گرفته میشود. در شکل ۴-۳ ایجاد مشخصه سیستم بر روی بخشی از نمونه های خودی در یک فضای دو بعدی نشان داده شده است (زنگ[۱۶۳] و همکاران ، ۲۰۰۹).
همانطور که در شکل ۴-۳ مشاهده می کنید ، شعاع خودی بسیار کوچک است. بنابر این نمونههای خودی قادر نیستند ناحیه خودی را به طور کامل پوشش دهند و نرخ بالایی از مثبت غلط[۱۶۴] رخ داده است. برای پوشش کامل ناحیه خودی و کاهش نرخ مثبت خطا تعداد بسیار زیادی نمونه خودی نیاز است. ولی افزایش تعداد نمونه های خودی موجب بالا رفتن هزینه آموزش می شود.
شکل ۴-۳- ایجاد مشخصه سیستم با بهره گرفتن از نمونه های خودی با شعاع کوچک(زنگ و همکاران ، ۲۰۰۹).
راه حل دیگری که به ذهن می رسد این است که به جای افزایش تعداد نمونههای خودی، بهتر است شعاع نمونههای خودی بزرگ باشند. این اتفاق در شکل ۴-۴ نشان داده شده است. همان طور که مشاهده می کنید شعاع خودی بسیار بزرگ در نظر گرفته شده است. بخشی از نمونههای خودی ناحیه غیرخودی را پوشانده اند که باعث ایجاد خطای منفی غلط [۱۶۵] شده است .
شکل ۴-۴- ایجاد مشخصه سیستم با بهره گرفتن از نمونه های خودی با شعاع بزرگ(زنگ و همکاران ، ۲۰۰۹).
در بسیاری از الگوریتمهای انتخاب منفی، شعاع نمونههای خودی ثابت در نظر گرفته شده است ولی همانطور که گفته شد این روش نمیتواند مشخصات مناسبی از سیستم را ارائه دهد. شکل ۴-۵ نشان میدهد که تعریف شعاع خودی متغیر میتواند پوشش خوبی از ناحیه خودی را فراهم کند و نیز مشخصات سیستم را به خوبی بیان کند. به وسیله ایجاد مشخصه سیستم به این روش، میتوان شناساگرهای بهتری ایجاد کرد و آزمایشات نشان میدهد که شناساگرهای تولید شده با این روش نرخ تشخیص[۱۶۶] بالا و نرخ هشدار غلط[۱۶۷] پایینی دارند(زنگ و همکاران ، ۲۰۰۹).
شکل ۴-۵- نمونه های خودی با شعاع متغیر(زنگ و همکاران ، ۲۰۰۹).
۴-۱-۳- مکانیسم سرکوب ایمنی [۱۶۸]
در فاز آموزش الگوریتم انتخاب منفی، شناساگرها تولید می شوند و در فاز تشخیص، شناساگرهای تولید شده در جهت کشف آنومالی مورد استفاده قرار می گیرند. از آنجا که شناساگرهای تولید شده در فاز آموزش توسط نمونههای داده ای نرمال آموزش دیده اند و شناساگرهای غیر نرمال انتخاب شده اند، حال در فاز کشف، هر نمونه داده جدید که با این شناساگرهای غیرنرمال مقایسه می شود، اگر با هریک از آنها تطابق یافت به معنای این است که یک نمونه داده غیرنرمال است.
۴-۱-۳-۱- مشکلات الگوریتم انتخاب منفی (NSA)
هنگام استفاده ازNSA شاهد این هستیم که مثبت غلط[۱۶۹] و به طور کلی هشدار غلط[۱۷۰] در نواحی مرزی بین منطقه نرمال و منطقه غیر نرمال اتفاق می افتد. بنابراین برای ارتقای بهره وری مکانیسم تشخیص در این الگوریتم، ایجاد پوشش موثر در نواحی مرزی از اهمیت زیادی برخوردار است. دو مشکل اساسی در الگوریتم های NS همیشه به چشم می خورد. یکی مسئله حفرههای پوشش داده نشده در نقاط مرزی است و دیگری شناساگرهای نا معتبر بسیاری که قادر به کشف آنومالی نیستند. این شناساگرهای نامعتبر در نواحی مرزی ایجاد می شوند.
شکل ۴-۶- نمایش شناساگرهای نا معتبر در مرز ناحیه خودی و غیر خودی
برای حل مسئله حفرهها ، هافمیر[۱۷۱]و همکاران (۲۰۰۳)، یک روش با نام ماسک جایگشتی[۱۷۲] ارائه داد. همچنین بالدروپ[۱۷۳] و همکاران(۲۰۰۲) ، قاعده تطبیق r-chunks را برای NSA در سیستم دودویی ارائه کرد. جی آی[۱۷۴] و همکاران (۲۰۰۴)، یک الگوریتم V-detector مرز آگاه[۱۷۵] معرفی کرد و بلاچندران[۱۷۶] و همکاران(۲۰۰۷)، یک NSA با شناساگرهایی با اشکال مختلف توسط نمایش حقیقی تعریف کرد. اگرچه این راه حلها برخی از حفرهها را کاهش داده اند ولی مشکل حفرهها همچنان وجود دارد. در حقیقت مسئله حفرهها ارتباط مستقیم دارد با مسئله تولید تعداد زیادی شناساگر نامعتبر. در واقع اگر بخواهیم حفره ها را کاملا پوشش دهیم، نیازمند تولید شناساگرهای نامعتبر بسیاری هستیم .
همان طور که در فصل دو عملکرد سیستم ایمنی بدن انسان شرح داده شد، سلول های T وظیفه شناسایی عوامل مخرب در بدن را دارند. ولی سلول های T فقط شامل سلول های Th [۱۷۷] نیستند بلکه شامل سلول های سرکوب گری به نام Ts [۱۷۸] نیز میباشند که در فرایند کشف عوامل مخرب موثرند. در حقیقت در یک بدن سالم هر دو گروه سلول های Th و Ts در جهت حفظ سلامت بدن با هم همکاری می کنند. الگوریتم های انتخاب منفی ارائه شده تنها از سلول های Th استفاده می کنند و از سلول های Ts غافل هستند. در حالی که بهکار گیری این سلولها تأثیر بسیار مطلوبی در کارایی فاز کشف، و در نتیجه موجب بالارفتن بهره وری الگوریتم NS می شود (یانگلی[۱۷۹] و همکاران ، ۲۰۰۹). در این روش، داده های نرمال یا همان نمونه های خودی مورد آزمایش، به دو دسته تقسیم می شوند : نمونه های نرمال مرزی[۱۸۰] و نمونه های نرمال غیر مرزی[۱۸۱]. نمونههای نرمال مرزی در طول فاز آموزش شناسایی و نگهداری می شوند. در فاز کشف شناساگرهای تولید شده به عنوان سلولهای Th کار کشف را انجام می دهند و نمونه های نرمال مرزی به عنوان سلول های Ts برای سرکوب کردن سلول هایT غیر فعال وارد عمل میشوند. بنابراین شناساگرهای کمتری برای پوشش فضای غیرنرمال می توانند مورد استفاده قرار گیرند و نیز تعداد حفره ها کاهش می یابد.
در روش پیشنهاد شده در این پژوهش، هدف بهبود الگوریتم انتخاب منفی با تلفیق روش استفاده از نمونههای خودی مرزی در فاز تشخیص خطا به عنوان سلولهای ایمنی سرکوبگر و همچنین استفاده از تابعی برای تعیین شعاع متغیر برای نمونههای خودی (علاوه بر شعاع متغیری که برای شناسگرهای ناحیه غیر خودی مطرح است) در مرحله آموزش است.
با بهره گرفتن از شعاع متغیر برای نمونههای خودی، میتوان مشخصات[۱۸۲] مناسبی از سیستم به دست آورد و سپس با بهره گرفتن از مشخصات بدست آمده از سیستم، شناسگرهای باکیفیتتری برای پوشش ناحیه غیر خودی ایجاد کرد. با استفاده همزمان از شعاع متغیر برای نمونههای خودی میتوان با تعداد کمتری شناساگر ناحیه غیر خودی را پوشش داد. رویکرد جدید باعث بهبود عملکرد کلی شناسگرها بدون افزایش در پیچیدگی میشود.
با تلفیق روش های ذکر شده در بالا، در این فصل یک راهکار پیشنهادی در جهت بهبود تشخیص نفوذ به وسیله الگوریتم انتخاب منفی ارائه گردیده است که در ادامه به بررسی جزئیات آن می پردازیم .
۴-۲- راهکار پیشنهادی
الگوریتم انتخاب منفی یکی از موفقترین روشها در سیستم ایمنی مصنوعی می باشد. کاربردهای معمول آن شامل کشف تغییرات، کشف خطا و نیز کشف نفوذ در شبکه هاست. در این بخش یک الگوریتم انتخاب منفی بهبود یافته در جهت کاهش حفرهها و نیز کاهش تعداد شناساگرهای موردنیاز برای پوشش فضای غیرخودی و در نتیجه بهبود عملکرد الگوریتم انتخاب منفی ارائه می گردد. راهکار پیشنهاد شده تلفیقی است از الگوریتمهای تولید شناساگر با شعاع متغیر، تعریف نمونههای خودی با شعاع متغیر در فاز آموزش و نیز به کارگیری مکانیسم سرکوب ایمنی[۱۸۳] با بهره گرفتن از نمونههای خودی مرزی به عنوان سلولهای ایمنی سرکوبگر، در جهت بهبود در فاز تشخیص الگوریتم جدید.
۴-۲-۱- فاز آموزش
همانطور که در شکل ۴-۱ فاز آموزش الگوریتم انتخاب منفی نشان داده شده است، این فاز پس از تعریف مشخصات سیستم توسط نمونه های خودی، شامل تولید شناساگرهای کاندید وآموزش آنها به وسیله مجموعه داده های نرمال می باشد. حال برای بهبود الگوریتم و ارائه راهکار جدید، نیازمند تغییراتی در فاز آموزش الگوریتم انتخاب منفی اصلی هستیم که در ادامه به آن می پردازیم .
۴-۲-۱-۱- تعیین شعاع متغیر برای نمونههای خودی
در بیشتر الگوریتمهای انتخاب منفی شعاع نمونههای خودی ثابت در نظر گرفته می شود ولی همان طور که قبلا شرح داده شد، شعاع خودی متغیر میتواند پوشش مناسبتری از ناحیه خودی را ممکن سازد و مشخصات سیستم را به خوبی بیان کند. براساس این مشخصه سیستم، میتوان شناساگرهای با کیفیت بالاتری ایجاد کرد و آزمایشات نشان میدهد که شناسگرهای تولید شده با این روش نرخ تشخیص[۱۸۴] بالا و نرخ هشدار غلط[۱۸۵] پایینی دارد.
روش ارائه شده برای تولید نمونه های خودی با شعاع متغیر در شکل ۴-۷ آمده است(زنگ[۱۸۶] و همکاران ، ۲۰۱۳). فاصله میان مجموعه نمونههای خودی را محاسبه نموده و مقدار متغیری برای شعاع خودی براساس مجموع فاصله هر نمونه تا سایر نمونههای خودی اختصاص میدهد.
Algorithm (S, n) Input: S = the set of self samples, n = the self radius coefficient |