داده کاوی فرآیند کشف و تحلیل حجم بزرگی از دادهها با استفاده از روش های آماری و ریاضی میباشد. داده کاوی به معنای استفاده از ابزار تحلیل داده برای کشف ناشناخته ها، الگوهای معتبر و روابط مجموعه های بزرگ داده است. جهت پیش بینی در علم داده کاوی از تحلیل در داده های موجود جهت کشف دانش استفاده میکنیم. شکل ۱ این مطلب را نشان میدهد.
کشف دانش درداده کاوی
مسئله پیشگویی، شامل طبقه بندی داده میباشد. یکسری گروه(طبقه) از قبل تعیین شده موجود است و باید به نمونه ی جدید یک یا چند گروه را نسبت داده شود. جهت پیشگویی نیاز به مجموعه ی دادهای است که شامل تعدادی سطر و تعدادی ستون باشد و در یک ماتریس(صفحه گسترده) نمایش داده می شود. در کلاسبندی، یک ستون اضافه بنام کلاس به ماتریس اضافه میشود که شامل کلاس های صحیحی است که هر نمونه ی آموزشی[1] در مجموعه داده دارد. برچسب ها میتوانند از نوع صحیح/غلط و یا 0/1 و یا نام طبقه(گروه) باشند.
الگوریتم ژنتیکGA[1]، یک روش اماری و تکنیک جستجو در علم رایانه به منظور یافتن راهحل تقریبی برای بهینهسازی و مسایل جستجو است، الگوریتم ژنتیک نوع خاصی از الگوریتمهای تکاملی است که از تکنیکهای زیستشناسی مانند وراثت و جهش استفاده میکند. ویژگیهای خاص این الگوریتم باعث میشود. الگوریتمهای ژنتیک اغلب گزینه خوبی برای تکنیکهای پیشبینی هستند. مختصرا گفته میشود که الگوریتم ژنتیک یک تکنیک برنامهنویسی است که از تکامل ژنتیکی به عنوان یک الگوی حل مساله استفاده میکند. مسالهای که باید حل شود ورودی است و راهحلها طبق یک الگو کدگذاری میشوند و توسط تابعی که تابع fitness نام دارد، سنجیده میشود و این تابع هر راه حل کاندید را ارزیابی میکند که اکثر انها به صورت تصادفی انتخاب میشوند. به طور کلی، این الگوریتمها از بخشهای زیر تشکیل میشوند : تابع برازش – نمایش – انتخاب – تغییر.
قانون انتخاب طبیعی بدین صورت است که تنها گونههایی از یک جمعیت ادامه نسل میدهند که بهترین خصوصیات را داشته باشند و انهایی که این خصوصیات را نداشته باشند، به تدریج و در طی زمان از بین میروند. طبیعت با بهرهگیری از یک روش بسیار ساده (حذف تدریجی گونههای نامناسب و در عین حال تکثیر بالاتر گونههای بهینه) توانسته است دایما هر نسل را از لحاظ خصوصیات مختلف ارتقا بخشد.
هدف اصلی روشهای هوشمند به کار گرفته شده در هوش مصنوعی، یافتن پاسخ بهینه مسایل مهندسی است. حال اگر از روشهای بهینهسازی ریاضی استفاده کنیم مجبوریم تا در یک بازه بسیار کوچک، مقدار ماکزیمم تابع را بیابیم. مثلا از نقطه 1 شروع کنیم و تابع را ماکزیمم کنیم. بدیهی است اگر از نقطه 1 شروع کنیم تنها به مقدار ماکزیمم محلی دست خواهیم یافت و الگوریتم ما پس از ان متوقف خواهد شد. اما در روشهای هوشمند مخصوصا الگوریتم ژنتیک، به دلیل خصلت تصادفی انها، حتی اگر هم از نقطه 1 شروع کنیم باز ممکن است در میان راه، نقطه Aبه صورت تصادفی انتخاب شود که در این صورت ما شانس دستیابی به نقطه بهینه کلی[2]را خواهیم داشت]21[. برای شناخت الگوریتم ژنتیک، لازم است تعاریف زیر انجام شود:
شخص:[3]یک جواب کاندید برای مساله که معمولا به صورت رشته بیتی نمایش داده میشود.
الگوریتم ژنتیک، الگوریتمی اتفاقی است که از تکامل طبیعی تقلید میکند. جنبهای که این الگوریتم را مجزا میکند، این است که مجموعهای از جوابها را که اشخاص یا کروموزوم نامیده میشود، در یک جمعیت نگه میدارد. همانند تکامل زیستی، دارای مکانیزمی است که بهترین و مناسبترین کروموزوم را در هر نسل انتخاب میکند. به منظور شبیهسازی فرایند تکامل، کروموزومهای انتخاب شده تحت تاثیر عملگرهای ژنتیک همانند ترکیب و جهش قرار میگیرند [17]. الگوریتم ژنتیک دارای پنج مرحله میباشد که بدین ترتیب است:
کدینگ برای این منظور استفاده میشود که قسمتی از یک جواب به صورت یک کروموزوم کد شود. الگوریتم ژنتیک به جای این که بر روی پارامترها یا متغیرهای مساله کار کند، با شکل کد شده انها سروکار دارد. در طبیعت، بقای یک نسل یکی از مهمترین فاکتورها است و تنها عملگر ممکن برای این امر امیزش است. در الگوریتمهای ژنتیکی به طبع، طبیعت امیزش وجود دارد. امیزش با تعویض ژنها بین دو کروموزوم انجام میگیرد و هر کدام از کروموزومها خصوصیاتی از خود را به فرزندان انتقال میدهند. بدیهی است کروموزومهایی که دارای برازندگی بیشتری باشند، شانس بیشتری برای امیزش دارند. مهمترین عملگر در الگوریتم ژنتیک، عملگر ترکیب است. ترکیب، فرایندی است که در ان نسل قدیمی کروموزومها با یکدیگر مخلوط و ترکیب میشوند تا نسل تازهای از کروموزومها به وجود بیاید. جفتهایی به عنوان والد، ژنهایشان را با هم مبادله میکنند و اعضایی جدید به وجود میاورند. ترکیب در الگوریتم ژنتیک باعث از بین رفتن پراکندگی یا تنوع ژنتیکی جمعیت میشود، زیرا اجازه میدهد ژنهای خوب یکدیگر را بیابند.
ترکیب، دو کروموزوم را با انتخاب تصادفی موقعیتی مانند P ترکیب میکند که Pمقداری کمتر یا مساوی طول کروموزومها است. اگر تعداد (طول) ژنها در کروموزومها Nباشد، از دو کروموزوم والد، دو فرزند به صورت زیر به وجود میاید. یک فرزند با کپی کردن ژنهای 1,…,(P-1)از کروموزوم والد اول و ژنهای P,…,Nاز کروموزوم والد دوم ساخته میشود. فرزند دیگر به طور مشابه، این بار با کپی کردن ژنهای 1,…,(P-1)از کروموزوم والد دوم و ژنهای P,…,Nاز کروموزوم والد اول به وجود میاید. در این ترکیب از دو والد، دو فرزند به وجود میاید.
جهش نیز عملگر دیگری است که جوابهای ممکن دیگری را متولد میکند. در الگوریتم ژنتیک بعد از این که یک عضو در جمعیت جدید به وجود امد، هر ژن ان با احتمال جهش، جهش مییابد. در جهش ممکن است ژنی از مجموعه ژنهای جمعیت حذف شود یا ژنی که تا به حال در جمعیت وجود نداشته است، به ان اضافه شود. جهش یک ژن به معنای تغییر ان ژن است و بسته به نوع کدگذاری، روشهای متفاوت جهش استفاده میشود. میتوان استنباط کرد که مهمترین وظیفه جهش، اجتناب از همگرایی به بهینه محلی است. در الگوریتم ژنتیک با کدگذاری باینری، این عمل با تولید تصادفی یکی از اعداد 0یا 1و جایگزینی ان به جای بیت موردنظر صورت میگیرد. اما در برخی کاربردهای ژننتیک، عمل جهش دودویی در یک بیت با متمم ساختن ان بیت انجام میگیرد که این روش مناسبتر است. رمزگشایی، عکس عمل Encoding(رمزگذاری) است. در این مرحله بعد از این که الگوریتم بهترین جواب را برای مساله ارایه کرد، لازم است عکس عمل رمزگذاری روی جوابها اعمال شود.
يك دليل مهم براي بكارگيري روشهاي داده کاوي در مجموعه مستندات متني سازمان دادن آنها است. يك ساختار مي تواند به طور چشمگيري دسترسي به مجموعه مستندات را براي كاربر ساده كند. مشهورترين دسترسي به ساختارها كاتالوگ هاي كتابخانه يا اندیس هاي كتاب هستند. یکی از مشکلاتی که در طراحي دستي ايندكس ها در کتابخانه ها، زماني است كه براي نگهداري آنها لازم است. در نتيجه آنها هميشه به روز نيستند و اطلاعاتي كه اخيرا به اشتراك گذاشته شده را در بر ندارند يا اينكه بارها اطلاعات آنها تغيير ميكند مانند اطلاعات وب. روشهايي كه براي سازمان دهی مجموعه ها وجود دارند تلاش مي كنند تا مستندات را بر اساس كلمات كليدي آنها کلاس بندي کنند، يا به طورخودكار مجموعه مستندات را بر اساس مستندهاي مشابه سازماندهی[1] کنند.
اساس دسته بندي متون انتصاب كلاس هاي پيش تعريف شده به مستندات متني است. يعني بتوان با توجه به کلاسهاي از قبل تعيين شده، کلاس سند مورد نظر را تشخيص داد. به عنوان مثال برچسب زدن خودكار خبرهاي رسيده با موضوعاتي از قبيل ورزش، هنر و …. . متد کلاس بندي در داده کاوي كار خود را با يك مجموعه آموزشي D={d1,d2,..,dn} از مستنداتي كه قبلا کلاسبندي شده اند آغاز ميكنند. از اين مجموعه آموزشي در تعيين کلاس سند هاي جديد استفاده مي شود. عبارت بالا سند جديد d از دامنه را به كلاس مناسب انتصاب مي دهد.
طبقه بندی متن، مسئله ای است که در آن سند متنی را به یک یا چند طبقه از قبل تعیین شده نسبت می دهند. زمانی که تعداد اطلاعات متنی بیشتر میشود بازیابی اطلاعات بصورت موثر بدون اندیس گذاری و خلاصه سازی محتوای متن سخت و پیچیده می شود. طبقه بندی متن یک راه حل برای این مسئله است. با افزایش تعداد روشهای کلاسبندی بر پایه ی روشهای آماری و تکنیکهای یادگیری ماشین، در سالهای اخیر، منجر به اعمال روشها در طبقه بندی متن شده است.
اکثر تحقیقات در طبقه بندی متن به حل مسئله بصورت باینری پرداخته است. بدین معنا که آیا یک سند به یک موضوع از قبل تعیین شده مربوط است یا خیر. بهرحال، منابع متنی زیادی از دادههای متنی مثل اخبار اینترنتی، ایمیل و کتابخانه های دیجیتال وجود دارد. که هریک میتوانند به عناوین مختلف تعلق داشته باشند که مسئله چندبرچسبی بیان میشود. به عبارت دیگر در مسائل چندبرچسبی غالبا یک نمونه متنی به بیش از یک عنوان تعلق دارد. برای مثال یک متن خبری میتواند به چندین موضوع تعلق داشته باشد.
به طور کلی تحلیل متن به دو دسته تقسیم میشود که عبارتند از روشهای آماری و روشهای پردازش زبان. روشهای آماری بر طبق قانون احتمالات به تحلیل متن می پردازد و تلاش بر این دارد که اسناد متنی را به صورت ماتریسی نمایش دهد. روشهای پردازش زبان که بر طبق ساختار متن به استخراج خودکار مفاهیم از متن میشود و آن را علم هستی شناسی[2] نیز می نامند.
براي سنجش كارايي مدل طراحي شده براي دسته بندي مي توان از مستنداتي براي تست مدل استفاده کرد . نکته قابل توجه اين است که سندي که براي تست مدل ساخته شده استفاده مي شود نبايد در مستندات مجموعه آموزشي قرار داشته باشد. ما مستندات اين مجموعه آزمايشي را دستهبندي ميكنيم و کلاسهاي نتيجه را با کلاسهاي صحيح مقايسه كنيم. ميزان درستي کلاس مستندات نسبت به تعداد كل مستندات، دقت[3] ناميده ميشود و نخستين سنجش كارايي است.
بعد از آماده سازی مجموعه داده، کلاسبندی متن را انجام میدهیم. بطور کلی در داده کاوی برچسب تابعی از بردارهای موجود در مجموعه داده است و میتوان آن را بصورت f:wàL نمایش داد که w برداری از صفات است و L نشان دهندهی برچسب است. در متن کاوی صفات، کلمات و نشانهها هستند و تعیین برچسبها هدف اصلی در کلاسبندی متن میباشد که با لغات استخراج شده در ارتباط است.
بطور کلی در داده کاوی یادگیری به کمک الگوریتمهای یادگیری مختلف از مجموعه دادهی از قبل برچسب گذاری شدهای انجام میشود که آنرا مجموع دادهی آموزشی مینامند و بر طبق آن مجموعه بدون برچسب ورودی، برچسب گذاری میشود. جهت پیشبینی و کلاسبندی متون و توانایی استخراج دانش از اطلاعات موجود در متون و بکارگیری دانش در پیشبینی نمونهها، ابتدا همچنانکه بیان کردیم باید آنها در قالب ساختارمندی ذخیره کنیم. صفحه گسترده(یا ماتریس) قالبی است که میتوان اطلاعات متنی را در آن قرار داد. در ادامه با استفاده از روشهای یادگیری مختلف مانند روشهای منطقی، احتمالی، نزدیکترین همسایه و رتبه بندی وزنی میتواند یادگیری از متن را انجام داد و کلاسبند متن را ساخت. شکل زیر این مطلب را بیان می کند.
متن کاوي فرآيندي است که شامل فيلدهاي تکنولوژيکي فراواني است. بازيابي اطلاعات[1]، داده کاوي[2]، هوش مصنوعي[3] و زبانشناسي محاسباتي[4]، همگی فيلدهايي هستند که در اين زمينه، نقشي را دارا هستند. اما به طور کلي دو فاز اصلي در فرآيند متن کاوي وجود دارد.
اولين فاز، پيش پردازش مستندات[5] است. خروجي نخستين فاز مي تواند دو قالب مختلف داشته باشد که شامل مبتني بر سند و مبتني بر مفهوم می باشد. در اولين قالب نمايش، آنچه اهمیت دارد، نمايش بهتري براي مستندات است که ميتواند شامل تبدیل مستندات متنی به يك فرمت مياني و نيمه ساختيافته باشد يا بكار بردن اندیس يا هر نوع نمايش ديگري كه كار كردن با مستند را كاراتر مي كند. در اين صورت هر موجوديت در اين نمايش، در نهايت باز هم يك مستند خواهد بود. در نوع دوم بهبود بخشي به نمايش مستند، مفاهيم و معاني موجود در سند و نيز ارتباط ميان آنها و هر نوع اطلاعات مفهومي ديگري كه قابل استخراج است، از متن استخراج مي شود. در اين نوع نمايش ديگر با مستندات به عنوان يك موجوديت مواجه نيستيم بلكه با مفاهيمي روبرو هستیم كه از اين مستندات استخراج شده اند.
قدم بعدي استخراج دانش از فرمهاي مياني نمايش مستندات است. بسته به نحوهي نمايش يك مستند، روال استخراج دانش براي يك مستند متفاوت است. نمايش مبتني بر سند، براي گروه بندي، طبقه بندي، تصويرگري و نظاير آن استفاده مي شود، در حاليكه نمايش مبتني بر مفهوم براي يافتن روابط ميان مفاهيم، آنتولوژي[1] و نظاير آن بكار ميرود.
سرویسهای ابری پردازش ابری با آمدن خود تحولاتی در همه ی زمینه ها ایجاد نمود، یا بهتر است بگوییم بازار کاری پر رونقی با خود به همراه آورده است. شرکتها و سازمانهای معروف با سرویسهای این فنّاوری، جایگاه خود را محکمتر کردند و آنهایی که نامی نداشتند، با چنگ زدن به پردازش ابری نام و جایگاهی برای خود فراهم کردند. سه سرویس فراهمشده از معماری رایانش ابری بر پایه نیاز مشتریان IT بهصورت زیر است: • نرمافزار به عنوان سرویس (SaaS) مدل توزیع برنامه های کاربردی، که در آن فروشنده یا ارائهدهنده، خدمات میزبانی و در دسترس را به مشتریان بر روی یک شبکه، ارائه میدهد (ارائه نرمافزار مبتنی بر اینترنت). در واقع میتوان آن را چنین تعریف کرد، تمامی نرم-افزارهایی که تاکنون از مغازه ها تهیه میکردیم اکنون با استفاده از اینترنت و یک واسط در سراسر دنیا به آنها دسترسی داشته باشیم. برای مثال، استفاده از Gmail از شرکت گوگل یک SaaS است. • پلتفرم بهعنوان سرویس (PaaS)، الگوی ارائه سیستمعامل و خدمات مرتبط بر روی اینترنت، بدون دریافت و یا نصب و راهاندازی است. این لایه در بالای لایه زیرساخت قرار دارد. به لایه نرمافزاری در ابر که امکان ساخت لایه های بالایی را فراهم میکند، سکوی ابری میگویند. این سرویس یکلایهی نرمافزاری را بهصورت بسته ارائه میدهد که میتوان از آن برای تولید سرویسهای سطح بالاتر استفاده نمود. لایه PaaS امکاناتی جهت ساخت برنامه را برای ما فراهم میکند که این برنامه قابل اجرا بر روی لایه SaaSاست. یک مثال خوب میتواند موتور Google Apps، تولید نرم افزار توسط زیرساخت گوگل باشد که امکان اجرای برنامه های کاربردی را فراهم میکند. • زیرساخت به عنوان سرویس (IaaS) شامل برونسپاری تجهیزات مورد استفاده، برای حمایت از عملیاتی ازجمله ذخیرهسازی، سختافزار، سرویس دهنده ها و اجزای شبکه است. کاربران به جای خرید سختافزار، نر مافزار، فضای مرکز داده و یا تجهیزات شبکه، همه این زیرساختها را بهصورت یک سرویس کاملاً برونسپاری شده خریداری میکنند. درواقع این سرویس مدلی از پردازش ابری است که بر اساس آن سخت افزارها در ابر مجازی میشوند و بدون لایه زیرساخت لایه های بالایی قادر به ارائه سرویس نخواهند بود. صورتحساب سرویس معمولاً براساس مدل رایانش همگانی و میزان منابع مصرفشده صادر میشود. بنابراین هزینه منعکسکننده میزان فعالیت است. توافقنامه سطح سرویس (SLA) قرارداد تضمین و تأمین میزانی معین از کیفیت سرویس از شرکت سرویسدهنده برای شرکت سرویسگیرنده یا کاربر است. قرارداد خدمات متضمن عرضه خدمات است و بسیاری از تأمینکنندگان خدمات در صورت عدم اجرای تعهدات ذکرشده خسارت میدهند درحالیکه این نوع پیشنهادها در ظاهر جذاب هستند، همیشه خدمات باکیفیت برابری نمیکنند. همانطور که مشخص است هر سرویس دارای قیمت، ویژگیها و کارایی خاص خود است. هر ارائهدهندهی سرویس بر اساس قیمت، ویژگیها و کارایی سرویسهای متنوعی را برای مشتریان ارائه میکند. مثلاً یک سرویس با محاسبات گران و ذخیرهسازی ارزان و غیره. با رشد درخواستهای ابری از طرف مشتریان انتخاب بهترین فراهمکننده سرویس از بین سرویسهای مشابه بر اساس نیازمندیهای مشتری ازنظر کارایی و هزینه به امری پیچیده تبدیلشده است.
کیفیت سرویس به طوری کلی جهت بررسی کیفیت وب سرویسها باید صفات آنها از طریق معیارهای کیفی مورد ارزیابی قرار بگیرد. معیارهای کیفی به دو دسته عملیاتی و غیرعمیلیاتی تقسیم میشوند. معیارهای عملیاتی دارای صفاتی است که قابلیت کمی سازی دارد. اما معیارهای غیرعملیاتی قابلیت کمی سازی را ندارد. همچنین تمامی صفات کیفی در سرویسهای ابری قابل استفاده نیستند برای نمونه صفت قابلیت نصب که یک صفت کیفی غیرعملیاتی است، در وب سرویسها کاربردی ندارد زیرا وب سرویس نیازی به نصب شدن در سیستم کاربر ندارد. برخی از صفات کیفی که در وب سرویسها قابل استفاده است به صورت زیر است (۱). ۱ زمان پاسخ سرویس بهره وری در دسترس بودن یک سرویس می تواند از لحاظ زمان پاسخ اندازه گیری شود، به عنوان مثال در مورد IaaS منظور این است که سرویس با چه سرعتی میتواند برای استفاده فراهم شود. زمان پاسخ سرویس به زیرفاکتورهای گوناگونی نظیر میانگین زمان پاسخ، حداکثر زمان پاسخ که توسط ارائهدهنده سرویس وعده داده شده و درصدی اززمانی که سیستم پاسخ نمیدهد بستگی دارد. میانگین زمان پاسخ از طریق فرمول به دست میآید که Ti فاصله زمانی بین درخواست مشتری i برای یک سرویس است که واقعا سرویس در دسترس قرار میگیرد. N تعداد کل درخواست ها است. حداکثر زمان پاسخ، ماکزیمم زمان وعده داده شده توسط ارائه دهنده ابر برای سرویس مورد نظر است. زمان عدم پاسخ درصدی از موارد است که زمان پاسخ بیشتر از حداکثر زمان پاسخی هست که توسط ارائه دهنده وعده داده شده است. زمان عدم پاسخ از رابطه بدست میآید که n’ تعداد مواردی است که ارائه دهنده سرویس نمیتواند به وعده اش عمل کند (۱).
۲ شایستگی شایستگی به صورت درجهای که نیازمندیهای مشتری توسط ارائه دهنده برآورده میشود تعریف میگردد. قبل از اینکه شایستگی را تعریف کنیم دو مورد وجود دارد. اول اینکه، اگر بعد از فیلتر کردن ارائه دهندگان، بیشتر از یک ارائه هنده وجود داشته باشد که تمامی نیازمندی های ضروری و غیر ضروری مشتری را برآورده کند، بنابراین همه آنها شایسته هستند. درغیر اینصورت، اگر فیلترینگ یک لیست خالی از ارائه دهندگان ابر ایجاد کند آن ارائه دهندگانی که نیازمندی های ضروری را برآورده میکنند انتخاب میشوند. در این موارد، شایستگی درجهای خواهد بود که ویژگی های سرویس به نیازمندیهای کاربر نزدیکتر شود. ۳ دقت دقت عملکرد سرویس، درجه نزدیکی مقادیر واقعی کاربر در مقایسه با مقادیر مورد انتظار است. برای منابع محاسباتی مانند ماشین های مجازی، اولین شاخص دقت تعداد دفعاتی هست که ارائه دهنده از محدوده قرارداد سطح سرویس خارج میشود که به عنوان فرکانس شکست در عملی کردن قرارداد سطح سرویس وعده داده شده به لحاظ واحدهای محاسباتی، شبکه و ذخیره سازی تعریف میشود. اگر fi تعداد دفعات شکست ارائه دهنده در برآوردن مقادیر وعده داده شده به کاربرi در مدت زمان سرویس T باشد، فرکانس دقت به صورت تعریف می شود که n تعداد کاربران قبلی است. شاخص دیگر دقت، مقدار دقت است که با رابطه تعریف می شود که می تواند واحد محاسباتی، شبکه یا ذخیره سازی باشد و Tiزمان سرویسT برای کاربر i می باشد. ۴ در دسترس بودن درصدی از زمان است که مشتری میتواند از سرویس استفاده کند. فرمول 2.1 میزان در دسترس پذیری در یک ماه را نشان میدهد.
۵ قابلیت اطمینان نشاندهندهی چگونگی عملیات یک سرویس در طول زمان و شرایط مشخص بدون خرابی است. بنابراین قابلیت اطمینان بر اساس میانگین زمان خرابی که در قرارداد ارائهدهنده آمده است و شکست های قبلی تجربه شده توسط کاربر تعریف می شود و بهصورت زیر قابلمحاسبه است:
که numfailure تعداد کاربرانی است که خطایی را در بازه زمانی کمتر از مقدار قرارداد شده توسط ارائه دهنده تجربه کردهاند، n تعداد کاربران است و pmttf میانگین زمان قرارداد شده برای خطا است. بنابراین حاصلضرب احتمال بروز خطا که جزئی از تجربه کاربر خبره است در میانگین زمان خطا قابلیت اطمینان را نشان میدهد. قابلیت اطمینان یک دستگاه ذخیره سازی را می توان از لحاظ دوام و پایداری، که شانس خرابی یه دستگاه ذخیرهسازی را نشان میدهد تعریف کرد (۱).
۶ پایداری پایداری تعیینکننده میزان تغییرات در عملکرد سرویس است. برای دستگاه ذخیره سازی بهصورت واریانس میانگین زمان خواندن و نوشتن است و برای منابع محاسباتی، پایداری انحراف از عملکرد است که در توافقنامه سطح سرویس مشخص شده است و به صورت زیر تعریف میگردد:
متغیر α میتواند یک واحد محاسباتی، شبکه یا واحد ذخیره سازی منبع باشد، میانگین عملکرد مشاهده شده توسط کاربر iهست که سرویس ابر را اجاره کرده است، مقدار موردنظر در توافقنامه سطح سرویس است، T زمان سرویس و n تعداد کاربران است (۱).
۷ هزینه با توجه به اینکه هر سرویس دارای صفات و ابعاد خاص خود است بنابراین مقایسه ی قیمت بین سرویسهای مختلف کار پیچیدهای است. حتی یک ارائه دهنده ممکن است VM های مختلفی پیشنهاد کنند که نیازمندیهای کاربر را برآورده کند(۱).
۸ قابلیت تطبیق به توانایی ارائه دهنده سرویس در سازگار کردن تغییرات سرویسها براساس درخواستهای مشتری قابلیت تطبیق میگویند. این قابلیت به صورت زمان صرف شده برای سازگار شدن با تغییرات یا ارتقا سرویس به یک سطح بالاتر تعریف میشود(۱).
۹ قابلیت استفاده سادگی استفاده از سرویس ابر را قابلیت استفاده مینامیم. مؤلفههایی مانند قابلیت اجرا، قابلیت یادگیری، قابلیت نصب، قابل فهم بودن میتوانند به عنوان زمان متوسط تجربه شده توسط کاربران قبلی سرویس ابر برای کارکردن، یادگیری، نصب و فهمیدن آن به ترتیب بیان شوند(۱). ۱۰ توان عملیاتی و کارایی توان عملیاتی و کارایی مهم ترین اندازه گیریها برای تخمین عملکرد سرویس های زیرساخت فراهم شده توسط ابر است. توان عملیاتی تعداد کارهای تکمیل شده توسط سرویس ابر در واحد زمان است. توان عملیاتی کمی با زمان پاسخ سرویس که با چه سرعتی سرویس فراهم می شود را اندازه گیری می کند متفاوت است. توان عملیاتی به چندین فاکتور بستگی دارد که می تواند بر اجرای یک کار تاثیر بگذارد. فرض کنید برنامه کاربردی کاربر n کار دارد و آنها برای اجرا بر روی m ماشین ارائه دهنده ارسال می شوند. فرض Te(n,m) زمان اجرای n کار بر روی m ماشین باشد. Toسربار زمانی به علت فاکتورهای گوناگون مانند تاخیر شروع زیرساخت و تاخیر ارتباط بین کار میباشد. بنابراین توان عملیاتی کل یک سرویس ابری به صورت زیر محاسبه میشود:
کارایی به استفاده مؤثر از سرویس ها اشاره دارد. بنابراین مقدار بالاتر کارایی نشان میدهد که سربار کمتر خواهد بود.
استفاده از دانش و دیدگاه تخصصی یک مجموعه در تصمیم گیري پیرامون مسائلی که ماهیت کیفی دارند بسیار راه گشا است. تکنیک دلفی یکی از روش هاي کسب دانش گروهی است که در تصمیم گیري پیرامون مسائل کیفی نیز کاربرد دارد. در پژوهش هاي کیفی که جنبه اکتشافی دارد و شناسایی ماهیت و عناصر بنیادین یک پدیده، محور مطالعه است می توان از تکنیک دلفی استفاده کرد. تکنیک دلفی فرایندي ساختارمند جهت گردآوري اطلاعات در طی راندهاي متوالی و در نهایت اجماع گروهی است. با وجود بیش از نیم قرن کاربرد تکنیک دلفی در مطالعات علمی و آکادمیک هنوز ابهامات زیادي در زمینه این تکنیک وجود دارد. مهمترین مشکل در استفاده از تکنیک دلفی نبود یک چارچوب نظري مشخص در استفاده از این تکنیک است. در میان ویژگی هاي مختلف تکنیک دلفی چهار ویژگی آن تقریباً همیشه ثابت است: ناشناس بودن ، تکرار ،بازخور کنترل شده ، گزارش آماري نتایج (۱).
تکنیک دلفی را بصورت روشی براي ساختاردهی یک فرایند ارتباط گروهی تعریف می کنند. اجماع گروهی از نظرات خبرگان بواسطه ي یک سري از پرسشنامه هاي متمرکز همراه با بازخورد کنترل شده با کسب اجماع گروهی از خبرگان بوسیله ي این فرایند، محققان می توانند مسائل را شناسایی نموده و اولویت بندي کنند و چارچوبی را براي تشخیص آنها توسعه دهند. هدف اصلی روش دلفی دستیابی به قابل اطمینان ترین اجماع گروهی از نظرات خبرگان به واسطه ی یکسری از پرسشنامه های متمرکز همراه با بازخورد کنترل شده می باشد. با کسب اجماع گروهی از خبرگان بوسیله ی این فرآیند، محققان می توانند مسائل را شناسایی نموده و اولویت-بندی کنند و چارچوبی برای تشخیص آنها توسعه دهند. بدون تردید فردجمعی در تصمیم گیری می تواند به اتخاذ تصمیمی کامل تر و همه جانبه منجر شود. با این وجود حل گروهی مساله به روش سنتی اجماع با مشکلات بسیار همراه است. افراد گروه که اعتماد به نفس بالایی دارند براعضای ضعیف تر گروه مسلط می-شوند. برخی نیز برای مطابقت داشتن با نظرات گروه تحت فشار قرار می گیرند و به دلیل احترامی که برای افراد دیگر قائل هستند. دیدگاه خود را مطرح نمی کنند. به همین دلیل روش گروهی حل مشکل اغلب بی نتیجه و غیرموثر خواهد بود. برای حل این مشکل در دلفی از اصل ناشناس بودن استفاده می شود. در تکنیک دلفی خبرگان و افرادی که در نظرسنجی استفاده می شوند یکدیگر را نمی شناسند. ناشناس بودن غلبه بر موانع فکری را تضمین می کند. دیدگاه خبرگان توسط یک هماهنگ کننده گردآوری شده و سپس خلاصه نتایج توسط هماهنگ کننده در اختیار دیگر اعضا قرار داده می شود. سپس افراد براساس خلاصه نتایج مرحله قبل مجدداً دیدگاه خود را تعدیل کرده و مطرح می کنند. در نهایت پس از رسیدن به یک اجماع کلی، نتایج در قالب یک گزارش آماری (معمولا میانگین یا میانه) مطرح می شود و برای تصمیم گیری استفاده می شود(۱). تکنیک دلفی به صورت یک رویکرد تحقیقی جهت بدست آوردن اجماع با استفاده از یک سری از پرسشنامه ها و ارایه بازخورد به شرکت کنندگانی که در حوزه¬ی کلیدی دارای تخصص هستند، تعریف می شود. مساله اصلی در استفاده از تکنیک دلفی فقدان یک چارچوب نظری جامع برای بکارگیری تکنیک دلفی در پژوهش های کیفی ارایه شده است. عمده ترین ضعف دلفی فقدان چارچوب نظری است. این مساله باعث شده است تا دلفی به عنوان یک روش تحقیق به صورت مختلفی به عنوان پیمایش، مطالعه، رویه، روش، رویکرد، رای گیری و تکنیک مطرح گردد. با این وجود عموماً پذیرفته شده است که روش دلفی از نظر کاربرد یکسان نیست. همچنین همواره ابهاماتی در زمینه ی شرایط استفاده و تشخیص پایان مراحل دلفی وجود دارد. چارچوب نظری تکنیک دلفی در تحقیقات کیفی در شکل۱ آمده است. مهمترین شرایط مورد نیاز برای کاربرد دلفی عبارت است از نیاز به قضاوت خبرگان، لزوم توافق گروهی در دستیابی به نتایج، لزوم گمنامی در گردآوردی داده ها، که نیازمند وجود خبرگان با تجربه و توانمند و پراکندگی آنها است. در پژوهش های کیفی که اساساً مبتنی بر قضاوت و دیدگاه افراد است شرط لازم برای استفاده از روش دلفی این است که چنانچه این پژوهش ها براساس دیدگاه کارشناسی استوار باشد آنگاه استفاده از تکنیک های آمار استنباطی مانند آزمون های میانگین توجیه ندارد زیرا اساساً خبرگان آنقدر زیاد نیستند که بتوان نمونه های وسیعی از آنها در دسترس داشت و یا هزینه و زمان دسترسی به آنها دشوار است. برای نمونه اگر قرار باشد رضایت مشتریان بررسی شود از نمونه گیری آماری و روش های آماری استنباطی استفاده می شود. اما اگر قرار باشد تصمیم گرفته شود براساس معیارهایی رضایت مشتریان مورد سنجش قرار بگیرد آنگاه از دیدگاه خبرگان و تکنیک دلفی می توان استفاده کرد. مهمترین کاربرد تکنیک دلفی در مسایل تکنیک های تصمیم گیری چندمعیاره است. در پژوهش های کیفی که هدف آن تعیین میزان اهمیت و یا غربال آیتم ها است، می توان از طیف پنج یا هفت یا نه درجه استفاده کرد. نمونه ای از این طیف ها در جدول ۱ آمده است.
پس از گردآوری دیدگاه خبرگان، میانگین نمره نظرات آنها پیرامون هر بعد محاسبه می شود. با توجه به چارچوب نظری اگر توافق وجود نداشته باشد، میانگین محاسبه شده به عنوان بازخورد کنترل شده به همراه پرسشنامه مجدد در اختیار خبرگان قرار می گیرد. پس از طی راندهای مختلف زمانی که وحدت حاصل شد، براساس میانگین راند نهایی به غربال آیتم ها پرداخته می شود. چنانچه از طیف نه درجه استفاده شود معمولا معیارهایی که میانگین زیر۷ کسب کرده باشند حذف می شوند. برای طیف هفت درجه میانگین زیر 5 و در طیف پنج درجه میانگین زیر ۴ مبنای حذف عوامل است. یکی از مشکلات همراه با تکنیک دلفی روش علمی برای تعیین میزان اتفاق نظر است. در مطالعات مختلف نیز روش های گوناگونی پیشنهاد شده است که بین ۲تا ۱۰ راند پیشنهاد شده است(۱). مقاله اصلی را از اینجا دانلود کنید
هرچند هدف از به کار گیری روش تحلیل سلسله مراتبی به دست آوردن نظر کارشناسان و متخصصین است، با این وجود روش تحلیل سلسله مراتبی معمولی، به درستی نحوه تفکر انسانی را منعکس نمی کند، زیرا در مقایسه های زوجی این روش از اعداد دقیق استفاده می شود. از دیگر مواردی که اغلب روش تحلیل سلسله مراتبی به خاطر آن مورد نکوهش قرار می گیرند عبارتند از وجود مقیاس نامتوازن در قضاوت ها، عدم قطعیت و نادقیق بودن مقایسه های زوجی. تصمیم گیرندگان اغلب به علت طبیعت فازی مقایسه های زوجی قادر نیستند به صراحت نظرشان را در مورد برتری ها اعلام کنند به همین دلیل در قضاوت هایشان ارائه یک بازه را به جای یک عدد ثابت ترجیح می دهند. برای اغلب این مشکلات روش تحلیل سلسله مراتبی فازی ارایه شده است. در روش تحلیل سلسله مراتبی فازی، پس از تهیه نمودار سلسله مراتبی از تصمیم گیرنده ( یا تصمیم گیرندگان) خواسته می شود تا عناصر هر سطح را نسبت به هم مقایسه کنند و اهمیت نسبی عناصر را با استفاده از اعداد فازی بیان کنند. به طور مثال در جدول زیر نمونه ای از اعداد فازی مثلثی تعریف شده و توابع عضویت آنها درج شده است. جدول زیر نمونه ای از اعداد فازی تعریف شده در روش تحلیل سلسله مراتبی فازی آمده است(۱).
اعداد فازی مثلثی در شکل زیر نیز تابع عضویت فازی برای متغیرهای زبانی نشان داده شده است.
مراحل روش تحلیل سلسله مراتبی فازی به روش چانگ به شرح زیر است: ۱- رسم نمودار سلسله مراتبی ۲- تعریف اعداد فازی به منظور انجام مقایسه های زوجی ۳- تشکیل ماتریس مقایسه زوجی با به کار گیری اعداد فازی ماتریس مقایسه زوجی به صورت زیر خواهد بود: که این ماتریس حاوی اعداد فازی زیر است:
اگر کمیته تصمیم گیرنده دارای چندین تصمیم گیرنده باشد، درایه های ماتریس مقایسه ی زوجی جامع که در روش تحلیلی سلسله مراتبی فازی به کار می رود، یک عدد فازی مثلثی است که مولفه اول آن حداقل نظرسنجی ها، مولفه دوم آن میانگین نظرسنجی ها و مولفه سوم آن حداکثر نظر سنجی ها می باشد.
۴-محاسبه Si برای هریک از سطرهای ماتریس مقایسه زوجی Si که خود یک عدد فازی مثلثی است از رابطه زیر محاسبه می شود:
که در این رابطه i بیانگر شماره سطر و j بیانگر شماره ستون می باشد. هریک از موارد فرمول بالا بصورت زیر محاسبه می شوند:
در مقادیر بالا li ، mi و ui به ترتیب مولفه¬های اول تا سوم اعداد فازی هستند.
۵- محاسبه درجه بزرگی Si ها نسبت به همدیگر: به طور کلی اگر (M1=(l1,m1,u1 و (M2=(l2,m2,u2 دو عدد فازی مثلثی باشند، طبق شکل درجه بزرگی M1 نسبت به M2 به صورت زیر تعریف می شود:
از طرف دیگر میزان بزرگی یک عدد فازی مثلثی از K عدد فازی مثلثی دیگر از رابطه زیر به دست می آید:
۶- محاسبه وزن معیارها و گزینه ها در ماتریس های مقایسه زوجی بدین منظور از رابطه زیر استفاده می شود:
بنابراین بردار وزن نرمالیزه نشده به صورت زیر خواهد بود:
۷- محاسبه بردار وزن نهایی برای محاسبه بردار وزن نهایی باید بردار وزن محاسبه شده در مرحله قبل را نرمالیزه کرد. بنابراین:
رتبه بندی کیفیت سرویس با استفاده از فرایند تحلیل سلسله مراتبی همانطور که قبلا بحث شد، سرویس های ابری و سرویس های وب چندین KPI با صفات مختلف و زیر صفات مختلف دارند که هر کدام رتبهبندی سرویس ها را فرآیندی پیچیده میکنند. این مسئله با نام تصمیم گیری چند معیاره شناخته می شود. این مشکل آنجا شدت پیدا می کند که برخی از صفات مثل امنیت را نمی توان مقداردهی کمی نمود.
بدون یک تکنیک ساختیافته، ارزیابی کیفیت کلی سرویسهای ابری و وب مختلف با توجه به تعداد صفات درگیر بسیار مشکل خواهد بود. علاوه براین، چالش این است که برای مقایسه هریک از سرویس ها در هر صفت، چگونه آنها را با مقدارهای کمی نشان دهیم و چگونه آنها را در یک متریک معنادار جمع بندی کنیم. به طور کلی چنین مسائلی در گروه تصمیم گیری چندمعیاره قرار میگیرند که تصمیم گیرندهها راه حلها را براساس ارزیابی چندین معیار انتخاب میکنند یا رتبهبندی میکنند. تصمیمگیری شامل مدیریت مصالحه و سازگاری در بین چند معیار هست که باهم متناقض هستند. سه راه حل اساسی برای حل مشکل تصمیم گیری چند معیاره وجود دارد: ۱ تئوری مطلوبیت چند شاخصه ساده ترین روشی است که چندین اولویت را با هم در قالب توابع مطلوبیت چند شاحصه ترکیب می کند. در MAUT ، توابع مطلوبیت برای هر معیار با توابع وزنی آن معیار ترکیب میشوند. مزیت اصلی این روش این است که بعد از ارزیابی موفق تابع مطلوبیت، مسئله به صورت یک تابع تک هدفه در میآید. بنابراین به آسانی مطمئن میشویم که به بهترین راه حل مصالحه براساس تابع هدف دست یافته ایم(۱). ۲ روش اندازه گیری غیرقابل محاسبه این روش، کارایی گزینه ها را برای هر معیار با هم مقایسه میکند و میزان اولویت یک گزینه را نسبت به گزینه ای دیگر بدون در نظر گرفتن مقیاس پیشنهادی کاربر مشخص میکند. مدلهای اندازه گیری غیرقابل محاسبه به طور کلی زمانی به کار میروند که جمعبندی متریکها ساده نیست و واحدهای اندازهگیری نامتناسب و غیرقابل مقایسه هستند. اشکال این رویکرد این است که ممکن است در بسیاری از مواقع به نتیجه نرسد و پیاده سازی آن در مقایسه با رویکردهای دیگر تصمیم گیری چندمعیاره بسیار پیچیده است(۱). ۳ فرآیند تحلیل سلسله مراتبی(فرایند تحلیل سلسله مراتبی) یکی از روش های پرکاربرد برای حل مسائل مرتبط با تصمیم گیری چندمعیاره می باشد. روش فرایند تحلیل سلسله مراتبی جزء روش های تصمیم گیری چند معیاره میباشد که مسائل پیچیده و بدون ساختار را با منظم کردن فاکتورهای تصمیم گیری در ساختار سلسله مراتبی ساده میکند. برخلاف MAUT،فرایند تحلیل سلسله مراتبی براساس مقایسه زوجی معیار تصمیم بجای مطلوبیت و توابع وزن می باشد. مقایسه زوجی به تصمیم گیرنده امکان ایجاد مصالحه بین معیارها را می دهد. از مزایای روش فرایند تحلیل سلسله مراتبی نسبت به روشهای دیگر چند معیاره می توان به قابلیت انعطاف، درخواست تجدید نظر بصری برای تصمیمگیرندگان و توانایی بررسی ناسازگاریها نام برد. فرآیند تحلیل سلسله مراتبی همچنین به ارزیابی ذهنی و عینی اندازه ها کمک میکند. در حالی که یک مکانیزم قدرتمند برای بررسی سازگاری ارزیابی اندازهگیریها و گزینهها ارائه میدهد، انحراف و خطا در تصمیمگیری را کاهش می دهد(۱). فرآیند موجود در الگوریتم فرایند تحلیل سلسله مراتبی به این صورت است که از یک ماتریس تصمیم استفاده می کنیم. این بدین معناست که فرض کنیم 10 خودرو داریم که قیمت خودروها مشخص است به کمک 100 خبره یا کارشناس کیفیت آنها را بررسی کرده ایم و از صفر تا 100 به آن نمره داده¬اند. قرار است تصمیم گیرنده از نظر قیمت و کیفیت که قیمت 60 درصد ارزش دارد و کیفیت 40 درصد ارزش دارد این کار انجام شود. در اینجا نیز قیمت را با 60- درصد نمایش می¬دهیم زیرا قیمت کمینه باید باشد و هرچقدر کمتر باشد بهتر است. مراحل کار به صورت زیر است: ۱ ابتدا مقادیر کمینه سازی باید معکوس شوند یعنی بین صفر و یک باشند و وزن آن مثبت می شوند. ۲ نرمالایز می کنیم یعنی هر درایه را تقسیم بر مجموع آن ستون می کنیم. ۳ هر ستون درایه ها را ضربدر وزن آن می کنیم. ۴ برای هر سطر میانگین می گیریم. ۵ در ستون به دست آمده مجموع هر درایه را بر مجموع میانگین ها تقسیم می کنیم. ۶ رتبه بندی می کنیم. بنابراین برای رتبه بندی سرویس های وب و ابری براساس چندین KPI مکانیزم رتبه بندی براساس فرآیند تحلیل سلسله مراتبی (فرایند تحلیل سلسله مراتبی) پیشنهاد میشود. در این فرآیند 3 فاز وجود دارد: ۱ تجزیه مساله ۲ قضاوت بر اولویت ها ۳ جمع بندی اولویت ها در فاز اول، رتبهبندی یک مسئله پیچیده در یک ساختار سلسله مراتبی که رابطه متقابل بین سه نوع عنصر، هدف کلی، صفات کیفیت سرویس و زیرصفات آن، و گزینههای مورد نظر برای انتخاب سرویس را مشخص میکند، مدل می¬شود. فاز دوم شامل دو بخش است: مقایسه زوجی بین صفات کیفیت سرویس انجام میشود تا اولویتهای نسبی آنها را مشخص کند و یک مقایسه زوجی بین سرویسهای ابر براساس صفات کیفیت سرویس شان برای مشخص کردن رتبه محلی آنها انجام میشود. در فاز نهایی برای هر گزینه سرویس، رتبههای محلی مربوط به همه معیارها جمعبندی شده تا مقادیر رتبهبندی سراسری برای همه سرویسها بدست آید. در ادامه گام¬های اصلی برای مدلسازی مسئله رتبهبندی در سرویسهای وب و ابر را توصیف میکنیم(۱). در فاز۱ ساختار سلسله مراتبی برای سرویس های وب بر پایه ی کیفیت سرویس مشخص می شود. شکل زیر ساختار سلسله مراتبی سرویس ابر رابر پایه ی SMI KPI را نشان می دهد. لایه ی اول اهداف تحلیلی را نشان می دهد که به یافتن شاخص نسبی مدیریت سرویس همه سرویسهای ابر که نیازهای ضروری کاربر را برآورده میکند کمک میکند. لایه دوم شامل صفات کیفیت سرویس ضروری و غیرضروری بصورت سلسله مراتبی است. آخرین لایه شامل همه سرویسهای ابر است که ویژگیهای کیفیت سرویس لایه دوم را برآورده میکنند.
فاز2 شامل محاسبه وزن نسبی هر کیفیت سرویس و سرویس می باشد. جهت مقایسهی دو سرویس ابری، نیاز به تخصیص وزن به هر صفت داریم تا میزان اهمیت نسبی آنها مشخص شود. در این جا دو نوع وزن در نظر میگیریم: • تخصیص وزن توسط کاربر با استفاده از روش استاندارد فرایند تحلیل سلسله مراتبی. کاربر ابر میتواند به هر صفت SMI در یک رنج خاص وزنهایی را تخصیص دهد. برای نمونه مقادیر [9… 1] برای روش فرایند تحلیل سلسله مراتبی پیشنهاد شده اند تا اهمیت یک صفت کیفیت سرویس را نسبت به دیگری نشان دهد. فهرست اهمیت نسبی در جدول زیر آمده است. این متدولوژی در اصل برای محاسبه وزن هر معیار در تکنیک فرایند تحلیل سلسله مراتبی پیشنهاد شده است و میتواند برای تخصیص وزن به همه صفات کیفیت سرویس به کار رود. کاربران اولویتهای خود را برای هر صفت نسبت به صفات دیگر بیان میکنند. مقادیر اولویت های نسبی جهت تعیین اهمیت نسبی(۱)
• کاربر به طور اختیاری وزنهایی را تخصیص میدهد. کاربر میتواند وزن هایی را با مقیاس خودش به جای مقیاس های تکنیک فرایند تحلیل سلسله مراتبی تخصیص دهد. در این مورد مجموع وزنها ممکن است ۱ نشود که یکی از نیازهای تکنیک فرایند تحلیل سلسله مراتبی است. در این حالت همه وزنها را نرمال سازی میکنیم. فاز۳: وزن های نسبی مبتنی بر مقدار برای رتبه بندی سرویس های ابر این وزن ها عملکرد نسبی هر سرویس ابر را براساس مقادیر صفات پایین ترین سطح تعریف میکنند. فرآیند تخصیص وزنها از آنجایی که صفات پایینترین سطح مقادیر مختلفی دارند سر راست نیست. نسبت دادن وزن ها به صفات پایینترین سطح از ساختار سلسله مراتبی کار راحت و سر راست نیست. برای مثال مقدار صفت “تصدیق” برای یک ارائه دهنده خاص یک لیست یا مجموعه خواهد بود. در حالی که مقدار صفت “قابلیت ارتجاعی”یک مقدار عددی خواهد بود و مقدار برخی صفات ممکن است شناخته شده نباشد. بنابراین مشکل این است که چگونه به برخی از صفات می توان وزن تخصیص داد در حالیکه قابل سنجش نیستند. برای مقایسه دو مقدار برای هر سرویس ابر، اولا باید مطمئن شد که واحدهای بعدی هر دو مقدار یکسان هستند. دوما، باید دو مقدار را براساس نوع شان مقایسه کنیم زیرا مقدار صفات میتواند از بولین تا یک مجموعه نامرتب تغییر کند. برای هر نوع صفت، یک متریک مقایسهای متفاوت پیشنهاد میشود. سوما همانطور که قبلا شرح داده شد کاربران میتوانند صفات ضروری و غیرضروری را مشخص کنند. در چارچوب SMICloud، برای کاربران اختیاری است که مقدار نیازشان را برای صفات غیرضروری مشخص کنند. بنابراین زمانی که صفات غیرضروری برای دو سرویس مقایسه شوند، این احتمال وجود دارد که vr توسط کاربر مشخص نشود. نکته دیگر این است که ممکن است امکان مانیتور کردن بعضی از صفات توسط SMICloud به علت عدم وجود چنین APIهایی توسط ارائه دهنده وجود نداشته باشد(۱). فاز۴: جمع بندی رتبه بندی نسبی برای هر صفت SMI در آخرین مرحله، بردارهای رتبه بندی نسبی هر صفت با وزنهای نسبی تخصیص یافته در فاز2 جمع بندی میشوند. این فرآیند جمعبندی برای همه صفات در سلسله مراتب SMI تکرار میشود و رتبهبندی همه سرویسهای ابر براساس KPI را نتیجه میدهد(۱).
تئوری فازی سیستم فازی با استفاده از تئوری احتمال، عدم قطعیت را در نتایج اداره می کند. مثال معروف از تئوری بازی لیوانی است که پر از مایع ناشناخته است، می باشد. در این وضعیت لیوان با هفتاد درصد آب پر شده است و ۳۰ درصد از مایعات دیگر پر شده است. این بدان معنا است که ۷۰ درصد آب عضو مایع است.
۱ مجموعه فازی و اجزا مجموعه فازی، قسمت اصلی از هر سیستم فازی است. در ریاضیات مجموعه فازی می تواند شامل عناصر متناهی، نامتناهی و نامتناهی قابل شمارش باشند. در سیستم های فازی عنصر می تواند داخل یا خارج از مجموعه باشد. اما در سیستم های فازی عنصر تا قسمتی عضو و تا قسمتی غیرعضو از مجموعه فازی می شود. برای نمونه x آیا عضو مجموعه ی A است؟ در مجموعه های فازی جواب درست یا غلط نداریم بلکه درجه عضو داریم که با زوج مشخص می شود. مقدار درجه عضویت بین صفر و یک است و هرچه بیشتر باشد میزان عضویت آن عنصر به مجموعه بیشتر خواهد بود. مجموعه های فازی را می توان به شکل های مثلثی، ذوزنقه ای، گاوسی و غیره نمایش داد. شکل زیر نشان دهنده ی تابع عضویت ذوزنقه می باشد که اعضای آن (Low(Bad) ، Medium(Normal و (High(Good می باشد. این مقادیر می تواند شامل موارد جدول زیر این مطلب را نشان می دهد(۱).
عدد فازی، مقداری است که بیانگر عددی در محدوده عدد می باشد. شکل زیر یک نمایش از مجموعه فازی ذوزنقه است که بر طبق اعداد فازی (a, b, c, d) و برطبق تابع عضویت در فرمول زیر نشان داده شده است.
شکل زیر نمایش فازی ذوزنقه ای را نشان می دهد.
نمایش داده های فازی ذوزنقه ای(۱)
سیستم فازی دارای دو قسمت اصلی می باشد: فازی سازی یا وارد کردن اعداد و معیارها و اندازه ها غیرفازی به سیستم فازی. به عنوان مثال شکل زیر نشان دهنده ی فازی سازی رطوبت است.
غیرفازی سازی که به عنوان خروجی سیستم فازی و تبدیل اعداد فازی به محیط غیرفازی می باشد. توابع عضو برای فازی سازی رطوبت(۱)