داده کاوی فرآیند کشف و تحلیل حجم بزرگی از دادهها با استفاده از روش های آماری و ریاضی میباشد. داده کاوی به معنای استفاده از ابزار تحلیل داده برای کشف ناشناخته ها، الگوهای معتبر و روابط مجموعه های بزرگ داده است. جهت پیش بینی در علم داده کاوی از تحلیل در داده های موجود جهت کشف دانش استفاده میکنیم. شکل ۱ این مطلب را نشان میدهد.

داده کاویمسئله پیشگویی، شامل طبقه بندی داده میباشد. یکسری گروه(طبقه) از قبل تعیین شده موجود است و باید به نمونه ی جدید یک یا چند گروه را نسبت داده شود. جهت پیشگویی نیاز به مجموعه ی دادهای است که شامل تعدادی سطر و تعدادی ستون باشد و در یک ماتریس(صفحه گسترده) نمایش داده می شود. در کلاسبندی، یک ستون اضافه بنام کلاس به ماتریس اضافه میشود که شامل کلاس های صحیحی است که هر نمونه ی آموزشی[1] در مجموعه داده دارد. برچسب ها میتوانند از نوع صحیح/غلط و یا 0/1 و یا نام طبقه(گروه) باشند.
همچنین مطالب زیر را بخوانید:
سمینار کارشناسی ارشد| هدایت شبکه خودرویی با رویکرد ترکیبی داده کاوی به منظور کنترل ترافیک
کارشناسی ارشد| فایل لاتکس| بررسی تشخیص بیماری به کمک ترکیب الگوریتمهای تکاملی و تکنیکهای داده کاو
[1] Training Set