مبانی نظری و پیشینه تحقیق برای فصل دوم پایان نامه استفاده از رویکرد داده کاوی پویا برای بخش بندی مشتریان به خوشه های رفتاری به جهت تحلیل رفتار مشتریان
مبانی نظری و پیشینه تحقیق برای فصل دوم پایان نامه استفاده از رویکرد داده کاوی پویا برای بخش بندی مشتریان به خوشه های رفتاری به جهت تحلیل رفتار مشتریان
۲٫۲ دادهکاوی
دادهکاوی به معنای يافتن نيمه خودکار الگوهای پنهان موجود در مجموعه دادههای موجود می باشد. دادهکاوی از مدل های تحليلی ، کلاس بندی و تخمين و برآورد اطلاعات و ارائه نتايج با استفاده از ابزارهای مربوطه بهره می گيرد. میتوان گفت که داده کاوی در جهت کشف اطلاعات پنهان و روابط موجود در بين دادههای فعلی و پيشبينی موارد نا معلوم و يا مشاهده نشده عمل میکند. برای انجام عمليات دادهکاوی لازم است قبلا روی دادههای موجود پيشپردازش هايی انجام گيرد. عمل پيش پردازش اطلاعات خود از دو بخش کاهش اطلاعات و خلاصهسازی و کلیسازی دادهها تشکيل شده است. کاهش اطلاعات عبارت است از توليد يک مجموعه کوچک تر، از دادههای اوليه، که تحت عمليات دادهکاوی نتايج تقريبا يکسانی با نتايج دادهکاوی روی اطلاعات اوليه به دست دهد. پس از انجام عمل کاهش اطلاعات و حذف خصايص غير مرتبط نوبت به خلاصهسازی و کلیسازی دادهها می رسد. دادههای موجود در بانکهای اطلاعاتی معمولا حاوی اطلاعات در سطوح پايينی هستند، بنابراين خلاصهسازی مجموعه بزرگی از دادهها و ارائه آن به صورت يک مفهوم کلی اهميت بسيار زيادی دارد. کلیسازی اطلاعات، فرآيندی است که تعداد زيادی از رکوردهای يک بانک اطلاعاتی را به صورت مفهومی در سطح بالاتر ارائه می نمايد (هان و کمبر[۱]، ۲۰۱۶).
در دادهکاوی ، چهار عمل اصلی انجام می شود که عبارتند از:
مدلسازی پیشگویی کننده ، تقطیع پایگاه داده ها ، تحلیل پیوند ، تشخیص انحراف.
از عملیاتهای اصلی مذکور ، یک یا بیش از یکی از آنها در پیادهسازی کاربردهای گوناگون داده کاوی استفاده می شوند.
نگاهی به ترجمه تحت اللفظی داده کاوی، به ما به درک بهت این واژه کمک می کند. Mine به معنای استخراج از منابع نهفته و با ارزش زمین اتلاق می شود. پیوند این کلمه با کلمه داده، جستجوی عمیق جهت پیدا کردن اطلاعات اضافی مفید که قبلا نهفته بودند، از دادههای قابل دسترس حجیم، را پیشنهاد می کند. دادهکاوی یک رشته نسبتا جدید علمی می باشد که از انجام تحقیقات در رشتههای آمار، یادگیری ماشینی، علوم کامپیوتر خصوصا مدیریت پایگاه داده شکل گرفته است (برسون و همکاران[۲]، ۲۰۱۷).
تعاریف متنوعی از دادهکاوی در مراجع مختلف و توسط افراد مختلف ارائه شده است از جمله:
- دادهکاوی فرایند شناخت الگوهای معتبر، جدید، ذاتا مفید و قابل فهم از دادهها می باشد.
- دادهکاوی (کشف دانش از پایگاه داده ها نامیده می شود) نشانگر فرایند جالب استخراج دانش از قبل ناشناخته (الگو) از داده است .
- اصطلاح دادهکاوی به فرایند نیم خودکار تجزیه و تحلیل پایگاه دادههای بزرگ به منظور یافتن الگوهای مفید اطلاق می شود (ساندر[۳]، ۲۰۱۷).
- فرایند کشف الگوهای مفید از دادهها را دادهکاوی می گویند.
- فرایند انتخاب، کاوش و مدل بندی دادههای حجیم، جهت کشف روابط نهفته با هدف به دست آوردن نتایج واضح و مفید، برای مالک پایگاه دادهها را، دادهکاوی گویند.
اما تعریفی که در اکثر مراجع به صورت مشترک ذکر شده عبارت است از ” استخراج اطلاعات و دانش و کشف الگوهای پنهان از پایگاه دادههای بسیار بزرگ و پیچیده”.
دادهکاوی فرایندی است که از ابزارهای تحلیلی گوناگون برای کشف الگوها و روابط بین دادهها استفاده می کند که ممکن است برای اعتبار بخشیدن به پیش بینی استفاده شود (بری و لینوف[۴]،۱۹۹۷).
دادهکاوی یک متدولوژی بسیار قوی و با پتانسیل بالا می باشد که به سازمان کمک می کند که بر روی مهمترین اطلاعات از مخزن دادههای خود تمرکز نمایند.
دادهکاوی کمک می کند تا سازمانها با کاوش بر روی دادههای یک سیستم، الگوها ، روندها و رفتارهای آینده را کشف و پیش بینی کرده و بهتر تصمیم بگیرند. دادهکاوی با استفاده از تحلیل وقایع گذشته یک تحلیل اتوماتیک و پیش بینانه ارائه می نماید و به سوالاتی جواب می دهد که پاسخ آنها در گذشته ممکن نبوده و یا به زمان زیادی نیاز داشت.
ابزارهای دادهکاوی الگوهای پنهانی را کشف و پیش بینی می کنند که متخصصان ممکن است به دلیل اینکه این اطلاعات و الگوها خارج از انتظار آن ها باشد، آن ها را مدنظر قرار ندهند و به آنها دست نیابند.[۵]
شکل(۱٫۲) : روشهای دادهکاوی[۶]
۳٫۲ خوشهبندی
خوشهبندی به عنوان یکی از فعالیتهای دادهکاوی میباشد و به گروهبندی کردن تراکنشها و مشاهدات یا حالتها درکلاسهای مشابه می پردازد. همچنین یک خوشه مجموعهای از رکوردها است که به هم شبیه می باشند و از رکوردهای بیرون خوشه تفاوت دارند. در خوشهبندی متغیر هدف وجود ندارد و به طبقهبندی تخمین و پیشگوئی مقدار متغیر هدف نمی پردازد (لاروس[۷]، ۲۰۱۷).
خوشهبندی یکی از شاخههای یادگیری بدون نظارت می باشد و فرآیند خودکاری است که در طی آن، نمونهها به دستههایی که اعضای آن مشابه یکدیگر می باشند تقسیم می شوند که به این دستهها خوشه گفته میشود. بنابراین خوشه مجموعهای از اشیاء می باشد که در آن اشیاء با یکدیگر مشابه بوده و با اشیاء موجود در خوشههای دیگر غیر مشابه می باشند. برای مشابه بودن می توان معیارهای مختلفی را در نظر گرفت مثلا می توان معیار فاصله را برای خوشهبندی مورد استفاده قرار داد و اشیائی را که به یکدیگر نزدیکتر هستند را بعنوان یک خوشه در نظر گرفت که به این نوع خوشهبندی، خوشهبندی مبتنی بر فاصله نیز گفته می شود. بعنوان یک مثال شکل زیر را در نظر بگیرید در این شکل هر یک از دایرههای کوچک یک وسیله نقلیه (شیء) را نشان می دهد که با ویژگیهای وزن و حداکثر سرعت مشخص شده اند.
…..
…..
دیدگاهی بنویسید