مبانی نظری و پیشینه تحقیق برای فصل دوم پایان نامه استفاده از رویکرد داده کاوی پویا برای بخش بندی مشتریان به خوشه های رفتاری به جهت تحلیل رفتار مشتریان

مبانی نظری و پیشینه تحقیق برای فصل دوم پایان نامه استفاده از رویکرد داده کاوی پویا برای بخش بندی مشتریان به خوشه های رفتاری به جهت تحلیل رفتار مشتریان

 

۲٫۲ داده­کاوی

داده­کاوی به معنای يافتن نيمه خودکار الگوهای پنهان موجود در مجموعه داده­های موجود می باشد. داده­کاوی از مدل های تحليلی ، کلاس بندی و تخمين و برآورد اطلاعات و ارائه نتايج با استفاده از ابزارهای مربوطه بهره می گيرد. می­توان گفت که داده کاوی در جهت کشف اطلاعات پنهان و روابط موجود در بين داده­های فعلی و پيش­بينی موارد نا معلوم و يا مشاهده نشده عمل می­کند. برای انجام عمليات داده­کاوی لازم است قبلا روی داده­های موجود پيش­پردازش هايی انجام گيرد. عمل پيش پردازش اطلاعات خود از دو بخش کاهش اطلاعات و خلاصه­سازی و کلی­سازی داده­ها تشکيل شده است. کاهش اطلاعات عبارت است از توليد يک مجموعه کوچک تر، از داده­های اوليه، که تحت عمليات داده­کاوی نتايج تقريبا يکسانی با نتايج داده­کاوی روی اطلاعات اوليه به دست دهد. پس از انجام عمل کاهش اطلاعات و حذف خصايص غير مرتبط نوبت به خلاصه­سازی و کلی­سازی داده­ها می رسد. داده­های موجود در بانک­های اطلاعاتی معمولا حاوی اطلاعات در سطوح پايينی هستند، بنابراين خلاصه­سازی مجموعه بزرگی از داده­ها و ارائه آن به صورت يک مفهوم کلی اهميت بسيار زيادی دارد. کلی­سازی اطلاعات، فرآيندی است که تعداد زيادی از رکوردهای يک بانک اطلاعاتی را به صورت مفهومی در سطح بالاتر ارائه می نمايد (هان و کمبر[۱]، ۲۰۱۶).

در داده­کاوی ، چهار عمل اصلی انجام می شود که عبارتند از:

مدلسازی پیشگویی کننده ، تقطیع پایگاه داده ها ، تحلیل پیوند ، تشخیص انحراف.

از عملیات­های اصلی مذکور ، یک یا بیش از یکی از آنها در پیاده­سازی کاربردهای گوناگون داده کاوی استفاده می شوند.

نگاهی به ترجمه تحت اللفظی داده کاوی، به ما به درک بهت این واژه کمک می کند. Mine به معنای استخراج از منابع نهفته و با ارزش زمین اتلاق می شود. پیوند این کلمه با کلمه داده، جستجوی عمیق جهت پیدا کردن اطلاعات اضافی مفید که قبلا نهفته بودند، از داده­های قابل دسترس حجیم، را پیشنهاد می کند. داده­کاوی یک رشته نسبتا جدید علمی می باشد که از انجام تحقیقات در رشته­های آمار، یادگیری ماشینی، علوم کامپیوتر خصوصا مدیریت پایگاه داده شکل گرفته است (برسون و همکاران[۲]، ۲۰۱۷).

تعاریف متنوعی از داده­کاوی در مراجع مختلف و توسط افراد مختلف ارائه شده است از جمله:

  1. داده­کاوی فرایند شناخت الگوهای معتبر، جدید، ذاتا مفید و قابل فهم از داده­ها می باشد.
  2. داده­کاوی (کشف دانش از پایگاه داده ها نامیده می شود) نشانگر فرایند جالب استخراج دانش از قبل ناشناخته (الگو) از داده است .
  3. اصطلاح داده­کاوی به فرایند نیم خودکار تجزیه و تحلیل پایگاه داده­های بزرگ به منظور یافتن الگوهای مفید اطلاق می شود (ساندر[۳]، ۲۰۱۷).
  4. فرایند کشف الگوهای مفید از داده­ها را داده­کاوی می گویند.
  5. فرایند انتخاب، کاوش و مدل بندی داده­های حجیم، جهت کشف روابط نهفته با هدف به دست آوردن نتایج واضح و مفید، برای مالک پایگاه داده­ها را، داده­کاوی گویند.

اما تعریفی که در اکثر مراجع به صورت مشترک ذکر شده عبارت است از ” استخراج اطلاعات و دانش و  کشف الگوهای پنهان از پایگاه داده­های بسیار بزرگ و پیچیده”.

داده­کاوی فرایندی است که از ابزارهای تحلیلی گوناگون برای کشف الگوها و روابط بین داده­ها استفاده می کند که ممکن است برای اعتبار بخشیدن به پیش بینی استفاده شود (بری و لینوف[۴]،۱۹۹۷).

داده­کاوی یک متدولوژی بسیار قوی و با پتانسیل بالا می باشد که به سازمان کمک می کند که بر روی مهمترین اطلاعات از مخزن داده­های خود تمرکز نمایند.

داده­کاوی کمک می کند تا سازمان­ها با کاوش بر روی داده­های یک سیستم، الگوها ، روندها و رفتارهای آینده را کشف و پیش بینی کرده و بهتر تصمیم بگیرند. داده­کاوی با استفاده از تحلیل وقایع گذشته یک تحلیل اتوماتیک و پیش بینانه ارائه می نماید و به سوالاتی جواب می دهد که پاسخ آن­ها در گذشته ممکن نبوده و یا به زمان زیادی نیاز داشت.

ابزارهای داده­کاوی الگوهای پنهانی را کشف و پیش بینی می کنند که متخصصان ممکن است به دلیل اینکه این اطلاعات و الگوها خارج از انتظار آن ها باشد، آن ها را مدنظر قرار ندهند و به آن­ها دست نیابند.[۵]

شکل(۱٫۲) : روش­های داده­کاوی[۶]

۳٫۲ خوشه­بندی  

خوشه­بندی به عنوان یکی از فعالیت­های داده­کاوی میباشد و به گروه­بندی کردن تراکنش­ها و مشاهدات یا حالت­ها درکلاس­های مشابه می پردازد. همچنین یک خوشه مجموعه­ای از رکوردها است که به هم شبیه می باشند و از رکوردهای بیرون خوشه تفاوت دارند. در خوشه­بندی متغیر هدف وجود ندارد و به طبقه­بندی تخمین و پیشگوئی مقدار متغیر هدف نمی پردازد (لاروس[۷]، ۲۰۱۷).

خوشه­بندی یکی از شاخه­های یادگیری بدون نظارت می باشد و فرآیند خودکاری است که در طی آن، نمونه­ها به دسته­هایی که اعضای آن مشابه یکدیگر می با­شند تقسیم می شوند که به این دسته­ها خوشه گفته می­شود. بنابراین خوشه مجموعه­ای از اشیاء می باشد که در آن اشیاء با یکدیگر مشابه بوده و با اشیاء موجود در خوشه­های دیگر غیر مشابه می باشند. برای مشابه بودن می توان معیارهای مختلفی را در نظر گرفت مثلا می توان معیار فاصله را برای خوشه­بندی مورد استفاده قرار داد و اشیائی را که به یکدیگر نزدیک­تر هستند را بعنوان یک خوشه در نظر گرفت که به این نوع خوشه­بندی، خوشه­بندی مبتنی بر فاصله نیز گفته می شود. بعنوان یک مثال شکل زیر را در نظر بگیرید در این شکل هر یک از دایره­های کوچک یک وسیله نقلیه (شیء) را نشان می دهد که با ویژگی­های وزن و حداکثر سرعت مشخص شده اند.

…..

…..

مراحل خرید فایل دانلودی
اگر محصول را می پسندید لطفا آنرا به اشتراک بگذارید.

دیدگاهی بنویسید

13 − پنج =

0