آشنایی با Data Mining و کاربرد آن

دوشنبه 29 مرداد 1397

Data Mining از دسته پدیده های بسیار قدرتمند در زمینه استخراج اطلاعات معنادار در سازمان های بزرگ است. با وجود Data Mining میزان خطا به حداقل می رسد.

 آشنایی با Data Mining و کاربرد آن

داده کاوی که نام علمی آن Data Mining است از دسته موضوعات بسیار پر کاربرد در عرصه مدیریت و البته اقتصاد محسوب می شود. به کمک سیستم های اطلاعات و وجود نرم افزارهایی که بر اساس پایگاه داده فعالیت می کنند در سازمان های بزرگ امکان ذخیره سازی حجم انبوهی از داده ها وجود دارد. Data Mining به فرآیندی گفته می شود که می توانید اطلاعات معنا دار را از پشته های داده استخراج کند. در این روش دانش بر اساس شناسایی الگوها کشف می شود و این موضوع سبب می شود که مدل سازی به طور دقیق صورت پذیرد

معرفی Data Mining

داده کاوی به روش هایی گفته می شود که با استفاده از آنها می توان الگوهای مفیدی را برآورد سازی کرد به صورتی که میزان دخالت کاربران در آن به حداقل برسد به این صورت اطلاعات مورد نیاز در اختیار تحلیل گر و یا کاربر قرار می گیرد و این موضوع سبب می شود که تصمیم گیری برای سازمان های بزرگ آسانتر شود. بنابراین به زبانی دیگر در داده کاوی داده ها به صورت اکتشافی مورد تحلیل قرار می گیرد و این روند سبب می شود که یک سری از اطلاعات نهفته و یا ناشناخته مشخص شود. در سازمان هایی که حجم داده بیش بوده و روابط بین آنها گسترده باشد قطعاً اهمیت Data Mining بیشتر خواهد بود.

گام های اولیه Data Mining

در بسیاری از مواقع دیده شده است که اولین گام برای داده کاوی خوشه بندی است. این روش قبل از فرآیندهای دیگر برای شناسایی گروهی از عناصر مورد استفاده قرار می گیرد. در نظر داشته باشید که هدف از خوشه بندی تقسیم دقیق داده ها است. در واقع در هر گروه  داده ها باید رفتارهای مشابه داشته باشد و بین دو خوشه از داده باید حداکثر میزان تفاوت وجود داشته باشد. برای خوشه بندی روش های مختلفی وجود دارد. به طور کلی طبق تخمین های موجود میزان داده ها به طور سالانه دو برابر می شود و این روند هزینه ذخیره سازی داده ها را تحت تأثیر قرار می دهد وجود ابزارهای Data Mining سبب می شود که این هزینه ها به حداقل برسد. به طور کلی داده کاوی در دو دسته خصوصی و عمومی فعالیت می کند. در سازمان ها داده کاوی یک ابزار قدرتمند برای کاهش تقلب محسوب می شود و همینطور در لاین تحقیقات پزشکی نیز دارای سهم بزرگی است. برای داشتن یک Data Mining استاندارد باید کیفیت داده هایی که قرار است تحلیل شود بسیار مهم است. در نظر داشته باشید که Data Mining یک سری محدودیت های امینتی نیز وجود دارد که بسیار مهم و ضروری است.

محدودیت های Data Mining

می دانیم که Data Mining یک ابزار بسیار قدرتمند محسوب می شود اما شاید در نوع کاربردی خود کافی به نظر نرسد. برای اینکه Data Mining به طور دقیق به موفقیت برسد نیاز به تحلیل گران بسیار حرفه ای است و قطعاً باید متخصصان ماهر برای این کار وجود داشته باشید تا ترکیب های خروجی به طور دقیق تفسیر و تحلیل شود. بنابراین مهم ترین محدودیت های Data Mining در خصوص داده های اولیه و همینطور افراد است. داده کاوی یک کمک بزرگ برای الگوهای اولیه و روابط آنها است. از دیگر محدودیت هایی که در Data Mining دیده می شود تشخیص رابطه ها بیم رفتار و متغیر است و بارها دیده شده است یک رابطه و یا رفتار را به طور دقیق تشخیص نمی دهد.

کاربرد Data Mining اغلب در هوش تجاری است و در لاین های انبار داده و همینطور داده کاوی بسیار مورد استفاده قرار می گیرد. در سازمان های بزرگ ارزش حیات مشتری و همینطور بررسی و تحلیل مشتریان سودآور به کمک داده کاوی فراهم شده است.

Data Mining به روش RFM  و LRFM

در مدل RFM باید تفاوت های رفتاری بین مشتریان مورد بررسی قرار بگیرد و برای این کار سه متغیر تازگی، تکرار و مبلغ خرید وجود دارد.

متغیر اول که تازگی نام نهاده است و با R نمایش داده می شود در واقع نشان می دهد که مدت زمان بین آخرین تعامل تجاری و همینطور زمان حال چقدر بوده است و هرچه این زمان کمتر باشد ارزش متغیر R افزایش می یابد.

متغیر شماره دوم در خصوص تکرار خرید است و آن را با حروف F نشان می دهیم به این ترتیب این متغیر در خصوص تعداد تکرار خرید اطلاعاتی را ارائه می دهد، یعنی تعداد تراکنش ها را در یک بازه زمانی مشخص نشان می شود مثلا دو بار در ماه، در سال و ... و هرچه تعداد تکرار بیشتر باشد ارزش F بیشتر خواهد بود.

در خصوص متغیر شماره سه که برای ارزش پولی خرید و با حروف M نمایش داده می شود هدف اصلی نمایش ارزش پول صرف شده از سوی مشتری در تعاملات خاص است. در نظر داشته باشید که بیشتر بودن مقدار پول به معنی افزایش M است.

هرچه میزان R و F بیشتر باشد  احتمال وجود تراکنش جدید نیز بیشتر خواهد بود.

جمع بندی

به طور کلی DataMining بر اساس الگو پیش می رود و طبق روند الگویی مشخص می تواند نتیجه گیری مناسبی داشته باشد. مزایای  Data Mining آنقدر زیاد است که بدون وجود آن قطعاً سازمان های بزرگ در کار خود دچار اختلالات بسیاری می شوند.

 

برنامه نویسان

نویسنده 3355 مقاله در برنامه نویسان

کاربرانی که از نویسنده این مقاله تشکر کرده اند

در صورتی که در رابطه با این مقاله سوالی دارید، در تاپیک های انجمن مطرح کنید