در تحقیقات بازاریابی که در چند سال اخیر بیشتر مورد توجه قرار گرفته است، داده کاوی نقش مهمی دارد. یک سری مطالعات در فروشگاههای آمریکا صورت گرفته و نتیجه به این شکل بود که مردم در این کشور وقتی برای خرید شیر وارد یک مغازه میشوند، ناخودآگاه اقدام به خرید نان هم میکنند. این روال سبب شد تا مشتریان به خرید محصولات دیگر نیز تشویق شوند، بنابراین فاصلهای بین قرار گیری نان و شیر در فروشگاه گذاشته شد تا کالاهای کم مصرف در این میان در دسترس قرار بگیرد و در جلوی دید مشتریان باشد. این روال سبب شد تا میزان فروش این کالاها بیشتر شود. علم داده کاوی دقیقاً نمونهای از همین مثال است!
معرفی داده کاوی در یک نگاه
شرکتها یک سری خدمات به مشتریان ارائه میدهند و با آنها ارتباط مستمر برقرار میکنند. از سوی دیگر اطلاعات زیادی از مشتریان به دست میآورند و این موضوع سبب میشود که دادههای زیادی برای تحلیل رفتار مشتری در دست داشته باشد که تحلیل درست آنها، شرکت را به سودآوری بیشتر میرساند.
داده کاوی در واقع یک روش است، یک روش که قرار است به واسطه آن مسئلهای حل شود. این روش بر روی حجم زیادی از دادهها کار میکند و تحلیل مورد نیاز را انجام میدهد، در نهایت یک سری الگوهای تکرارشونده استخراج میشود که میتواند برگ برنده باشد. سپس نوبت به پیدا کردن ارتباطات بین الگوهای مختلف است و در نهایت یک سری راه حلهای مهم در این چالش وارد میشوند.
دنیای امروز، دنیای ارتباطات است، ارتباط بین مکان و زمانهای مختلف به طوری که اغلب موارد در بستر مجازی دنبال میشود. اطلاعاتی که قرار است از مشتریانی اخذ شود که شاید هرگز دیده نشوند و یک نعمت بزرگ برای شرکتها محسوب میشوند و اهمیت زیادی دارند.
داده کاوی بر روی یک سری اطلاعات کار میکند که در نگاه اول احتمالاً کاربرد زیادی نخواهد داشت اما وقتی پژوهشهای دقیق صورت میگیرد نتایج بدست آمده بسیار ارزشمند میشود.
داده کاوی یک علم قوی است که میتواند به همه بخشها نفوذ داشته باشد، در دل اطلاعات برود و پاسخ به همه سوالاتی باشد که ایجاد میشود. این علم در شرکتهای بزرگ آنقدر مهم و شناخته شده است که بسیاری از برنامهریزیها بر اساس آن صورت میگیرد. به عنوان مثال پیش از طراحی یک پروژه پرهزینه نیاز است که اطلاعات زیادی در مورد این پروژه مورد بررسی قرار گیرد تا بهترین تصمیم برای نحوه اجرای پروژه یا عدم اجرای آن گرفته شود.
مزایای استفاده از داده کاوی در شرکتها
شرکتهای بزرگی که از داده کاوی استفاده میکنند سعی میکنند این رویکرد را برای تحلیل رقبا و بازار در نظر بگیرند و به واسطه این روش پیشبینی خوبی بر روی ترندهای روز خواهند داشت. از سوی دیگر برنامههایی که توسط این شرکتها برای آینده در نظر گرفته میشود هم جهت با خواسته عموم افراد است و این روال سبب میشود موقعیت پیشی گرفتن از رقبا آسانتر شود.
داده کاوی در زمینههای علمیو سلامت و سیاست و همینطور اقتصاد نیز ورود کرده است. در واقع دادهها در بسیاری از مسائل ورود داشتهاند. در دنیای سخت و بیرحم کرونایی، داده کاوی توانست الگوهای جدید دارویی را کشف نماید. داده کاوی در دنیای بورس وارد شده است و توانسته رشد خوبی ایجاد نماید.
یکی از مهمترین مزایای داده کاوی در شناخت مشتریان سودآور است که شرکتها تاکید زیادی بر روی این موضوع دارند. در هر مجموعه فروشگاهی یا شرکتی، برخی از مشتریان سودآوری خوبی برای شرکت دارند و این رویکرد سبب میشود که شناسایی مشتریان به درستی صورت بگیرد و از سوی دیگر وفاداری مشتریان نیز به طور دقیق دنبال شود. از سوی دیگر این روش سبب میشود که سبد محصول بهینهسازی شود. یعنی محصولات پرفروش شناسایی شود و همین طور محصولاتی که سودآوری خوبی دارند نیز بررسی شود. پس از آن یک سری محصولات زیان ده میبایست از سایر محصولات جداگانه بررسی شود. این روش میتواند به نسبت سایر سبد محصولات شرایطی ایجاد نماید.
از سوی دیگر شناخت مشتریان وفادار و قدیمی بخش مهمی از رویکرد داده کاوی است. دیتا ماینینگ سبب میشود تا متوجه شوید که مشتریان قدیمی چه کسانی هستند و برنامه خریدشان به چه صورت است. همینطور متوجه خواهید شد که کالاهای مورد علاقه این مشتریان چیست و چه کالاهایی سبب وفاداری آنها میشود.
طول عمر مشتری بررسی میشود به طوری که طول عمر مشتری و چرخه آن ارزیابی میشود و میزان سودی که از هر مشتری عاید شرکت میشود ارزیابی خواهد شد.
بررسی رفتارهای مشتری موضوع مهمی است که در علم داده کاوی دیده میشود. به هر صورت این علم سبب میشود که شناسایی رفتار مشتریان به درستی دنبال شود و برخی از ویژگیهای مشتریان تطابق داده شود. همینطور بخش بندی و قسمتبندی بازار نیز موفقیت آمیز باشد.
بخشبندی مهم داده کاوی
فرایند داده کاوی بخشهای مختلفی دارد و شاید صحبت در مورد آن زمان و حوصله زیادی نیاز داشته باشد اما موضوع از این قرار است که این علم به طور خلاصه سه بخش مهم را در بر میگیرد.
۱- بخش اول: استخراج دادهها از بخشهای مختلف و انتقال آنها در پایگاههای دادهای که قابلیت چند بعدی داشته باشند و در ذخیره سازی اطلاعات مهمیکه در آینده مورد استفاده قرار میگیرد.
۲- بخش دوم: انتقال دادهها به لایههای مختلف از جمله لایههای کسب و کار که بر اساس نرم افزار داده کاوی دنبال میشود.
۳- بخش سوم: تحلیل دادهها، نمایش نتایج حاصل از تحلیل داده که اغلب به صورت فرم ساده یا در گراف و نمودار ارزیابی میشود.
حال قصد داریم در مورد کلمات مهمیکه در این علم استفاده میشود صحبت کنیم:
منظور از دیتا در علم داده کاوی میتواند یک سری دادههایی باشد که توسط مردم و در ارتباطات روزمره کسب شده است، میتواند شامل یک سری پیش بینیها و احتمالات باشد و یا دادههای منطقی باشد که در پایگاه دادهها به ذخیره سازی رسیده است.
هر دادهای که دریافت شود نیاز به پیش پردازش و پس پردازش دارد و این قدم بسیار مهم است. مشخص است که در نهایت باید دادهها به وضعیت پیادهسازی برسند و برای پیاده سازی میبایست الگوریتم مناسبی استفاده شود که موقعیت داده کاوی را به خوبی میسنجد. الگوریتمهایی که در این راستا استفاده میشوند اغلب شامل کلاسبندی، خوشهبندی و یا یک سری الگوهای یادگیری تقویتی هستند که میتوانند ارتباطی که بین دادهها وجود دارد، را به طور دقیق ارزیابی کنند.
هر تکنیکی که برای داده کاوی استفاده میشود سبب میشود تا سرعت انجام محاسبات بیشتر شود و از سوی دیگر فضای مورد نیاز برای حافظه نیز بهبود داشته باشد.

تکنیکهای داده کاوی
در ادامه سه تکنیک مهم در راستای داده کاوی را بررسی میکنیم.
تکنیک طبقه بندی: طبقه بندی که به آن classification گفته میشود، یکی از روشهای مهم داده کاوی محسوب میشود. این الگوریتم از روش برچسب زنی دادهها استفاده میکند. به طوری که هر داده بر اساس ویژگی که برای آن تعریف شده است برچسب گذاری میشود و همینطور در کلاسهای مختلفی قرار میگیرد. این الگوریتمها خودآموز هستند یعنی روشهای جدید برچسب گذاری را یاد میگیرند و طبق همین ویژگی میتوانند یک سری نمونههای جدید را برچسب بزنند. این تکنیک از داده کاوی مبتنی بر یادگیری است که یک سری مدلهای خوب بر روی دادههای جدید را اعمال میکند و پس از آن گروهبندی مشتریان به درستی صورت میگیرد.
تکنیک خوشهبندی: خوشهبندی یا کلاستر از دیگر تکنیکهایی است که در علم داده کاوی اهمیت زیادی دارد. این روش به صورتی است که ذات داده اهمیت زیادی در آن دارد و گروهبندی بر اساس ذات دادهها صورت میگیرد. هر دادهای که در یک گروه قرار میگیرد با ذات اصلی همه اعضای گروه همخوانی دارد. این تکنیک فروشگاههای مختلف اجرا میشود، مثلاً یک گروه شامل مشتریانی هستند که علاقه به خرید با قیمت کم اما دفعات زیاد دارند و گروهی دیگر نیز افرادی هستند که کم خرید میکنند اما بهترینها را انتخاب میکنند.
تکنیک یادگیری تقویتی: این روش به صورتی دنبال میشود که الگوریتم سعی میکند اطلاعات و عملیاتی با محیط پیرامون ایجاد نماید و سعی به کشف اطلاعات داشته باشد و به همینطور منظور یادگیری خود را نیز پیوستهتر دنبال کند. در این روش شبیهسازی بسیار دیده میشود.
کاربردی داده کاوی در دنیای امروز
یکی از کاربردهای مهم داده کاوی در زمینه تحقیقات جنایی و بخش جرمشناسی است. این علم سبب شده تا بررسی درستی بین ارتباطات حوادث جنایی صورت بگیرد و در نهایت اقداماتی بر اساس این تحلیل داده برای پیشگری از جرم صورت گیرد. به عنوان مثال این علم سبب شده تا رویکرد درستی در زمینه شناسایی الگوریتمهای حملات بانکی ارائه شود در فضای الکترونیکی بانکی بسیار مورد توجه قرار گرفته است.
این علم در فضای ساخت و ساز عمران و معماری بسیار مورد توجه قرار گرفته است به طوری که الگوهای بهینهسازی شهری شناخته شده است و شرایط برای افزایش جمعیت به درستی بررسی شده و در نهایت ساخت و ساز نیز در مبنای رشد جمعیت دنبال میشود.
استفاده از داده کاوی در دنیای آموزش نیز موضوعی تاثیر گذار بود و موجب شد تا سیستم آموزشی به کیفیت بهتری دست یابد و همینطور الگوهای تحصیل در بین دانش آموزان به شکل صحیحی دنبال شود.
از طرف دیگر مدیریت ارتباطات با مشتری در دنیای حقیقی و مجازی توسط علم داده کاوی سبب شد تا روابط مشتریان با شرکت بهبود پیدا کند، الگوهای بهرهوری مشخص شود و در نهایت این رویکرد به رشد شرکت دست یابد.
تاثیر داده کاوی در شناسایی عیوب
یکی از کاربردهای مهمی که داده کاوی در دنیای امروزه دارد شناسایی عیب و نقص است. البته که این موضوع در لیست اولین حوزههای داده کاوی است. به طوری که الگوهای مختلفی شناسایی میشود و بر روی الگویی که منجر به خرابی میشود، تمرکز بیشتر میشود تا از شیوههایی استفاده شود که محصولات معیوب را به خوبی شناسایی کند. این روش بخشی از پارامترهای مهم و تاثیرگذار بر کیفیت خواهد بود.
بخشی از این کاربردها مربوط به کنترل کیفیت، تعیین طرح کنترل کیفی، شناسایی نوع و میزان خرابی، شناسایی مکانیزمهایی که سبب خرابی قطعات مکانیکی میشود. عواملی که کیفیت را بهبود میدهد. شناسایی احتمال خرابیها و مهندسی کیفیت که بخش مهمی از این روال را مدنظر قرار میدهد.
شرکتهای بیمه امروزه تکنیکهای تحلیلی مختلفی را برای داده کاوی در نظر میگیرند به طوری که سبب میشود مشکلات پیچیدهای در رابطه با تقلب و سایر بخشهای مدیریت ریسک ارزیابی شود و مشتری در وضعیت سقوط قرار نگیرد. این شرکتها یک سری تکنیکهای داده کاوی را دنبال میکنند که در خطوط کسب و کار ارزیابی میشود. روشهای جدیدی نیز وجود دارد که برای ارائه محصولات رقابتی بسیار مهم هستند و وجود مشتریان را در بر میگیرد. مشخص است که این علم در دنیای تحصیلات نیز برای رفع خطا گزینه خوبی محسوب میشود و یک سری راهبردهای مداخله ای را برای نگه داشتن در مسیر فراهم میسازد. داده کاوی برای دنیای ساخت و ساخت بر اساس تقاضاهای ضروری و غیر ضروری دنبال میشود و مشخص است که همه این موارد میتوانند ساختار مشخصی داشته باشد و یک رویکرد واقعی و قابل قبول خواهد بود. دیتا ماینینگ در شاخههای علم پزشکی نیز به عنوان یک ابزار شناسایی خطا اعلام شده است.