دنیای دیجیتال ما که به سرعت در حال رشد است، بسیاری از اصطلاحات و مفاهیم جدید را رواج داده است که به راحتی میتوان برای فهم آنها تحت فشار قرار گرفت یا با هرجومرج ذهنی مواجه شد. این میان افراد درگیر با این اصول، موظف هستند کلمات جدید و گاهی عجیب را به جای یکدیگر استفاده کنند، غافل از اینکه این کلمات گاهی معنای متفاوتی دارند.
به طور خاص، این مسئلهای است که با “داده کاوی (Data Mining)” و “یادگیری ماشین (Machine Learning)” نیز با آن مواجه است. مرز بین این دو اصطلاح به دلیل برخی از ویژگیهای مشترک گاهی غیرقابل تشخیص میشود. برای تمرکز بیشتر بر روی موضوعات، ما قصد داریم تفاوتهای قابل توجه بین دادهکاوی و یادگیری ماشین را بررسی کرده و بفهمیم چگونه هر یک میتوانند برای ما مفید باشند.

نگاهی به تاریخ داده کاوی و یادگیری ماشین
دادهکاوی اختراع جدیدی نیست که با عصر دیجیتال همراه باشد. این مفهوم بیش از یک قرن وجود داشته است، اما در دهه ۱۹۳۰ بیشتر مورد توجه عمومی قرار گرفت. به گفته هکر بیت (Hacker Bits)، یکی از اولین لحظات مدرن استفاده از دادهکاوی در سال ۱۹۳۶ رخ داد، زمانی که آلن تورینگ ایده یک ماشین جهانی را ارائه داد که میتوانست محاسباتی مشابه رایانههای امروزی را انجام دهد.
فوربس همچنین از توسعه تورینگ در “آزمون تورینگ” در سال ۱۹۵۰ برای تعیین اینکه آیا کامپیوتر از هوش واقعی برخوردار است یا خیر، گزارش داد. برای قبولی در آزمون خود، یک کامپیوتر نیاز داشت تا انسان را فریب بدهد تا حدی که او گمان کند با انسان دیگری در ارتباط است.. فقط دو سال بعد، آرتور ساموئل برنامه بازی Samuel Checkers را ایجاد کرد که به نظر میرسید اولین برنامه خودآموزی در جهان است. این برنامه به طور معجزهآسایی هنگام بازی مواردی را یاد گرفت و با مطالعه بهترین حرکات، در روند بازی بهتر شد.
ما از آن زمان راهی طولانی را طی کردهایم. اکنون کسبوکارها در حال استفاده از دادهکاوی و یادگیری ماشین هستند تا از فرآیند فروش خود تا تفسیر منابع مالی برای اهداف سرمایهگذاری بلند مدت و غیره، همه چیز را بهبود بخشند. در نتیجه، دانشمندان داده به کارمندان حیاتی سازمانهای سراسر جهان تبدیل شدهاند زیرا شرکتها به دنبال دستیابی به اهداف بزرگتر از قبل، با علم داده هستند.
داده کاوی چیست؟
دادهکاوی فرایند استخراج اطلاعات مفید از حجم گستردهای از دادهها در نظر گرفته شده. به بیان دیگر، برای کشف الگوهای جدید، دقیق و مفید در دادهها، به دنبال معنی و اطلاعات مربوط به سازمان یا فردی که به آن نیاز دارد، استفاده میشود. این مهم ابزاری است که توسط انسان استفاده خواهد شد.
یادگیری ماشینی چیست؟
از طرف دیگر، یادگیری ماشین فرآیند کشف الگوریتمهایی است که تجربه به دست آمده از دادهها را ارائه میدهد. این مهم طراحی، مطالعه و توسعه الگوریتمهایی است که به ماشینها اجازه میدهد بدون دخالت انسان یاد بگیرند. این ابزار برای هوشمندسازی ماشینآلات مورد استفاده است که باعث حذف عنصر انسانی میشوند.
دادهکاوی در مقابل یادگیری ماشین در مقابل علم داده
اشاره کردیم که با گسترش فراوان استفاده از کلان دادهها (Big data) در دنیای کسبوکار، بسیاری از اصطلاحات جدید با لغت نامه ما اضافه میشوند و طبیعی است که بسیاری از ما معنی آنها را درک نکنیم. ذهن ما پر خواهد شد از سوالاتی از این قبیل که:
- دادهکاوی چیست؟
- آیا تفاوتی بین یادگیری ماشین در مقابل علم داده وجود دارد؟
- چگونه آنها به یکدیگر مربوط میشوند؟
- آیا یادگیری ماشینی فقط هوش مصنوعی نیست؟
همه اینها سوالات خوبی هستند و کشف پاسخهای آنها میتواند درک عمیق و پاداش بخشی از علم داده و تجزیهوتحلیل و چگونگی سودآوری آنها برای یک شرکت را فراهم کند.
دادهکاوی و یادگیری ماشین هر دو ریشه در علم داده دارند و عموما بخشی از زیرموجموعه قرار میگیرند. آنها اغلب با هم تلاقی دارند یا با یکدیگر اشتباه گرفته میشوند، اما چند تمایز اساسی بین این دو وجود دارد. در ادامه این مقاله نگاهی به برخی از تفاوتهای یادگیری ماشین و دادهکاوی و نحوه استفاده از آنها خواهیم داشت.
بررسی تفاوتهای یادگیری ماشین و داده کاوی

استفاده از داده در دادهکاوی
یک تفاوت اساسی بین یادگیری ماشین و دادهکاوی نحوه استفاده و کاربرد آنها در زندگی روزمره است. به عنوان مثال، دادهکاوی اغلب توسط یادگیری ماشین برای دیدن ارتباطات بین روابط مورد استفاده قرار میگیرد. Uber از یادگیری ماشین برای محاسبه ETA یا زمان تحویل غذا برای UberEATS استفاده میکند.
دادهکاوی میتواند برای اهداف مختلفی از جمله تحقیقات مالی مورد استفاده قرار گیرد. سرمایهگذاران ممکن است از دادهکاوی و وب اسکرپینگ (web scraping) استفاده کنند تا به بررسی منابع مالی یک شرکت تازه تأسیس بپردازند و به آنها کمک کنند در بودجهبندی و مسائل مربوط به آنها، پیشرفتی قابل توجهی را به دست آورند. یک شرکت همچنین ممکن است از دادهکاوی برای کمک به جمعآوری اطلاعات مورد نظر درباره روند فروش استفاده کند تا از بخش بازاریابی گرفته تا نیازسنجی موجودی کالا در بازار، مسیر مشخصی را در پیش رو داشته باشد.
از دادهکاوی میتوان برای جمعآوری اطلاعات مشتریان در شبکههای اجتماعی، وبسایتها و داراییهای دیجیتال، برای شروع یک کار تبلیغاتی استفاده کرد. استفاده از دادهکاوی میتواند طی ۱۰ دقیقه منجر به دریافت ۱۰۰۰۰ اطلاعات جدید شود. با این اطلاعات بسیار، یک دانشمند داده حتی میتواند روندهای آینده را پیشبینی کند. با وجود این اطلاعات سازمان مورد نظر میتواند به خوبی برای آنچه مشتری در ماهها و سالهای آینده میخواهد، آماده شود.
استفاده از داده در یادگیری ماشین
یادگیری ماشین دربردارنده اصول دادهکاوی است، اما همچنین میتواند به صورت خودکار همبستگی ایجاد کند و از آنها یاد بگیرد که در الگوریتمهای جدید اعمال شود. این فناوری در پشت اتومبیلهای خودران دیده شده است که میتوانند به سرعت در هنگام رانندگی با شرایط جدید سازگار شوند. یادگیری ماشین همچنین هنگام خرید یک محصول از آمازون، توصیههای فوری را ارائه میدهد. این الگوریتمها و تحلیلها دائما در حال بهبود هستند. بنابراین نتیجه با گذشت زمان دقیقتر میشود.
نکته مهم: یادگیری ماشین هوش مصنوعی نیست، اما توانایی یادگیری و پیشرفت هنوز هم یک شاهکار چشمگیر است.
در حال حاضر بانکها، از یادگیری ماشین برای کمک به جستجوی کلاهبرداری در هنگام کشیدن کارتهای اعتباری توسط یک فروشنده، استفاده و روی این اصل سرمایهگذاری فراوانی میکنند. برای نمونه CitiBank برای شناسایی و ریشهکن کردن کلاهبرداری مالی در زمان واقعی در معاملات بانکی بصورت آنلاین و غیر حضوری در شرکت، روی دانش داده جهانی Feedzai سرمایهگذاری کرد. این فناوری به شناسایی سریع تقلب کمک میکند و میتواند به خردهفروشان در محافظت از فعالیتهای مالی خود کمک کند.
نتیجه سخن
در دنیای ما هر روز، کمی بیشتر از قبل، برای حل وظایف و مشکلات به راهحلهای دیجیتال نیاز است. این یک دنیای دیجیتالی به اندازه کافی بزرگ است که به فضای بیشتری برای رشد دادهکاوی و یادگیری ماشین نیاز دارد. ادامه تسلط بر کلان دادهها به این معنی است که همیشه نیاز به دادهکاوی وجود خواهد داشت و ادامه این مسیر و تقاضای ماشینهای هوشمند تضمین میکند که یادگیری ماشین مهارت بسیار مورد تقاضا است.