تحلیلهای پیشبینی کننده (Predictive Analytics) یک روش تحلیلی مهم است که توسط بسیاری از سازمانها برای تعیین ریسک، شناسایی روند کسب و کار در آینده و تشخیص نیازهای پیش روی سازمان استفاده میشود. دانشمندان داده با استفاده از دادههای تاریخی به عنوان منبع خود، از تحلیل رگرسیون و تکنیکهای یادگیری ماشین برای شناسایی الگوها و روند موجود در آن دادهها استفاده میکنند.
هدف اصلی تحلیلهای پیشبینی کننده، شناسایی، با درجه بالایی از احتمالات و آنچه در آینده اتفاق خواهد افتاد است. این موارد را از تجزیه و تحلیل توصیفی (Descriptive Analytics)، که به تحلیلگران کمک میکند تا آنچه قبلاً اتفاق افتاده است، در کنار تجزیه و تحلیل تجویزی (Prescriptive Analytics) را که با استفاده از نرم افزار بهینهسازی، بهترین تصمیمات را برای مقابله با روند آشکار شده توسط تجزیه و تحلیلهای پیشبینی کننده، به دست آورده و از هم جدا میکنند.
تعریف جامع تحلیلهای پیشبینی کننده
اصطلاح تحلیلهای پیشبینی کننده به طیف وسیعی از تکنیکهای تحلیلی پیشرفته اطلاق میشود که دادهها را تجزیه و تحلیل میکند تا احتمال وقوع برخی وقایع را تعیین کند. به عنوان مثال، از نظر کلان، میتوان از تحلیلهای پیشبینی کننده برای تعیین روند جمعیت در آینده استفاده کرد. برعکس، همچنین میتواند به معنای خرد برای تعیین خطر اعتبار یک متقاضی وام مسکن فردی استفاده شود.
با استفاده از تکنیکهای پیشرفته آماری، تحلیلهای پیشبینی کننده احتمال وقوع یک رویداد خاص را محاسبه میکند. در مثال روندهای جمعیتی فوق، تحلیلگر میتواند به دادههای موجود در دسترس اکتفا کرده تا احتمال رشد در یک شهر خاص یا یک کلان شهر را تعیین کند.
قابلیت اطمینان پیشبینیها تا حد زیادی به مدل تحلیلی پیشبینی انتخاب شده و کیفیت دادههای استفاده شده بستگی دارد. اشکال مختلفی از تحلیلهای پیشبینی کننده وجود دارد و مهم این است که یکی از آنها را متناسب با مسئله موجود انتخاب کنید.
روشهای اصلی تحلیلهای پیشبینی کننده
تکنیکهای تحلیلهای پیشبینی کننده را میتوان به سه قسمت خاص تقسیم کرد:
- تهیه اطلاعات
- فنون تحلیلی
- فرضیات
اگرچه ممکن است سازمانها به دادههای زیادی دسترسی داشته باشند، اما بسیاری از آنها بدون ساختار هستند و باید آماده پردازش شوند. این شامل پاک کردن دادهها برای حذف اطلاعات نادرست و مبهم و همچنین سازماندهی دادهها در یک قالب مناسب است.
انواع مدلسازی پیشبینی
کاربران مدل به طیف تقریباً بیپایان تکنیکهای مدلسازی پیشبینی دسترسی دارند. بسیاری از روشها منحصر به محصولات و خدمات خاص هستند، اما هسته اصلی تکنیکهای عمومی، مانند درخت تصمیم، رگرسیون و حتی شبکههای عصبی اکنون به طور گسترده در طیف گستردهای از سیستم عاملهای تجزیه و تحلیل پیشبینی شده پشتیبانی میشود.
درخت تصمیم (Decision Trees)
یکی از محبوب ترین تکنیکها، به نمودار شماتیک و شکل درختی متکی هستند که برای تعیین روند کار یا نشان دادن احتمال آماری استفاده میشود. روش انشعاب همچنین میتواند هر نتیجه احتمالی یک تصمیم خاص و اینکه چگونه یک انتخاب منجر به انتخاب بعدی میشود را نشان دهد.
تکنیکهای رگرسیون
اغلب در بانکداری، سرمایهگذاری و سایر مدلهای مالیگرا مورد استفاده قرار میگیرند. رگرسیون به کاربران کمک میکند تا ارزش داراییها را پیشبینی کرده و روابط بین متغیرها مانند کالاها و قیمت سهام را درک کنند.
شبکههای عصبی
در مرز تکنیکهای تجزیه و تحلیل پیشبینی، شبکههای عصبی وجود دارد. الگوریتمهایی که با تقلید از عملکرد ذهن انسان، برای شناسایی روابط اساسی در یک مجموعه داده طراحی شدهاند.
تکنیکهای معمول
معمولترین تکنیکهای تحلیلی شامل تحلیل رگرسیون و یادگیری ماشین است. با تجزیه و تحلیل رگرسیون، تحلیلگران سعی میکنند تعیین کنند که کدام یک از چندین متغیر مستقل از نظر آماری با یک رویداد ارتباط دارند.
یادگیری ماشینی این مرحله را یک گام فراتر میگذارد، زیرا از اشکال مختلف تکنیکهای تصمیمگیری مانند شبکههای عصبی، قوانین احتمال شرطی و مدل سازی فضایی برای ترسیم روابط پیچیده استفاده میکند.
تمام تجزیه و تحلیلها بر اساس پیش فرضهای خاصی انجام میشود که باید مرتبط و صحیح باشند. به عنوان مثال، برخی ممکن است با نحوه رفتار افراد سر و کار داشته باشند و این به مرور تغییر خواهد کرد. اهمیت تأیید درست بودن فرضیات را نمیتوان بیش از حد بیان کرد. تاریخ مثالهای بسیاری دارد، مانند بحران مالی ۲۰۰۸ و آخرین انتخابات ریاست جمهوری که در آن فرضیات مهم نادرست بودند و منجر به پیش بینیهای نادرست شدند.

نحوه توسعه تجزیه و تحلیلهای پیشبینی کننده
به همان اندازه که تجزیه و تحلیلهای پیشبینی کننده قدرتمند است، ایجاد یک مدل به زمان و درجهای از مراقبت نیاز دارد. این مهم در چند مرحله انجام میشود.
گام اول این است که برنامهریزی دقیق حاصل شود. این امر با تعیین یک تیم داخلی توانمند که دارای سطح کافی دانش و تجربه تجزیه و تحلیل پیشرفته است دنبال میشود. در این مرحله، تعیین دقیق برنامه و تعیین دقیق اینکه مدل باید چه اطلاعاتی را تعیین کند بسیار مهم است.
گام دوم تهیه دادهها است که به عنوان داده کاوی نیز شناخته میشود. این گام شامل شناسایی نیاز به دادهها، تمیز کردن آنها و ذخیرهسازی دادهها به شکل قابل استفاده در انبار داده یکپارچه است. آماده سازی دادهها درصد قابل توجهی از کل کار را تشکیل میدهد.
گام سوم شامل انجام تجزیه و تحلیل آماری برای تأیید فرضیات و به دنبال آن تهیه یک مدل پیشبینی است. یک جنبه مهم اعتبارسنجی مدل است که از دادههای تاریخی با نتایج شناخته شده برای بررسی و کالیبراسیون مدل استفاده میکند. این گام ممکن است نیاز به بررسی تکنیکهای تحلیلی جایگزین برای ایجاد مدلی باشد که ارتباط تنگاتنگی با دادههای تاریخی دارد.
هنگامی که یکپارچگی مدل ایجاد شد، برای هدایت تصمیمات مدیریتی به کار گرفته میشود. به صورت دورهای، بررسی عملکرد مدل برای اطمینان از معتبر بودن فرضیات و ادامه ارائه مدل پیش بینیهای معتبر ضروری است.
سلسله مراتب تجزیه و تحلیل پیشبینی کننده
یک جنبه اصلی ارزیابی تحلیلهای پیشبینی کننده، درک جایی است که تحلیل پیشبینی در سلسله مراتب تجزیه و تحلیل دادهها قرار میگیرد. تجزیه و تحلیل دادهها را میتوان به عنوان یک فرآیند برای تعیین روندها و معیارهای معنیدار تعریف کرد، بنابراین مدیران میتوانند از این اطلاعات برای مدیریت و بهینهسازی عملکرد استفاده کنند.