هوش تجاری
دانشمند داده کیست و چه نقشی در کسب و کار دارد؟
ممکن است شما هم شنیده باشید که هاروارد شغلی به نام «دانشمند داده» را جذابترین شغل قرن بیست و یکم نامیده است. در این مقاله قصد داریم نقش دانشمند داده، مهارتها، مدارک و تحصیلات مورد نیاز، تجربیات کاری و مسئولیتهای او را بررسی کنیم. در حقیقت تعریف استانداردی از نقش دانشمند داده وجود ندارد و به ندرت پیش میآید که سابقه کاری ایدهآل و مجموعه مهارتهای مورد نیاز این شغل در یک فرد یافت شود؛ اما ما قصد داریم بهترین تعریف ممکن را به شما ارائه دهیم.
قبل از اینکه به نقش دانشمند داده بپردازیم، بهتر است تاکید کنیم که اغلب اوقات این شغل با شغلهای دیگری همچون تحلیلگر داده، مهندس داده و … اشتباه گرفته میشود. اما توجه کنید که تمامی این مشاغل تفاوتهای بسیاری باهم دارند که جلوتر به آنها اشاره خواهیم کرد.
در اینجا نموداری میبینید که برخی از تخصصهای رایج یک دانشمند داده را نشان میدهد. سطح تجربه و دانش یک دانشمند داده در هر یک از این تخصصها، ممکن است در سطح مبتدی، قابل قبول و متخصص یا ایدهآل طبقهبندی شود.
گرچه تخصصهای بالا و رشتههای دیگری که در اینجا نشان داده نشده است همگی میتواند عنوان ویژگیهای یک دانشمند داده را به خود بگیرد، ما پایه و اساس این دانشمندان را چهار ستون و رکن کلی در نظر میگیریم. تخصصهای جزئیتر ممکن است از ترکیب این ارکان بدست آیند.
ارکان علم داده
با وجود اینکه دانشمندان داده اغلب زمینههای آموزشی و تجربیات کاری متفاوتی دارند، اکثر آنها باید در چهار زمینه قوی باشند، یا در ایدهآلترین حالت، متخصص باشند. این چهار زمینه عبارتاند از: کسب و کار، ریاضیات (شامل آمار و احتمال)، علوم کامپیوتر (به عنوان مثال، معماری و مهندسی نرمافزار یا داده) و ارتباطات (کتبی و شفاهی).
مهارتها و تخصصهای دیگری نیز وجود دارد که داشتن آنها مطلوب واقع میشود، اما به طور کلی این چهار مهارت اهمیت بیشتری دارند. از این عناصر تا پایان این مقاله با عنوان ارکان دانشمند داده یاد میشود.
اکثر دانشمندان در یک یا دو رکن قوی هستند و به ندرت پیش میآید در هر چهار رکن قوی باشند. بر اساس این ارکان، دانشمند داده شخصی است که باید بتواند از منابع داده موجود استفاده کند و در صورت لزوم منابع جدیدی را برای استخراج اطلاعات معنیدار و پیشنهادات سازنده ایجاد کند. از این پیشنهادات میتوان برای مدیریت تصمیمات و تغییرات کسب و کاری جهت دستیابی به اهداف سازندهی کسب و کار استفاده کرد.
این امر از طریق تخصص در حوزه کسب و کار، ارتباطات کارآمد، تفسیر نتایج و استفاده از همه تکنیکهای آماری مورد نیاز، زبانهای برنامهنویسی، بستههای نرمافزاری، زیرساخت دادهها و … انجام میشود.
منظور از علم داده چیست؟
برای درک اهمیت این ارکان، ابتدا باید معنی علوم داده و همچنین فرایند علم داده را درک کرد. مطالب قابل ارائه در علم داده، پیشبینی یک مقدار بر اساس دادهها، طبقه بندی، لینکهای پیشنهادی (مانند پیشنهادات آمازون و Netflix)، شناسایی و گروهبندی الگوها، تشخیص ناهنجاریهایی مانند جعل و تقلب، فرآیندهای خودکار و تصمیم گیریها، امتیازدهی و رتبهبندی، تقسیمبندی، بهینهسازی و … را در بر میگیرد.
هر یک از موضوعات بالا، برای دستیابی به یک هدف خاص و یا حل یک مشکل خاص در نظر گرفته شده است. به عنوان مثال، یک دانشمند داده ممکن است فکر کند که هدف او ایجاد یک موتور پیشبینی با عملکرد بالا است. از طرف دیگر، شرکتی که قصد دارد از موتور پیشبینی استفاده کند، ممکن است هدفش افزایش درآمد باشد که با استفاده از این موتور پیشبینی قابل دستیابی است.
گرچه به نظر می رسد این مسئله در نگاه اول چندان مشکلساز نباشد، اما این مثال به خوبی نشان میدهد که چرا رکن اول (تخصص در حوزه کسب و کار) اهمیت بسیار زیادی دارد. اغلب مدیران موفق دارای سوابق تحصیلی کسب و کار محور، مانند کارشناسی ارشد مدیریت بازرگانی هستند.
باوجود اینکه بسیاری از مدیران افراد فوقالعاده باهوشی هستند، ممکن است در تمام ابزارها، تکنیکها و الگوریتمهای مورد استفاده دانشمند داده (به عنوان مثال، تجزیه و تحلیل آماری، یادگیری ماشین و هوش مصنوعی) مهارت کافی نداشته باشند. با توجه به این موضوع، آنها ممکن است نتوانند به خوبی اهداف خود را به دانشمند داده منتقل کنند.
حتی اگر یک مدیر اجرایی بتواند تشخیص دهد که یک موتور پیشنهاد دهنده خاص به افزایش درآمد کمک میکند، ممکن است متوجه این موضوع نباشد که روشهای متنوعتری برای استفاده از دادههای شرکت جهت افزایش درآمد وجود دارد.
در نتیجه باید مجددا تاکید کنیم که دانشمند داده باید نسبت به نحوه کار مشاغل و نحوه استفاده از دادههای یک شرکت برای دستیابی به اهداف والا، درک کاملی داشته باشد.
با دانش قابل توجه در حوزه کسب و کار، یک دانشمند داده میتواند مرتبا برنامههای جدیدی را برای کمک به کسب و کار در رسیدن به اهداف خود و به حداکثر رساندن شاخص عملکرد آن پیشنهاد دهد.
فرآیند علم داده
در زیر نمودار مدل فرآیند GABDO آورده شده است. این فرآیند از پنج مرحله تشکیل شده است: هدفگذاری، دستیابی، ساخت، تحویل، بهینهسازی. اما ارکان دانشمند داده در اینجا چه نقشی ایفا میکنند؟
ارکان دانشمند داده، مهارتها و تحصیلات
پیشتر در مورد حوزه کسب و کار و ارتباطات صحبت کردیم. هوش تجاری و مهارتهای ارتباطی درجه یک برای مرحله کشف و هدفگذاری بسیار مهم است.
مهارتهایی مانند ارتباطات (نوشتاری و کلامی) و توانایی سخنرانی در جمع، برای یک دانشمند داده نقشی کلیدی ایفا میکنند. در مرحله بازگو کردن و انتقال نتایج، مهم است که دانشمند داده بتواند نتایج را به روشی قابل فهم و جذاب انتقال دهد و از زبان و اصطلاحات مناسب برای مخاطبان خود استفاده کند.
برای مراحل دیگر، دانشمندان داده باید برای درک دادهها، انتخاب روش صحیح و به کار گیری راهحل باید از مهارتهای برنامه نویسی قوی و همچنین دانشی کامل در مورد آمار، احتمالات و ریاضیات بهره بگیرند.
دانشمند داده باید تواناییهایی از جمله نوشتن الگوریتمهای جدید یا اصلاح الگوریتم های موجود را داشته باشد. او باید بتواند به بسیاری از پایگاههای داده مختلف و منابع داده دسترسی داشته و دادها را در یک منبع مبتنی بر تجزیه و تحلیل ادغام کند، تمام گزینههای آماری، برنامهنویسی و … را بشناسد و بهترینها را انتخاب کند، اطمینان حاصل کند که دادهها از یکپارچگی، کیفیت بالا و شرایط مطلوب برای به دست آوردن نتایج دقیق بهرهمند هستند.
دانشمند داده باید معیارهای عملکرد صحیح را انتخاب کند و برای به حداکثر رساندن عملکرد، تکنیکهای مناسب را به کار گیرد. او باید نتایج خوب و بد را از هم تشخیص دهد و از خطرات احتمالی و خسارات مالی ناشی از نتیجهگیری اشتباه بکاهد.
مهم نیست که فرد چه راهی برای یادگیری در پیش گرفته است، دانشمند داده باید دارای دانش پیشرفته و مهارتهای بسیار فنی در زمینه آمار، ریاضیات و علوم کامپیوتر باشد.
معنی “علم” در علم داده
اصطلاح علم معمولاً مترادف با روش علمی است. در اینجا تصویری وجود دارد که روش علمی را به عنوان یک روند مداوم تجسم می کند.
به طور کلی، دانشمندان رشتههای دیگر و دانشمندان داده باید توانایی سوال پرسیدن یا تعریف یک مسئله را داشته باشند، داده ها را جمعآوری و از آنها استفاده کنند تا جواب یا راه حلهایی ارائه دهند، نهایتا راه حل را آزمایش کنند تا ببینند آیا مشکل حل شده است و در صورت لزوم راه حل را نهایی کند.
دانشمندان داده، تحلیلگران داده و مهندسین داده
همانطور که گفته شد، معمولا نقش دانشمند داده با سایر نقشهای مشابه اشتباه گرفته میشود. مهمترین این نقشها تحلیلگران داده و مهندسان داده هستند که هر دو کاملاً با یکدیگر متفاوتاند و همچنین با علم داده نیز تفاوت دارند. در ادامه این نقشها را با جزئیات بیشتری بررسی خواهیم کرد.
تحلیلگران داده
تحلیلگران داده بسیاری از مهارتها و مسئولیت های یک دانشمند داده را دارند و بعضی اوقات نیز دارای سوابق آموزشی مشابه هستند. برخی از این مهارتهای مشترک شامل توانایی پردازش و پاکسازی دادهها، جمع بندی دادهها، استفاده از برخی از آمار و فنون ریاضی، تجسم دادهها و آماده کردن گزارشها میشود.
برخی از تفاوتهای کلیدی این است که تحلیلگران داده معمولاً برنامهنویس نیستند و همچنین مسئولیت یادگیری ماشین و بسیاری از مراحل دیگر که در فرآیند علم داده در بالا ذکر شد را ندارند.
سرانجام ، تحلیلگران داده ها در تعاملات خود با مدیران نیز تفاوت چشمگیری دارند. تحلیلگران داده معمولا سوالهایی را دریافت میکنند، تجزیه و تحلیل انجام میدهند و نهایتا یافتههای خود را گزارش میکنند.
دانشمندان داده، خودشان سوالات را بر اساس مهمترین اهداف تجاری و چگونگی استفاده از دادهها برای دستیابی به آنها، ایجاد می کنند. علاوه بر این، دانشمندان داده به طور معمول از برنامهنویسی و نرمافزارهای تخصصی استفاده میکنند و آمار، تجزیه و تحلیل و تکنیکهای مدلسازی بسیار پیشرفتهتری را به کار میگیرند.
مهندسان داده
مهندسان داده در زمینه دادهها در مقیاس بزرگ اهمیت بیشتری پیدا میکنند و میتوان آنها را نوعی معمار داده در نظر گرفت. آنها بر خلاف دانشمندان و تحلیلگران داده، کمتر به آمار، تجزیه و تحلیل و مدلسازی میپردازند و بیشتر به معماری دادهها، زیرساختهای محاسبات و ذخیره دادهها و جریان دادهها توجه دارند.
دادههایی که دانشمندان داده از آنها استفاده میکنند اغلب از منابع مختلفی تهیه میشوند و باید استخراج، انتقال، تبدیل، یکپارچهسازی و ذخیره شوند؛ به گونهای که برای تجزیه و تحلیل، هوش تجاری و مدلسازی آماده شوند.
بنابراین مهندسان داده مسئول معماری دادهها و تنظیم زیرساختهای مورد نیاز هستند. آنها نیاز به مهارت برنامهنویسی و همچنین مهارت در نوشتن و جستن اطلاعات دارند.
جنبه کلیدی دیگر این نقش طراحی پایگاه داده و انبارداری دادهها است. این بدان معنی است که آنها باید با بسیاری از فناوریهای موجود در پایگاه داده و سیستمهای مدیریتی، از جمله سیستمهای مرتبط با دادهها در مقیاس بزرگ به خوبی آشنا باشند.
مهندسان داده همچنین به طور معمول نیازهای زیرساختی مانند مقیاسپذیری، قابلیت اطمینان، دوام، در دسترس بودن، پشتیبانی و … را برطرف میکنند.
جمع بندی
با توجه به همهی آنچه که گفته شد، باید بگوییم دانشمند داده یک شغل بسیار مهم و پرتقاضا است که از نظر مالی، عملیاتی و استراتژیک میتواند تأثیر قابل توجهی بر توانایی یک کسب و کار برای دستیابی به اهداف خود داشته باشد.
شرکتها تعداد زیادی داده جمع میکنند و بیشتر اوقات این دادهها مورد غفلت قرار میگیرند. این دادهها، از طریق استخراج اطلاعات معنیدار و توصیههای کلیدی، میتوانند برای تصمیمگیری در مورد کسب و کار و ایجاد تغییرات قابل توجه در آن استفاده شوند. همچنین میتوان آنها را برای بهینهسازی ارتباطات با مشتری و پس از آن جذب مشتری، حفظ و رشد تعداد مشتریان به کار برد.
همان طور که گفته شد، دانشمندان داده میتوانند تأثیر عمدهای در موفقیت یک کسب و کار داشته باشند، و گاهی اوقات ناخواسته باعث ایجاد خسارات مالی میشوند؛ از این رو، بسیار مهم است که هنگام استخدام دانشمند داده، بهترین و شایستهترین فرد را برای این سمت برگزینید.
مجموعه
هوش تجاری
- به روز رسانی حاکمیت داده در سازمان: از کجا شروع کنیم
- کارشناس پایگاه داده کیست و چه وظایفی دارد؟
- بررسی تفاوتهای میان داده، اطلاعات و دانش در یک نگاه
- وقتی از هوش تجاری صحبت میکنیم، از چه حرف میزنیم؟
- تبدیل داده به اطلاعات با هوش تجاری
- تجزیه و تحلیل داده (Data Analytics) چیست و چگونه انجام میشود؟
- کلان داده (Big Data) چیست؟
- تجزیه و تحلیل کلان داده (Big Data) چیست و چگونه انجام میشود؟
- مقایسه مفاهیم تحلیل داده، علوم داده و کلان داده (Big Data)
- طراحی پایگاه داده چیست و چگونه انجام میشود؟
- حاکمیت داده (Data Governance) چیست و چه اهمیتی دارد؟
- هوش تجاری (BI) چیست و چه تفاوتی با آنالیز تجاری (BA) دارد؟
- آنچه باید درباره هوش تجاری بدانیم
- هوش تجاری (BI) چطور میتواند به کسب و کار شما کمک کند؟
- معرفی ۵ کتاب برتر درباره هوش تجاری
- ۷ کلید برای یک استراتژی موفقیت آمیز در زمینه هوش تجاری
- ۹ راه عدم موفقیت هوش تجاری
- تجسم داده (Data Visualization) چیست و چرا اهمیت دارد؟
- تمیزسازی داده (Data cleaning) به چه معناست و چه اهمیتی دارد؟
- ۱۰ تکنیک اساسی تجسم داده در ایجاد گزارشهای هوش تجاری
- معرفی ۱۳ روش متداول تجسم دادهها
- تفاوت داشبورد و گزارش چیست؟
- ۱۰ اصل طراحی داشبورد هوش تجاری
- ۱۳ مثال عملی از تحلیل داده با هوش تجاری
- کاربرد هوش تجاری در صنایع مختلف
- معرفی نرم افزارهای مختلف هوش تجاری
- چگونه نرمافزار مناسب هوش تجاری را انتخاب کنیم؟
- پاور بی آی (Power BI) چیست و در هوش تجاری چه کاربردی دارد؟
- راهنمای کامل پاور بی آی (Power BI)
- ویژگیهای نرم افزار Power BI
- تفاوت پاور بی آی و اکسل
- معرفی انواع نمودارها در نرم افزار پاور بی آی (Power BI)
- راهنمای کامل معماری نرم افزار پاور بی آی (Power BI)
- راهنمای انتخاب ابزار مناسب بین پاور بی آی و اکسل
- آموزش توابع زبان DAX در هوش تجاری با پاور بی آی (Power BI)
- معرفی نرمافزار Tableau، کاربردها و محصولات آن
- هر آنچه که لازم است درباره نرمافزار QlikView بدانید
- تفاوت زبان M و DAX در نرم افزار Power BI
- مقایسه ابزار Power BI و Tableau در هوش تجاری
- آموزش Power BI Report Server
- آموزش نصب و راه اندازی Power BI Report Server
- AIOps چیست و چه ساختاری دارد؟
- مسیر شغلی در هوش تجاری
- مهندسی داده چیست؟
- تحلیلگر داده (Data Analyst) کیست و چه کاری انجام میدهد؟
- تحلیلگر هوش تجاری کیست و چگونه میتوان به یک تحلیلگر هوش تجاری تبدیل شد؟
- ۸ مهارت مهم که هر تحلیلگر داده برای موفقیت به آنها نیاز دارد
- معرفی مهمترین مدارک و گواهینامههای مورد نیاز تحلیلگر داده
- آیا داشتن مدرک SQL ضروری است؟ معرفی انواع و اهمیت مدرک SQL
- مهمترین تکنیکهای هوش تجاری
- پیاده سازی هوش تجاری در سازمانها
- نقشه راه پیاده سازی موفق استراتژی هوش تجاری در سازمان
- معرفی ۵ کاربرد ارزشمند هوش تجاری در سازمانها
- داده کاوی چیست و چه تکنیکهایی دارد؟
- همهچیز درباره علم داده و نحوه استفاده از آن
- معرفی معتبرترین مدارک و گواهینامههای علم داده
- معرفی برترین ابزار برای دادهکاوی
- دانشمند داده کیست و چه نقشی در کسب و کار دارد؟
- معرفی برترین زبانهای برنامهنویسی علم داده
- آسان ترین زبان برنامهنویسی برای یادگیری کدام است؟
- تفاوتهای اصلی در نقشهای مهندس داده و دانشمند داده
- زبان برنامهنویسی پایتون چیست و چرا باید آن را یاد بگیرید؟
- یادگیری ماشین چیست؟
- SSRS چیست و چه کاربردی در مدیریت دادهها دارد؟
- SSAS چیست و چه کاربردهایی دارد؟
- بهترین زبانها برای یادگیری ماشین (Machine Learning) کدام هستند؟
- نقشها و مسئولیتهای کلیدی در یک تیم هوش تجاری چیست؟
- تفاوت زبان پایتون (Python) و R در چیست؟
- کاربرد KPI در داشبوردهای هوش تجاری
- زبان برنامه نویسی R چیست؟
- بررسی تفاوتهای میان دادهکاوی و یادگیری ماشین در علم داده
- مروری بر نحوه یادگیری زبان R
- چگونه میتوان یک داشبورد فروش ایجاد کرد؟
- معرفی برترین ابزارهای علم داده
- پایگاه داده چیست و چه اجزایی دارد؟
- انبار داده چیست؟
- مفاهیم، معماری و اجزای انبار داده
- دانشمند داده چه تفاوتی با تحلیلگر داده دارد؟
- فرایند ETL در ایجاد انبار داده چیست؟
- مدلسازی داده چیست؟
- دریاچه داده (Data Lake) چیست و چه ساختاری دارد؟
- بهترین شیوههای طراحی پایگاه داده (Database design)
- نرمالسازی داده چیست و چگونه انجام میشود؟
- سیستمهای پشتیبانی تصمیمگیری چیست و چه کاربردهایی دارد؟
- بازار داده (Data Mart) چیست و چه تفاوتی با انبار داده دارد؟
- تحلیلهای پیشبینی کننده چیست و چگونه انجام میشود؟
- علم تصمیمگیری چیست و چگونه میتوانیم تصمیمات دادهمحور بگیریم؟
- تصمیمگیری مبتنی بر داده چیست و چه تاثیری در موفقیت کسب و کار دارد؟
- کاربرد تحلیل داده در بانکداری و شرکتهای خدمات مالی
- معماری اطلاعات (IA) چیست و چطور میتوان از آن استفاده کرد؟
- کلان داده (Big Data) و بررسی تأثیرات آن بر تجارت الکترونیک
- بانکداری باز (Open Banking) چیست و چه اصولی دارد؟