(Warehousing Data (DW یا همان پایگاه داده تحلیلی فرآیندی برای جمع آوری و مدیریت دادهها از منابع مختلف برای ارائه بینش معنادار تجاری است. انبار داده به طور معمول برای اتصال و تجزیه و تحلیل دادههای تجاری از منابع ناهمگن استفاده میشود. انبار داده، هسته اصلی سیستم BI (هوش تجاری) است که برای تحلیل و گزارش داده ساخته شده است.
در این ذخیره سازی الکترونیکی، مقدار زیادی از اطلاعات توسط یک کسب و کار مشخص را که برای پرس و جو و تجزیه و تحلیل طراحی شده است، در خود جای میدهد. مهمترین وظیفهی این فرایند تبدیل دادهها به اطلاعات و در دسترس قرار دادن به موقع آنها در اختیار کاربران است تا تغییر مسیر سازمان به درستی ایجاد شود.
انبار دادهها جدا از پایگاه داده عملیاتی سازمان نگهداری میشود. به زبان دیگر، انبار داده یک محصول نیست بلکه یک محیط است. این یک ساختار معماری شده از یک سیستم اطلاعاتی است که اطلاعات پشتیبانی فعلی و تاریخی تصمیمگیریها را که دسترسی به آن دشوار است یا در فروشگاه ذخیرهسازی عملیاتی به صورت سنتی ارائه شده، در اختیار کاربران قرار میدهد.
اسامی دیگر
سیستم انبار داده با نام زیر نیز شناخته میشود:
- سیستم پشتیبانی تصمیم یا (DSS)
- سیستم اطلاعات اجرایی
- سیستم اطلاعات مدیریت
- راه حل هوش تجاری
- برنامه تحلیلی
- پایگاه داده تحلیلی
تاریخچه انبار داده
همانطور که ذکر شد، انبار داده به کاربران کمک میکند تا عملکرد سازمان خود را درک و ارتقا دهند. با پیچیدهتر شدن سیستمهای رایانهای و نیاز مدیریت اطلاعات یک سیستم، نیاز به انبار دادهها تکامل یافت. با این حال، ذخیره سازی اطلاعات چیز جدیدی نیست.
وقایع مهم در تکامل انبار داده
- ۱۹۶۰- دارتموث و جنرال میلز در یک پروژه تحقیقاتی مشترک، اصطلاحات ابعاد و حقایق را توسعه دادند.
- ۱۹۸۳- Tera Data Corporation یک سیستم مدیریت پایگاه داده را معرفی میکند که به طور خاص برای انبار دادهها طراحی شده است
- انبارداری دادهها از اواخر دهه ۱۹۸۰ و زمانی که کارمندان IBM، پل مورفی و باری دولین، انبار داده را ایجاد کردند، آغاز شد.
با این حال، مفهوم واقعی توسط اینمون بیل (Inmon Bill) ارائه شده است. او به عنوان پدر انبار داده شناخته میشود. وی در مورد موضوعات مختلفی برای ساخت، استفاده و نگهداری و انبار اطلاعات شرکتها مطالب گستردهای نوشته بود.
انبار داده چگونه کار میکند؟
انبار داده به عنوان مخزن مرکزی که در آن اطلاعات از یک یا چند منبع داده وارد میشوند، فعالیت دارد. دادهها از سیستم معاملات و سایر پایگاههای ارتباطی به یک انبار داده سرازیر میشوند. دادهها ممکن در سه حالت زیر پرداخته شوند:
- ساختارمند
- نیمه ساختاریافته
- دادههای بدون ساختار
دادهها پردازش، تبدیل و تحلیل میشوند تا کاربران بتوانند از طریق ابزارهای هوش تجاری، سرویس گیرندگان SQL (نوعی زبان خاص دامنه در برنامهنویسی) و صفحات گسترده به دادههای پردازش شده در انبار داده دسترسی پیدا کنند. یک انبار داده، اطلاعاتی را که از منابع مختلف در یک پایگاه داده جامع وارد میشود، ادغام میکند.
با ادغام تمام این اطلاعات در یک مکان، یک سازمان میتواند مشتریان خود را با نگاه کلیتری تجزیه و تحلیل کند. داده کاوی را امکان پذیر میکند و به دنبال الگوهایی در دادههاست که منجر به فروش و سود بیشتر شود.
انواع انبار داده
سه نوع اصلی انبار داده
- انبار دادههای سازمانی یا (Enterprise Data Warehouse (EDW :
یک انبار متمرکز است. این خدمات انبار دادهها را در سراسر شرکت فراهم میکند. در عین حال رویکردی واحد برای سازماندهی و نمایش دادهها را ارائه میدهد. همچنین این امکان را فراهم میکند تا دادهها را با توجه به موضوع طبقهبندی کرده و مطابق آن تقسیم بندیها، دسترسیهای لازم ایجاد شوند.
- انبار داده عملیاتی:
ذخیره داده عملیاتی، که ODS نیز نامیده میشود. در این محیط زمانی که به طور واقعی به دادهها نیازمندیم و آنها را فرا میخوانیم، مورد استفاده قرار میگیرد. از این رو، برای فعالیتهای معمول مانند ذخیره سوابق کارمندان مورد استفاده قرار میگیرد.
- بازار داده :
این مهم با نام data mart نیز خوانده میشود. این بخش برای یک نوع مشاغل خاص مانند فروش و امور مالی طراحی شده است. در یک انبار داده میتوان چندین بازار داده در نظر گرفت با این اطمینان که تغییر در یکی از این لایهها تاثیری بر دیگر دادهها نخواهد گذاشت.
مراحل عمومی انبار داده
پیش از این، سازمانها استفاده نسبتاً سادهای از ذخیره سازی دادهها را مد نظر داشتند اما با گذشت زمان، استفاده پیچیدهتری از انبارداری دادهها نیز آغاز شد. موارد زیر مراحل کلی استفاده از انبار داده است:
پایگاه داده عملیاتی آفلاین
در این مرحله، دادهها فقط از سیستم عملیاتی به سرور دیگری کپی میشوند. به این ترتیب، بارگذاری، پردازش و گزارش دادههای کپی شده بر عملکرد سیستم عملیاتی تأثیر نمیگذارد.
انبار داده آفلاین
دادهها در انبار داده به طور منظم از پایگاه داده عملیاتی به روز میشوند. دادههای انبار داده برای دستیابی به اهداف انبار داده نقشه برداری و تغییر شکل مییابد.
انبار داده در زمان واقعی
در این مرحله، هر زمان که معاملهای در پایگاه داده عملیاتی انجام شود، انبارهای داده به روز میشوند. به عنوان مثال، سیستم رزرو هواپیمایی یا راه آهن.
انبار داده یکپارچه
در این مرحله، دادههای انبار هنگامی که سیستم عملیاتی معاملهای را انجام میدهد، به طور مداوم به روز میشوند. سپس انبار داده تراکنشهایی را ایجاد میکند که به سیستم عملیاتی بازگردانده میشوند.
اجزای انبار داده
چهار جز اصلی انبارهای داده عبارتند از:
۱- مدیریت بارگذاری
این کار با تمام عملیات مرتبط با استخراج و بارگذاری دادهها در انبار انجام میشود. این عملیات شامل تبدیلاتی برای آماده سازی دادهها برای ورود به انبار داده است.
۲- مدیریت انبار داده
این عملیات مانند تجزیه و تحلیل دادهها برای اطمینان از ثبات، ایجاد شاخصها و نمایشها، تولید غیر عادی سازی و تجمع، تحول و ادغام دادههای منبع و بایگانی و پردازش اطلاعات را انجام میدهد.
۳- مدیریت تحلیل
عملکرد بخش بر اساس آنالیزها و اطلاعات به دست آمده برای برنامهریزی و پاسخ به سوالات کاربران طراحی میشود.
۴- ابزارهای دسترسی کاربر نهایی
این مورد در پنج گروه مختلف طبقهبندی میشود:
- گزارش دهی دادهها
- ابزارهای پرس و جو
- ابزارهای توسعه برنامهها
- ابزارهای EIS
- ابزارهای OLAP و ابزارهای داده کاوی
چه کسی به انبار داده نیاز دارد؟
- تصمیم گیرندگانی که به مقدار انبوه داده اعتماد میکنند.
- کاربرانی که از فرایندهای پیچیده و سفارشی برای بدست آمده از اطلاعات چندین منبع داده استفاده میکنند.
- افرادی که خواهان یک رویکرد سیستماتیک برای تصمیم گیری هستند.
- کاربرانی که میخواهند با سرعت بالا روی مقدار زیادی از دادهها که برای گزارشها، شبکهها یا نمودارها ضروری است، عملکرد خوبی داشته باشد.
- کسانی که میخواهند “الگوهای پنهان” در جریان دادهها و گروه بندیها را مورد استفاده قرار دهند.
مجموعه
هوش تجاری
- به روز رسانی حاکمیت داده در سازمان: از کجا شروع کنیم
- کارشناس پایگاه داده کیست و چه وظایفی دارد؟
- بررسی تفاوتهای میان داده، اطلاعات و دانش در یک نگاه
- وقتی از هوش تجاری صحبت میکنیم، از چه حرف میزنیم؟
- تبدیل داده به اطلاعات با هوش تجاری
- تجزیه و تحلیل داده (Data Analytics) چیست و چگونه انجام میشود؟
- کلان داده (Big Data) چیست؟
- تجزیه و تحلیل کلان داده (Big Data) چیست و چگونه انجام میشود؟
- مقایسه مفاهیم تحلیل داده، علوم داده و کلان داده (Big Data)
- طراحی پایگاه داده چیست و چگونه انجام میشود؟
- حاکمیت داده (Data Governance) چیست و چه اهمیتی دارد؟
- هوش تجاری (BI) چیست و چه تفاوتی با آنالیز تجاری (BA) دارد؟
- آنچه باید درباره هوش تجاری بدانیم
- هوش تجاری (BI) چطور میتواند به کسب و کار شما کمک کند؟
- معرفی ۵ کتاب برتر درباره هوش تجاری
- ۷ کلید برای یک استراتژی موفقیت آمیز در زمینه هوش تجاری
- ۹ راه عدم موفقیت هوش تجاری
- تجسم داده (Data Visualization) چیست و چرا اهمیت دارد؟
- تمیزسازی داده (Data cleaning) به چه معناست و چه اهمیتی دارد؟
- ۱۰ تکنیک اساسی تجسم داده در ایجاد گزارشهای هوش تجاری
- معرفی ۱۳ روش متداول تجسم دادهها
- تفاوت داشبورد و گزارش چیست؟
- ۱۰ اصل طراحی داشبورد هوش تجاری
- ۱۳ مثال عملی از تحلیل داده با هوش تجاری
- کاربرد هوش تجاری در صنایع مختلف
- معرفی نرم افزارهای مختلف هوش تجاری
- چگونه نرمافزار مناسب هوش تجاری را انتخاب کنیم؟
- پاور بی آی (Power BI) چیست و در هوش تجاری چه کاربردی دارد؟
- راهنمای کامل پاور بی آی (Power BI)
- ویژگیهای نرم افزار Power BI
- تفاوت پاور بی آی و اکسل
- معرفی انواع نمودارها در نرم افزار پاور بی آی (Power BI)
- راهنمای کامل معماری نرم افزار پاور بی آی (Power BI)
- راهنمای انتخاب ابزار مناسب بین پاور بی آی و اکسل
- آموزش توابع زبان DAX در هوش تجاری با پاور بی آی (Power BI)
- معرفی نرمافزار Tableau، کاربردها و محصولات آن
- هر آنچه که لازم است درباره نرمافزار QlikView بدانید
- تفاوت زبان M و DAX در نرم افزار Power BI
- مقایسه ابزار Power BI و Tableau در هوش تجاری
- آموزش Power BI Report Server
- آموزش نصب و راه اندازی Power BI Report Server
- AIOps چیست و چه ساختاری دارد؟
- مسیر شغلی در هوش تجاری
- مهندسی داده چیست؟
- تحلیلگر داده (Data Analyst) کیست و چه کاری انجام میدهد؟
- تحلیلگر هوش تجاری کیست و چگونه میتوان به یک تحلیلگر هوش تجاری تبدیل شد؟
- ۸ مهارت مهم که هر تحلیلگر داده برای موفقیت به آنها نیاز دارد
- معرفی مهمترین مدارک و گواهینامههای مورد نیاز تحلیلگر داده
- آیا داشتن مدرک SQL ضروری است؟ معرفی انواع و اهمیت مدرک SQL
- مهمترین تکنیکهای هوش تجاری
- پیاده سازی هوش تجاری در سازمانها
- نقشه راه پیاده سازی موفق استراتژی هوش تجاری در سازمان
- معرفی ۵ کاربرد ارزشمند هوش تجاری در سازمانها
- داده کاوی چیست و چه تکنیکهایی دارد؟
- همهچیز درباره علم داده و نحوه استفاده از آن
- معرفی معتبرترین مدارک و گواهینامههای علم داده
- معرفی برترین ابزار برای دادهکاوی
- دانشمند داده کیست و چه نقشی در کسب و کار دارد؟
- معرفی برترین زبانهای برنامهنویسی علم داده
- آسان ترین زبان برنامهنویسی برای یادگیری کدام است؟
- تفاوتهای اصلی در نقشهای مهندس داده و دانشمند داده
- زبان برنامهنویسی پایتون چیست و چرا باید آن را یاد بگیرید؟
- یادگیری ماشین چیست؟
- SSRS چیست و چه کاربردی در مدیریت دادهها دارد؟
- SSAS چیست و چه کاربردهایی دارد؟
- بهترین زبانها برای یادگیری ماشین (Machine Learning) کدام هستند؟
- نقشها و مسئولیتهای کلیدی در یک تیم هوش تجاری چیست؟
- تفاوت زبان پایتون (Python) و R در چیست؟
- کاربرد KPI در داشبوردهای هوش تجاری
- زبان برنامه نویسی R چیست؟
- بررسی تفاوتهای میان دادهکاوی و یادگیری ماشین در علم داده
- مروری بر نحوه یادگیری زبان R
- چگونه میتوان یک داشبورد فروش ایجاد کرد؟
- معرفی برترین ابزارهای علم داده
- پایگاه داده چیست و چه اجزایی دارد؟
- انبار داده چیست؟
- مفاهیم، معماری و اجزای انبار داده
- دانشمند داده چه تفاوتی با تحلیلگر داده دارد؟
- فرایند ETL در ایجاد انبار داده چیست؟
- مدلسازی داده چیست؟
- دریاچه داده (Data Lake) چیست و چه ساختاری دارد؟
- بهترین شیوههای طراحی پایگاه داده (Database design)
- نرمالسازی داده چیست و چگونه انجام میشود؟
- سیستمهای پشتیبانی تصمیمگیری چیست و چه کاربردهایی دارد؟
- بازار داده (Data Mart) چیست و چه تفاوتی با انبار داده دارد؟
- تحلیلهای پیشبینی کننده چیست و چگونه انجام میشود؟
- علم تصمیمگیری چیست و چگونه میتوانیم تصمیمات دادهمحور بگیریم؟
- تصمیمگیری مبتنی بر داده چیست و چه تاثیری در موفقیت کسب و کار دارد؟
- کاربرد تحلیل داده در بانکداری و شرکتهای خدمات مالی
- معماری اطلاعات (IA) چیست و چطور میتوان از آن استفاده کرد؟
- کلان داده (Big Data) و بررسی تأثیرات آن بر تجارت الکترونیک
- بانکداری باز (Open Banking) چیست و چه اصولی دارد؟