هوش تجاری
کیفیت داده (Data Quality) چیست و چه اهمیتی دارد؟
از آنجا که دادهها در حال تبدیل شدن به یک قسمت اصلی از هر فعالیت تجاری هستند، کیفیت دادههایی که در طی فرایندهای کسبوکار جمعآوری، ذخیره و مصرف میشوند، موفقیت کسب شده در انجام امور مربوط به امروز و فردای ما را تعیین میکند. از این رو در این مقاله قصد داریم تا نگاهی به این مهم و تاثیر آن در کیفیت کاری خود داشته باشیم.
کیفیت داده (Data Quality) چیست؟
میتوانید دادهها را به عنوان پایهای برای یک سلسله مراتب در نظر بگیرید که البته خود دادهها در سطح پایین این سلسله قرار دارند. در قسمت بالای دادهها، شما اطلاعات یا Information را دارید. بالاتر از آنها دانش کسب شده (Knowledge) و در رأس این هرم، خرد (Wisdom) را به عنوان دانش کاربردی میبینیم. اگر از کیفیت داده بدی برخوردار باشید، از کیفیت اطلاعات خوبی برخوردار نخواهید بود.
دادههای اصلی نباید اغلب برای اهداف مختلف مناسب باشند. با اطمینان از همترازی آنها در دنیای واقعی میتوانید به بهترین نتیجه برسید. از طرف دیگر، تلاش برای همترازی بخش درست و واقعی دادهها، برای داشتن اطلاعات درست و متناسب بودن آنها، به جهت دستیابی به اهداف مورد نظر در طرح تجاری ضروری است. این امر در تأمین بودجه برنامه برای کیفیت دادهها سودآور و متناسب است. بنابراین، در عمل، ایجاد تعادل اجزای این هرم، بسیار مهم است.
در تحقیقی که به سفارش Experian Data Quality در سال ۲۰۱۳ انجام شد، دلیل اصلی عدم صحت دادهها، خطاهای انسانی بود که ۵۹٪ تأثیر مستقیم را نشان میداد. اجتناب و یا سرانجام تصحیح دادههای بیکیفیت ناشی از خطاهای انسانی، نیاز به یک تلاش همه جانبه با ترکیبی مناسب از روشهای تصحیح در مورد افراد، فرایندها و فناوری دارد. دلایل مهم دیگر عدم صحت دادهها در تحقیقات ذکر شده، عدم ارتباط بین بخشها (۳۱٪) و استراتژی ناکافی دادهها (۲۴٪) نیز به همان میزان موثر هستند. حل چنین مسائلی نیاز به یک مشارکت پرشور در سطح مدیریت سازمان دارد.
اهمیت کیفیت دادهها
معمولا سخت است که همه افراد در یک کسبوکار، از جمله مدیریت ارشد، در مورد داشتن کیفیت خوب داده برای کسبوکار به توافق برسند. البته در دوران کنونی تحول دیجیتال، پشتیبانی از تمرکز بر کیفیت دادهها حتی بهتر از گذشته است. با این وجود، وقتی صحبت از سوالات اساسی درمورد اینکه چه کسی مسئول کیفیت داده است، چه کسی باید در این زمینه کاری انجام دهد و چه کسی فعالیتهای لازم را تأمین میکند، کار دشوار میشود.
کیفیت دادهها به سلامت انسان شباهت دارد. آزمایش دقیق اینکه چگونه هر یک از عناصر رژیم غذایی و ورزش ممکن است بر سلامتی ما تأثیر بگذارد، کمی سخت است. به همین ترتیب، آزمایش دقیق اینکه چگونه هر یک از عناصر داده، ممکن است بر کسبوکار ما تأثیر بگذارد، نیز بسیار سخت خواهد بود.
چند نمونه از عدم توجه به کیفیت داده
در بازاریابی:
با ارسال همان مطالب بیش از یک بار به همان شخص، با اطلاعاتی که کمی متفاوت است، بیش از حد هزینه میکنید و چشمانداز خود را آسیبپذیر خواهید کرد. مشکل در اینجا نسخههای تکراری در یک پایگاه داده و چندین منبع داخلی و خارجی است.
در فروش آنلاین
شاید شما نمیتوانید دادههای مربوط به محصول را برای پشتیبانی از خرید سلف سرویس ارائه دهید. مواردی که در اینجا وجود دارد احتمالا ناقص بودن اطلاعات محصول در پایگاه داده شما است.
در زنجیره تامین
احتمال دارد شما نتوانید فرایندها را بر اساس اطلاعات مکان قابل اعتماد به طور خودکار پیش ببرید. چالشهای موجود در این بحث استفاده از همان استانداردها و داشتن دقت لازم در دادههای مکان مورد نظر را شامل میشود.
در گزارشگری مالی
اگر پاسخهای متفاوتی برای بودجهبندی یک سال میگیرید، میتواند به دلیل ناسازگاری دادهها، تغییر ارزش دادهها و تعاریف دادههای نامشخص باشد.
تأثیر بیتوجهی کیفیت دادهها در رسیدن به اهداف
عدم توانایی واکنش به موقع به فرصتهای جدید بازار
این مسئله به جلوگیری از سود و رشد بیشتر منجر خواهد شد. این مسئله اغلب به دلیل آماده نبودن برای استفاده مجدد از دادههای موجود است. به معنای دیگر، در دست داشتن دادههایی که به روز نیستند و فقط برای نیازهای گذشته مناسب بودند، ما را از اهداف خود دور خواهد کرد.
ایجاد موانع برای برنامههای کاهش هزینه
عدم توجه به اتوماسیون دادهها، باعث میشود دادههایی که باید از روندهای جاری کسبوکار پشتیبانی کنند، به بازرسی و اصلاح دستی بیش از حد نیاز داشته باشند. اتوماسیون فقط روی دادههای کامل و سازگار کار خواهد کرد.
کمبودهایی در تأمین نیازهای اصلی
این الزامات از مقررات حفظ حریم خصوصی و حفاظت از دادهها به عنوان GDPR، الزامات بهداشتی و ایمنی در صنایع مختلف گرفته تا محدودیتهای مالی، الزامات و دستورالعملها را شامل میشود. برای دستیابی به این اهداف، توجه به کیفیت داده بسیار ضروری است.
مشکلات در بهرهبرداری از تجزیه و تحلیل پیشگویانه
کیفیت دادههای یک شرکت، در نتیجه تصمیمگیری کوتاهمدت و بلندمدت، بیش از حد ضروری هستند. این چالشها از مسائل پیرامون تکثیر دادهها، ناقص بودن دادهها، ناسازگاری دادهها و عدم صحت دادهها ناشی میشود.
ابعاد کیفیت داده
هنگام بهبود کیفیت دادهها، هدف اصلی ما اندازهگیری و بهبود طیف وسیعی از ابعاد کیفیت دادهها خواهد بود. وقتی صحبت از دادههای مشتری اصلی میشود، منحصر به فردترین مخاطب، ابعاد کیفیت داده را مشخص میکند. دادههای مشتری اصلی اغلب توسط نسخههای کپی مخدوش میشوند، به این معنی که دو یا چند ردیف پایگاه داده توصیف شده از همان نسخه موجود در دنیای واقعی، وجود خواهد داشت. چندین روش تصحیح برای این مورد وجود دارد که از رهگیری نسخههای کپی در نقطه پردازنده گرفته تا تکثیر انبوه سوابق موجود در یک یا چند پایگاه داده، را مورد بررسی قرار خواهد داد.
با استفاده از دادههای اصلی محصول، منحصر به فرد بودن، مسئله کم اهمیتی است. با این حال، کامل بودن اغلب درد بزرگی خواهد بود. یک دلیل این است که کامل بودن به معنای نیازهای مختلف برای دستههای مختلف محصولات است. هنگام کار با مکان اصلی برای سازگاری، کامل بودن دادهها میتواند یک چالش باشد.
آنچه که لازم است در مورد مشتریان و محصولات بدانیم و تشکیل دهنده لیست سوالات اصلی ماست. این موارد دامنه اصلی کار ما را نشان خواهد داد. این میان مهم است که اندازهگیری هر واحد را به درستی انجام دهید. از طرفی به موقع بودن (یعنی دادهها در زمان مورد نیاز در دسترس باشند)، ابعاد کیفیت دادهها را به میزان لازم مشخص میکند.
سایر ابعاد کیفیت دادهها برای اندازهگیری و بهبود، در مورد همترازی یا هم راستایی با منبع قابل تأیید در جهان واقعی و یکپارچگی دادهها برای گسترش کار، مورد توجه خواهد بود.
نتیجه سخن
همان طور که ذکر آن رفت، بهبود کیفیت دادهها منجر به تصمیمگیری بهتر در سازمان میشود. هرچه اطلاعات با کیفیت بیشتری داشته باشید، میتوانید از تصمیمات خود اطمینان بیشتری حاصل نمایید. دادههای خوب ریسکها را کاهش میدهند و میتوانند منجر به بهبود مداوم نتایج شوند.