هوش تجاری
تعریف یکپارچگی داده و نحوه ایجاد آن
تصور کنید یک شرکت داروسازی، ایمنی محصول دارویی شگفتانگیز و جدید خود را تبلیغ میکند. اما وقتی سازمان غذا و دارو تأسیسات تولید را بررسی میکند، کار بلافاصله متوقف میشود. این اتفاق بدلیل عدم وجود دادههای مهم کنترل کیفیت افتاده است. متأسفانه این نمونه واقعی از عدم یکپارچگی دادهها، غیرمعمول نیست. مشکلات مربوط به صحت و سازگاری دادهها در تمام صنایع وجود دارد و میتواند از دردسرهای جزئی تا مشکلات قابل توجه را در کسب و کارها به وجود آورد.
در عصر امروز که استفاده از کلان داده (Big Data) رونق بسیاری دارد، وقتی اطلاعات بیشتری از هر زمان دیگر پردازش و ذخیره میشوند، اجرای اقدامات جهت حفظ یکپارچگی داده جمعآوریشده اهمیت بیشتری پیدا میکند. شناخت اصول یکپارچگی داده (Data Integrity) و نحوه عملکرد آنها اولین قدم در حفظ امنیت دادهها است. برای یادگیری اینکه یکپارچگی داده چیست، چرا ضروری است و برای سالم نگه داشتن دادههای خود چه کاری میتوانید انجام دهید، پیشنهاد میکنیم این مقاله را حتما بخوانید.
یکپارچگی داده چیست؟
یکپارچگی داده به معنی صحت، کامل بودن و سازگاری کلی دادهها است. یکپارچگی داده همچنین به ایمنی دادهها در رابطه با انطباق نظارتی (مانند انطباق با GDPR) و امنیت اشاره دارد. این امر با مجموعهای از فرآیندها، قوانین و استانداردهای پیادهسازی شده در مرحله طراحی حفظ میشود. وقتی یکپارچگی داده ایمن باشد، اطلاعات ذخیرهشده در یک پایگاه داده صرف نظر از مدت زمان ذخیره یا تعداد دفعات دسترسی، کامل، دقیق و قابل اعتماد خواهد بود. یکپارچگی داده همچنین ایمن بودن دادههای شما نسبت به هرگونه نیروهای خارجی را تضمین میکند.
انواع یکپارچگی داده
یکپارچگی داده دو نوع دارد: یکپارچگی فیزیکی (Physical Integrity) و یکپارچگی منطقی (Logical Integrity). هر دو مجموعه فرآیندها و روشهایی هستند که یکپارچگی داده را در هر دو پایگاه داده سلسله مراتبی و رابطهای اعمال میکنند.
یکپارچگی فیزیکی
یکپارچگی فیزیکی، محافظت از تمامیت و صحت دادهها در هنگام ذخیره و بازیابی است. وقتی بلایای طبیعی رخ میدهد، جریان برق قطع میشود یا هکرها عملکرد پایگاه داده را مختل میکنند، یکپارچگی فیزیکی به خطر میافتد. خطاهای انسانی، فرسایش ذخیرهسازی و موارد دیگر نیز میتواند دستیابی به دادههای دقیق را برای مدیران پردازش دادهها، برنامهنویسان سیستم، برنامهنویسان و حسابرسان داخلی غیرممکن سازد.
یکپارچگی منطقی
یکپارچگی منطقی دادهها را بدون تغییر نگه میدارد زیرا در پایگاه داده رابطهای به طرق مختلف استفاده میشود. یکپارچگی منطقی از دادهها در برابر خطاهای انسانی و هکرها نیز محافظت میکند، اما به روشی کاملاً متفاوت از یکپارچگی فیزیکی. چهار نوع یکپارچگی منطقی وجود دارد:
یکپارچگی نهاد (Entity Integrity)
یکپارچگی نهاد به ایجاد کلیدهای اصلی یا مقادیر منحصر به فرد برای شناسایی دادهها متکی است تا اطمینان حاصل کند که دادهها بیش از یک بار لیست نشدهاند و هیچ فیلدی در جدول خنثی نیست. این یک ویژگی از سیستمهای رابطهای است که دادهها را در جداول ذخیره میکند که میتوانند به روشهای مختلفی پیوند داده شده و استفاده شوند.
یکپارچگی مرجع (Referential Integrity)
یکپارچگی مرجع به مجموعه فرایندهایی گفته میشود که اطمینان حاصل میکنند دادهها بصورت یکنواخت ذخیره و استفاده میشوند. قوانینی که در مورد نحوه استفاده از کلیدهای خارجی در ساختار پایگاه داده تعبیه شده است، اطمینان حاصل میکند که فقط تغییرات، اضافات یا حذف دادههای مناسب رخ میدهد. این قوانین ممکن است محدودیتهایی داشته باشد که ورود دادههای تکراری را از بین میبرد، صحت دادهها را تضمین میکند و یا ورود دادههایی را که اعمال نمیشوند، ممنوع میکند.
یکپارچگی دامنه (Domain Integrity)
یکپارچگی دامنه مجموعه فرآیندهایی است که از دقت هر قطعه داده در یک دامنه اطمینان حاصل میکنند. در این زمینه، یک دامنه مجموعهای از مقادیر قابل قبول است که یک ستون مجاز به استفاده از آن میباشد. این اتفاق شامل محدودیتها و معیارهای دیگری میباشد که قالب، نوع و مقدار داده وارد شده را محدود میکند.
یکپارچگی تعریف شده توسط کاربر (User-defined Integrity)
یکپارچگی تعریف شده توسط کاربر شامل قوانین و محدودیتهایی است که کاربر متناسب با نیازهای خاص خود ایجاد میکند. بعضی اوقات یکپارچگی نهاد، ارجاع و دامنه برای محافظت از دادهها کافی نیستند. غالباً، قوانین خاص کسب و کار باید در نظر گرفته و در اقدامات یکپارچگی داده گنجانده شود.
یکپارچگی داده را با چه مواردی نباید اشتباه گرفت
با وجود سیل اطلاعات در مورد یکپارچگی داده، ممکن است معنای آن با چیزهای دیگری اشتباه گرفته شود. غالباً امنیت دادهها و کیفیت دادهها به اشتباه جایگزین یکپارچگی داده میشوند، اما هر اصطلاح معنای متمایزی دارد.
یکپارچگی داده با امنیت داده تفاوت دارد
امنیت داده (Data Security) مجموعه اقدامات انجام شده برای جلوگیری از خراب شدن دادهها است. این مورد شامل استفاده از سیستمها، فرآیندها و رویههایی است که دادهها را برای دیگران که ممکن است از آنها به روشهای مضر استفاده کنند، غیرقابل دسترس میکند. نقض امنیت دادهها ممکن است کوچک و کماهمیت باشد و یا خسارت زیادی وارد کند.
یکپارچگی داده به معنای دست نخورده و دقیق نگه داشتن اطلاعات است، اما هدف امنیت دادهها محافظت از اطلاعات در برابر حملات خارجی میباشد. امنیت داده یکی از جنبههای مختلف یکپارچگی داده است. امنیت دادهها آنقدر گسترده نیست که بتواند بسیاری از فرایندهای لازم برای عدم تغییر دادهها در طول زمان را در بر گیرد.
یکپارچگی داده با کیفیت داده تفاوت دارد
آیا دادههای موجود در پایگاه داده شما با استانداردهای تعریفشده شرکت و نیازهای کسب و کارتان مطابقت دارد؟ کیفیت دادهها با مجموعهای از فرآیندهایی که سن، ارتباط، صحت، کامل بودن و قابلیت اطمینان دادهها را اندازهگیری میکنند، به این سوالات پاسخ میدهند.
دقیقاً مانند امنیت داده، کیفیت داده (Data Quality) تنها بخشی از یکپارچگی داده است، اما از اهمیت اساسی برخوردار میباشد. یکپارچگی داده همه جنبههای کیفیت داده را در بر میگیرد و با اجرای مجموعهای از قوانین و فرآیندهای حاکم بر نحوه ورود، ذخیره، انتقال و بسیاری موارد دیگر، فراتر میرود.
ریسکهای یکپارچگی داده
مجموعهای از عوامل وجود دارد که میتواند بر یکپارچگی داده ذخیرهشده در یک پایگاه داده تأثیر بگذارد. آنها عبارتند از:
خطای انسانی: وقتی افراد اطلاعات را به اشتباه وارد کرده، دادهها را کپی یا حذف میکنند، از پروتکل مناسب پیروی نمیکنند یا هنگام اجرای رویههایی که به منظور حفاظت از اطلاعات انجام میشود، مرتکب اشتباه میگردند، یکپارچگی داده به خطر میافتد.
خطاهای انتقال: وقتی دادهها نتوانند با موفقیت از یک مکان در پایگاه داده به مکان دیگر منتقل شوند، خطای انتقال رخ داده است. خطاهای انتقال وقتی اتفاق میافتد که قطعهای از دادهها در جدول مقصد وجود داشته، اما در جدول منبع در یک پایگاه داده رابطهای وجود نداشته باشد.
اشکالات و ویروسها: جاسوسافزارها، بدافزارها و ویروسها میتوانند به کامپیوتر حمله کرده و دادهها را تغییر داده، حذف یا سرقت کنند.
سختافزار به خطر افتاده: خرابی ناگهانی رایانه یا سرور و مشکلات مربوط به نحوه عملکرد رایانه یا دستگاه دیگر، نمونههایی از خرابیهای قابل توجه بوده و ممکن است نشاندهنده به خطر افتادن سختافزار شما باشد. سختافزار سازگار ممکن است دادهها را به صورت نادرست یا ناقص ارائه دهد، دسترسی به دادهها را محدود یا حذف کرده یا استفاده از اطلاعات را سخت کند.
ریسکهای موجود در یکپارچگی داده با انجام موارد زیر به راحتی کاهش یافته و از بین میروند:
- محدود کردن دسترسی به دادهها و تغییر مجوزها برای محدود کردن تغییرات اطلاعات توسط اشخاص غیر مجاز
- اعتبار سنجی دادهها برای اطمینان از صحت آنها هنگام جمعآوری و استفاده از آنها
- پشتیبانگیری از دادهها
- استفاده از گزارشات مربوط برای پیگیری زمان افزودن، اصلاح یا حذف دادهها
- انجام ممیزیهای داخلی منظم
- استفاده از نرمافزار تشخیص خطا
جمعبندی
تا همین چند سال اخیر جمعآوری اطلاعات دشوار بود، اما امروزه دیگر کار سختی نیست. در واقع ما قادر به جمعآوری اطلاعات بسیار زیادی هستیم، بنابراین مسئولیت حفظ یکپارچگی داده بر عهدهمان خواهد بود. از این طریق، مدیریت میتواند با اطمینان تصمیماتی دادهمحور را اتخاذ کند که شرکت را در مسیر درست هدایت نماید.