هوش تجاری

تعریف یکپارچگی داده و نحوه ایجاد آن

تصور کنید یک شرکت داروسازی، ایمنی محصول دارویی شگفت‌انگیز و جدید خود را تبلیغ می‌کند. اما وقتی سازمان غذا و دارو تأسیسات تولید را بررسی می‌کند، کار بلافاصله متوقف می‌شود. این اتفاق بدلیل عدم وجود داده‌های مهم کنترل کیفیت افتاده است. متأسفانه این نمونه واقعی از عدم یکپارچگی داده‌ها، غیرمعمول نیست. مشکلات مربوط به صحت و سازگاری داده‌ها در تمام صنایع وجود دارد و می‌تواند از دردسرهای جزئی تا مشکلات قابل توجه را در کسب و کارها به وجود آورد.

در عصر امروز که استفاده از کلان داده (Big Data) رونق بسیاری دارد، وقتی اطلاعات بیشتری از هر زمان دیگر پردازش و ذخیره می‌شوند، اجرای اقدامات جهت حفظ یکپارچگی داده جمع‌آوری‌شده اهمیت بیشتری پیدا می‌کند. شناخت اصول یکپارچگی داده (Data Integrity) و نحوه عملکرد آن‌ها اولین قدم در حفظ امنیت داده‌ها است. برای یادگیری اینکه یکپارچگی داده چیست، چرا ضروری است و برای سالم نگه داشتن داده‌های خود چه کاری می‌توانید انجام دهید، پیشنهاد می‌کنیم این مقاله را حتما بخوانید.

یکپارچگی داده چیست؟

یکپارچگی داده به معنی صحت، کامل بودن و سازگاری کلی داده‌ها است. یکپارچگی داده همچنین به ایمنی داده‌ها در رابطه با انطباق نظارتی (مانند انطباق با GDPR) و امنیت اشاره دارد. این امر با مجموعه‌ای از فرآیندها، قوانین و استانداردهای پیاده‌سازی شده در مرحله طراحی حفظ می‌شود. وقتی یکپارچگی داده ایمن باشد، اطلاعات ذخیره‌شده در یک پایگاه داده صرف نظر از مدت زمان ذخیره یا تعداد دفعات دسترسی، کامل، دقیق و قابل اعتماد خواهد بود. یکپارچگی داده همچنین ایمن بودن داده‌های شما نسبت به هرگونه نیروهای خارجی را تضمین می‌کند.

حتما بخوانید:  یادگیری عمیق چیست؟

انواع یکپارچگی داده

یکپارچگی داده دو نوع دارد: یکپارچگی فیزیکی (Physical Integrity) و یکپارچگی منطقی (Logical Integrity). هر دو مجموعه فرآیندها و روش‌هایی هستند که یکپارچگی داده را در هر دو پایگاه داده سلسله مراتبی و رابطه‌ای اعمال می‌کنند.

یکپارچگی فیزیکی

یکپارچگی فیزیکی، محافظت از تمامیت و صحت داده‌ها در هنگام ذخیره و بازیابی است. وقتی بلایای طبیعی رخ می‌دهد، جریان برق قطع می‌شود یا هکرها عملکرد پایگاه داده را مختل می‌کنند، یکپارچگی فیزیکی به خطر می‌افتد. خطاهای انسانی، فرسایش ذخیره‌سازی و موارد دیگر نیز می‌تواند دستیابی به داده‌های دقیق را برای مدیران پردازش داده‌ها، برنامه‌نویسان سیستم، برنامه‌نویسان و حسابرسان داخلی غیرممکن سازد.

یکپارچگی منطقی

یکپارچگی منطقی داده‌ها را بدون تغییر نگه می‌دارد زیرا در پایگاه داده رابطه‌ای به طرق مختلف استفاده می‌شود. یکپارچگی منطقی از داده‌ها در برابر خطاهای انسانی و هکرها نیز محافظت می‌کند، اما به روشی کاملاً متفاوت از یکپارچگی فیزیکی. چهار نوع یکپارچگی منطقی وجود دارد:

یکپارچگی نهاد (Entity Integrity)

یکپارچگی نهاد به ایجاد کلیدهای اصلی یا مقادیر منحصر به فرد برای شناسایی داده‌ها متکی است تا اطمینان حاصل کند که داده‌ها بیش از یک بار لیست نشده‌اند و هیچ فیلدی در جدول خنثی نیست. این یک ویژگی از سیستم‌های رابطه‌ای است که داده‌ها را در جداول ذخیره می‌کند که می‌توانند به روش‌های مختلفی پیوند داده شده و استفاده شوند.

یکپارچگی مرجع (Referential Integrity)

یکپارچگی مرجع به مجموعه فرایندهایی گفته می‌شود که اطمینان حاصل می‌کنند داده‌ها بصورت یکنواخت ذخیره و استفاده می‌شوند. قوانینی که در مورد نحوه استفاده از کلیدهای خارجی در ساختار پایگاه داده تعبیه شده است، اطمینان حاصل می‌کند که فقط تغییرات، اضافات یا حذف داده‌های مناسب رخ می‌دهد. این قوانین ممکن است محدودیت‌هایی داشته باشد که ورود داده‌های تکراری را از بین می‌برد، صحت داده‌ها را تضمین می‌کند و یا ورود داده‌هایی را که اعمال نمی‌شوند، ممنوع می‌کند.

یکپارچگی دامنه (Domain Integrity)

یکپارچگی دامنه مجموعه فرآیندهایی است که از دقت هر قطعه داده در یک دامنه اطمینان حاصل می‌کنند. در این زمینه، یک دامنه مجموعه‌ای از مقادیر قابل قبول است که یک ستون مجاز به استفاده از آن می‌باشد. این ‌اتفاق شامل محدودیت‌ها و معیارهای دیگری می‌باشد که قالب، نوع و مقدار داده وارد شده را محدود می‌کند.

یکپارچگی تعریف شده توسط کاربر (User-defined Integrity)

یکپارچگی تعریف شده توسط کاربر شامل قوانین و محدودیت‌هایی است که کاربر متناسب با نیازهای خاص خود ایجاد می‌کند. بعضی اوقات یکپارچگی نهاد، ارجاع و دامنه برای محافظت از داده‌ها کافی نیستند. غالباً، قوانین خاص کسب و کار باید در نظر گرفته و در اقدامات یکپارچگی داده گنجانده شود.

یکپارچگی داده را با چه مواردی نباید اشتباه گرفت

با وجود سیل اطلاعات در مورد یکپارچگی داده، ممکن است معنای آن با چیزهای دیگری اشتباه گرفته شود. غالباً امنیت داده‌ها و کیفیت داده‌ها به اشتباه جایگزین یکپارچگی داده می‌شوند، اما هر اصطلاح معنای متمایزی دارد.

یکپارچگی داده با امنیت داده تفاوت دارد

امنیت داده (Data Security) مجموعه اقدامات انجام شده برای جلوگیری از خراب شدن داده‌ها است. این مورد شامل استفاده از سیستم‌ها، فرآیندها و رویه‌هایی است که داده‌ها را برای دیگران که ممکن است از آن‌ها به روش‌های مضر استفاده کنند، غیرقابل دسترس می‌کند. نقض امنیت داده‌ها ممکن است کوچک و کم‌اهمیت باشد و یا خسارت زیادی وارد کند.

یکپارچگی داده به معنای دست نخورده و دقیق نگه داشتن اطلاعات است، اما هدف امنیت داده‌ها محافظت از اطلاعات در برابر حملات خارجی می‌باشد. امنیت داده یکی از جنبه‌های مختلف یکپارچگی داده است. امنیت داده‌ها آنقدر گسترده نیست که بتواند بسیاری از فرایندهای لازم برای عدم تغییر داده‌ها در طول زمان را در بر گیرد.

یکپارچگی داده با کیفیت داده تفاوت دارد

آیا داده‌های موجود در پایگاه داده شما با استانداردهای تعریف‌شده شرکت و نیازهای کسب و کارتان مطابقت دارد؟ کیفیت داده‌ها با مجموعه‌ای از فرآیندهایی که سن، ارتباط، صحت، کامل بودن و قابلیت اطمینان داده‌ها را اندازه‌گیری می‌کنند، به این سوالات پاسخ می‌دهند.

دقیقاً مانند امنیت داده، کیفیت داده (Data Quality) تنها بخشی از یکپارچگی داده است، اما از اهمیت اساسی برخوردار می‌باشد. یکپارچگی داده همه جنبه‌های کیفیت داده را در بر می‌گیرد و با اجرای مجموعه‌ای از قوانین و فرآیندهای حاکم بر نحوه ورود، ذخیره، انتقال و بسیاری موارد دیگر، فراتر می‌رود.

ریسک‌های یکپارچگی داده

مجموعه‌ای از عوامل وجود دارد که می‌تواند بر یکپارچگی داده ذخیره‌شده در یک پایگاه داده تأثیر بگذارد. آن‌ها عبارتند از:

خطای انسانی: وقتی افراد اطلاعات را به اشتباه وارد کرده، داده‌ها را کپی یا حذف می‌کنند، از پروتکل مناسب پیروی نمی‌کنند یا هنگام اجرای رویه‌هایی که به منظور حفاظت از اطلاعات انجام می‌شود، مرتکب اشتباه می‌گردند، یکپارچگی داده به خطر می‌افتد.

خطاهای انتقال: وقتی داده‌ها نتوانند با موفقیت از یک مکان در پایگاه داده به مکان دیگر منتقل شوند، خطای انتقال رخ داده است. خطاهای انتقال وقتی اتفاق می‌افتد که قطعه‌ای از داده‌ها در جدول مقصد وجود داشته، اما در جدول منبع در یک پایگاه داده رابطه‌ای وجود نداشته باشد.

اشکالات و ویروس‌ها: جاسوس‌افزارها، بدافزارها و ویروس‌ها می‌توانند به کامپیوتر حمله کرده و داده‌ها را تغییر داده، حذف یا سرقت کنند.

سخت‌افزار به خطر افتاده: خرابی ناگهانی رایانه یا سرور و مشکلات مربوط به نحوه عملکرد رایانه یا دستگاه دیگر، نمونه‌هایی از خرابی‌های قابل توجه بوده و ممکن است نشان‌دهنده به خطر افتادن سخت‌افزار شما باشد. سخت‌افزار سازگار ممکن است داده‌ها را به صورت نادرست یا ناقص ارائه دهد، دسترسی به داده‌ها را محدود یا حذف کرده یا استفاده از اطلاعات را سخت کند.

ریسک‌های موجود در یکپارچگی داده با انجام موارد زیر به راحتی کاهش یافته و از بین می‌روند:

  • محدود کردن دسترسی به داده‌ها و تغییر مجوزها برای محدود کردن تغییرات اطلاعات توسط اشخاص غیر مجاز
  • اعتبار سنجی داده‌ها برای اطمینان از صحت آن‌ها هنگام جمع‌آوری و استفاده از آن‌ها
  • پشتیبان‌گیری از داده‌ها
  • استفاده از گزارشات مربوط برای پیگیری زمان افزودن، اصلاح یا حذف داده‌ها
  • انجام ممیزی‌های داخلی منظم
  • استفاده از نرم‌افزار تشخیص خطا

جمع‌بندی

تا همین چند سال اخیر جمع‌آوری اطلاعات دشوار بود، اما امروزه دیگر کار سختی نیست. در واقع ما قادر به جمع‌آوری اطلاعات بسیار زیادی هستیم، بنابراین مسئولیت حفظ یکپارچگی داده بر عهده‌مان خواهد بود. از این طریق، مدیریت می‌تواند با اطمینان تصمیماتی داده‌محور را اتخاذ کند که شرکت را در مسیر درست هدایت نماید.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

بستن