هوش تجاری

راهنمای مدل‌سازی داده (Data Modeling)

مدل‌سازی داده (Data Modeling) ایده طراحی ساختار پایگاه داده است که توابع پایگاه داده را تعریف می‌کند. این یک مرحله اساسی برای ایجاد یک پایگاه داده و یک مدل داده خاص است که نمودارهای پایگاه داده را هدایت می‌کند. مدل‌های داده نهاد‌های اساسی برای تعریف سیستم مدیریت پایگاه داده (DBMS) هستند.

در این راهنمای جامع مدل‌سازی داده، ما قصد داریم مفاهیم اساسی مدل‌سازی و انواع مختلف مدل‌های داده را بررسی کنیم.

مدل‌سازی داده چیست؟

مدل‌سازی داده فرآیند ساخت یک مدل برای ذخیره داده در پایگاه داده است. این یک نمایش تئوریک از اشیاء داده در میان چندین شیء داده می‌باشد.

این امر شامل فرآیند فرموله کردن داده‌ها در یک قالب ساختاری است که به تجزیه و تحلیل داده‌ها کمک می‌کند تا نیازهای کسب و کار را در آینده برآورده کنیم. مدل‌های داده از تطابق در مقادیر پیش‌فرض، نامگذاری قراردادها، امنیت و معناشناسی برای ارائه داده‌های با کیفیت اطمینان حاصل می‌کنند.

مدل داده چیست؟

مدل داده ساختاری است که برای سازمان‌دهی معناشناسی داده‌ها، توصیف و سازگاری آن‌ها استفاده می‌شود.

مدل داده مشخص می‌کند که چه داده‌ای مورد نیاز بوده و چگونه ساختار آن ساخته شده است. به عنوان مثال، یک مدل داده مانند نقشه ساختمان یک معمار عمل می‌کند که راهنمای ساخت مدل‌های مفهومی بوده و رابطه‌ای بین عناصر داده تنظیم می‌کند.

موارد استفاده از مدل داده

موارد استفاده از مدل داده به شرح زیر است:

  • یک مدل داده به طراحی پایگاه داده در سه سطح مختلف مانند مفهومی، منطقی و فیزیکی کمک می‌کند.
  • ساختار مشخصی از پایگاه داده را می‌دهد و توسط توسعه‌دهندگان برای ایجاد یک پایگاه داده فیزیکی مورد استفاده قرار می‌گیرد.
  • این مدل به تعریف رویه‌های ذخیره شده، جداول رابطه‌ای، کلیدهای فیزیکی و خارجی کمک می‌کند.
  • این مدل اطمینان می‌دهد که پایگاه داده نمایانگر همه اشیاء داده است. داده‌های حذف شده را که منجر به تولید نتایج نادرست و ایجاد گزارش‌های تکراری می شود، شناسایی می‌کند.
  • مدل داده درک بهتری از نیازهای کسب و کار را نشان می‌دهد.
  • در شناسایی داده‌های تکراری، زائد و از دست رفته کمک می‌کند.
  • کمک می‌کند تا یک طراحی قوی ایجاد شود که کل داده‌های سازمان را در یک بستر قرار دهد.
  • نمایش بصری داده‌ها به بهبود تجزیه و تحلیل داده‌ها کمک می‌کند. این مدل یک تصویر کلی از داده‌ها ارائه می‌دهد که می‌تواند توسط توسعه‌دهندگان برای ایجاد یک پایگاه داده مورد استفاده قرار گیرد.

فرآیند مدل‌سازی داده

مدل‌سازی داده از ذینفعان دعوت می‌کند تا پردازش و ذخیره‌سازی داده‌ها را با جزئیات دقیق ارزیابی کنند. تکنیک‌های مدل‌سازی داده قراردادهای متفاوتی دارند که حکم می‌کند کدام نمادها برای نشان دادن داده‌ها، ترسیم مدل‌ها و نحوه انتقال الزامات کسب و کار استفاده می‌شوند. همه رویکردها گردش کار رسمی را ارائه می‌دهند که شامل توالی وظایفی است که باید به صورت تکراری انجام شود. این گردش کارها معمولاً به این شکل هستند:

نهادها را شناسایی کنید. فرآیند مدل‌سازی داده با شناسایی چیزها، رویدادها یا مفاهیمی که در مجموعه داده‌ای که قرار است مدل‌سازی شود، آغاز می‌شود. هر نهادی باید منسجم و از نظر منطقی از سایر نهادها جدا باشد.

خصوصیات اصلی هر نهاد را شناسایی کنید. هر نوع نهاد را می‌توان از انواع دیگر آن متمایز کرد زیرا دارای یک یا چند ویژگی منحصر به فرد هستند. به عنوان مثال، نهادی به نام “مشتری” ممکن است دارای ویژگی‌هایی مانند نام، نام خانوادگی، شماره تلفن و … باشد، در حالی که نهادی به نام “آدرس” ممکن است شامل نام و شماره خیابان، شهر، ایالت، کشور و کد پستی باشد.

روابط نهادها را شناسایی کنید. اولین پیش‌نویس یک مدل داده، ماهیت روابط هر نهاد با دیگران را مشخص می‌کند. در مثال بالا، هر مشتری در “آدرس” زندگی می‌کند. اگر آن مدل گسترش یابد و نهادی به نام “سفارشات” را شامل شود، هر سفارش به یک آدرس نیز ارسال می‌شود. این روابط معمولاً از طریق زبان مدل‌سازی یکپارچه (UML) ثبت می‌شوند.

ویژگی‌ها را کاملاً به نهادها نسبت دهید. چندین الگوی رسمی مدل‌سازی داده به طور گسترده مورد استفاده قرار می‌گیرند. توسعه‌دهندگان شیءگرا معمولاً الگوهای تجزیه و تحلیل یا الگوهای طراحی را اعمال می‌کنند، در حالی که ذینفعان سایر حوزه‌های کسب و کار ممکن است به الگوهای دیگری روی بیاورند.

در صورت لزوم کلیدها را اختصاص دهید و در مورد درجه ای از عادی‌سازی تصمیم‌گیری کنید که نیاز به کاهش افزونگی را با نیازهای عملکرد متعادل کند. عادی‌سازی تکنیکی برای سازمان‌دهی مدل‌های داده (و پایگاه‌های داده‌ای که آن‌ها نشان می‌دهند) است که در آن شناسه‌های عددی، به نام کلیدها، به گروه‌های داده اختصاص داده می‌شوند تا روابط بین آن‌ها را بدون تکرار داده‌ها نشان دهند. به عنوان مثال، اگر به هر مشتری یک کلید اختصاص داده شده باشد، می‌توان آن کلید را هم به آدرس و هم به تاریخ سفارش آن‌ها پیوند داد بدون اینکه نیازی به تکرار این اطلاعات در جدول نام مشتری باشد. عادی‌سازی باعث کاهش فضای ذخیره‌سازی مورد نیاز یک پایگاه داده می‌شود، اما با این وجود می‌توان عملکرد را پرس و جو کرد.

مدل داده را نهایی و تأیید کنید. مدل‌سازی داده فرایندی تکراری است که باید با تغییر نیازهای کسب و کار تکرار و اصلاح شود.

سه دسته مدل داده

سه دسته مدل داده مدل‌های مفهومی (Conceptual)، منطقی (Logical) و فیزیکی (Physical) هستند. مدل‌های داده برای تعریف داده‌ها و نحوه ذخیره‌سازی آن‌ها در یک پایگاه داده و تعیین رابطه بین عناصر داده استفاده می‌شوند.

مدل داده مفهومی

از مدل داده مفهومی برای تعریف آنچه سیستم شامل می‌شود استفاده می‌گردد. این مدل برای سازمان‌دهی، دامنه‌گذاری و نشان دادن مفاهیم کسب و کار نیز استفاده می‌شود.

هدف از ایجاد یک مدل داده مفهومی، توسعه نهاد‌ها، روابط و ویژگی‌ها است. معماران و ذینفعان داده‌ها معمولاً در حال ساخت یک مدل داده مفهومی هستند.

سه مالک اصلی مدل داده‌های مفهومی عبارتند از:

  • نهاد (Entity): یک چیز واقعی است
  • ویژگی (Attribute): ویژگی‌های نهاد
  • رابطه (Relationship): ارتباط بین دو نهاد

بیایید نمونه‌ای از این مدل داده را بررسی کنیم.

دو نهاد مانند محصول و مشتری را در نظر بگیرید. نام و قیمت محصول از مشخصات نهاد محصول و نام و شماره مشتری از مشخصات نهاد مشتری است. رابطه بین این دو نهاد، فروش است.

  • مدل داده مفهومی برای مخاطبان کسب و کار طراحی و توسعه داده شد.
  • یک توصیف در کل سازمان از مفاهیم کسب و کار را ارائه می‌دهد.
  • به طور مستقل با مشخصات سخت‌افزاری مانند موقعیت مکانی، ظرفیت ذخیره‌سازی داده‌ها یا مشخصات نرم‌افزاری مانند فناوری ساخته شده است.

مدل داده منطقی

از مدل داده منطقی برای تعریف ساختار اشیاء داده و ترتیب دادن رابطه‌ای بین آن‌ها استفاده می‌شود. این مدل، زمینه را برای شکل‌گیری یک مدل فیزیکی فراهم می‌کند. این مدل به افزودن اطلاعات بیشتر به عناصر مدل داده‌های مفهومی کمک می‌کند. در مدل منطقی، هیچ کلید اصلی یا ثانویه تعریف نشده است. این مدل به کاربران امکان می‌دهد جزئیات اتصال را که قبلاً برای روابط تنظیم شده‌اند، تنظیم و تأیید کنند.

مدل منطقی، داده مورد نیاز داده‌ها را برای یک پروژه واحد توصیف می‌کند اما بسته به دامنه پروژه با سایر مدل‌های داده منطقی ادغام می‌شود. ویژگی‌های داده دارای انواع داده‌های مختلف با ابعاد و دقت دقیق هستند.

  • مدل داده منطقی به طور مستقل از سیستم مدیریت پایگاه داده توسعه و طراحی شده است.
  • ویژگی‌های داده دارای انواع داده با ابعاد و دقت هستند.
  • این مدل داده‌های مورد نیاز برای یک پروژه را تعریف می‌کند اما بسته به دامنه پروژه با سایر مدل‌های داده منطقی ادغام می‌شود.

مدل داده فیزیکی

مدل داده فیزیکی پیاده‌سازی مدل در پایگاه داده را تعریف می‌کند. جاذبه پایگاه داده را فراهم کرده و به تولید طرح کمک می‌کند. این مدل داده با تکرار محدودیت‌های پایگاه داده، محرک‌ها، کلیدهای ستون، سایر ویژگی‌های پایگاه داده رابطه‌ای (RDMS) و نمایه‌ها به تجسم ساختار پایگاه داده کمک می‌کند. در این مدل، نماها، نمایه‌های دسترسی، مجوزها، کلیدهای اصلی و خارجی و … تعریف شده است.

مدل داده شامل رابطه بین جداولی است که روابط اکثریت و اقلیت را توصیف می‌کند. این مدل برای نسخه خاصی از سیستم مدیریت پایگاه داده، ذخیره سازی داده‌ها و مکان مورد استفاده در پروژه ساخته شده است.

  • مدل داده‌های فیزیکی برای نسخه سیستم مدیریت پایگاه داده، ذخیره سازی داده‌ها، مکانی که در پروژه استفاده می‌شود، ایجاد شده است.
  • این مدل شامل روابط بین جداول است که پوچ پذیری و اساسی بودن روابط را نشان می دهد.
  • این مدل نماها، نمایه‌های دسترسی، مجوزها، کلیدهای اصلی و خارجی و غیره را تعریف می‌کند.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دوره تخصصی «مدیریت پروژه چابک (اجایل)» با اسکرام مستر ارشد اکالااطلاعات بیشتر و ثبت‌نام
بستن