هوش تجاری
راهنمای مدلسازی داده (Data Modeling)
مدلسازی داده (Data Modeling) ایده طراحی ساختار پایگاه داده است که توابع پایگاه داده را تعریف میکند. این یک مرحله اساسی برای ایجاد یک پایگاه داده و یک مدل داده خاص است که نمودارهای پایگاه داده را هدایت میکند. مدلهای داده نهادهای اساسی برای تعریف سیستم مدیریت پایگاه داده (DBMS) هستند.
در این راهنمای جامع مدلسازی داده، ما قصد داریم مفاهیم اساسی مدلسازی و انواع مختلف مدلهای داده را بررسی کنیم.
مدلسازی داده چیست؟
مدلسازی داده فرآیند ساخت یک مدل برای ذخیره داده در پایگاه داده است. این یک نمایش تئوریک از اشیاء داده در میان چندین شیء داده میباشد.
این امر شامل فرآیند فرموله کردن دادهها در یک قالب ساختاری است که به تجزیه و تحلیل دادهها کمک میکند تا نیازهای کسب و کار را در آینده برآورده کنیم. مدلهای داده از تطابق در مقادیر پیشفرض، نامگذاری قراردادها، امنیت و معناشناسی برای ارائه دادههای با کیفیت اطمینان حاصل میکنند.
مدل داده چیست؟
مدل داده ساختاری است که برای سازماندهی معناشناسی دادهها، توصیف و سازگاری آنها استفاده میشود.
مدل داده مشخص میکند که چه دادهای مورد نیاز بوده و چگونه ساختار آن ساخته شده است. به عنوان مثال، یک مدل داده مانند نقشه ساختمان یک معمار عمل میکند که راهنمای ساخت مدلهای مفهومی بوده و رابطهای بین عناصر داده تنظیم میکند.
موارد استفاده از مدل داده
موارد استفاده از مدل داده به شرح زیر است:
- یک مدل داده به طراحی پایگاه داده در سه سطح مختلف مانند مفهومی، منطقی و فیزیکی کمک میکند.
- ساختار مشخصی از پایگاه داده را میدهد و توسط توسعهدهندگان برای ایجاد یک پایگاه داده فیزیکی مورد استفاده قرار میگیرد.
- این مدل به تعریف رویههای ذخیره شده، جداول رابطهای، کلیدهای فیزیکی و خارجی کمک میکند.
- این مدل اطمینان میدهد که پایگاه داده نمایانگر همه اشیاء داده است. دادههای حذف شده را که منجر به تولید نتایج نادرست و ایجاد گزارشهای تکراری می شود، شناسایی میکند.
- مدل داده درک بهتری از نیازهای کسب و کار را نشان میدهد.
- در شناسایی دادههای تکراری، زائد و از دست رفته کمک میکند.
- کمک میکند تا یک طراحی قوی ایجاد شود که کل دادههای سازمان را در یک بستر قرار دهد.
- نمایش بصری دادهها به بهبود تجزیه و تحلیل دادهها کمک میکند. این مدل یک تصویر کلی از دادهها ارائه میدهد که میتواند توسط توسعهدهندگان برای ایجاد یک پایگاه داده مورد استفاده قرار گیرد.
فرآیند مدلسازی داده
مدلسازی داده از ذینفعان دعوت میکند تا پردازش و ذخیرهسازی دادهها را با جزئیات دقیق ارزیابی کنند. تکنیکهای مدلسازی داده قراردادهای متفاوتی دارند که حکم میکند کدام نمادها برای نشان دادن دادهها، ترسیم مدلها و نحوه انتقال الزامات کسب و کار استفاده میشوند. همه رویکردها گردش کار رسمی را ارائه میدهند که شامل توالی وظایفی است که باید به صورت تکراری انجام شود. این گردش کارها معمولاً به این شکل هستند:
نهادها را شناسایی کنید. فرآیند مدلسازی داده با شناسایی چیزها، رویدادها یا مفاهیمی که در مجموعه دادهای که قرار است مدلسازی شود، آغاز میشود. هر نهادی باید منسجم و از نظر منطقی از سایر نهادها جدا باشد.
خصوصیات اصلی هر نهاد را شناسایی کنید. هر نوع نهاد را میتوان از انواع دیگر آن متمایز کرد زیرا دارای یک یا چند ویژگی منحصر به فرد هستند. به عنوان مثال، نهادی به نام “مشتری” ممکن است دارای ویژگیهایی مانند نام، نام خانوادگی، شماره تلفن و … باشد، در حالی که نهادی به نام “آدرس” ممکن است شامل نام و شماره خیابان، شهر، ایالت، کشور و کد پستی باشد.
روابط نهادها را شناسایی کنید. اولین پیشنویس یک مدل داده، ماهیت روابط هر نهاد با دیگران را مشخص میکند. در مثال بالا، هر مشتری در “آدرس” زندگی میکند. اگر آن مدل گسترش یابد و نهادی به نام “سفارشات” را شامل شود، هر سفارش به یک آدرس نیز ارسال میشود. این روابط معمولاً از طریق زبان مدلسازی یکپارچه (UML) ثبت میشوند.
ویژگیها را کاملاً به نهادها نسبت دهید. چندین الگوی رسمی مدلسازی داده به طور گسترده مورد استفاده قرار میگیرند. توسعهدهندگان شیءگرا معمولاً الگوهای تجزیه و تحلیل یا الگوهای طراحی را اعمال میکنند، در حالی که ذینفعان سایر حوزههای کسب و کار ممکن است به الگوهای دیگری روی بیاورند.
در صورت لزوم کلیدها را اختصاص دهید و در مورد درجه ای از عادیسازی تصمیمگیری کنید که نیاز به کاهش افزونگی را با نیازهای عملکرد متعادل کند. عادیسازی تکنیکی برای سازماندهی مدلهای داده (و پایگاههای دادهای که آنها نشان میدهند) است که در آن شناسههای عددی، به نام کلیدها، به گروههای داده اختصاص داده میشوند تا روابط بین آنها را بدون تکرار دادهها نشان دهند. به عنوان مثال، اگر به هر مشتری یک کلید اختصاص داده شده باشد، میتوان آن کلید را هم به آدرس و هم به تاریخ سفارش آنها پیوند داد بدون اینکه نیازی به تکرار این اطلاعات در جدول نام مشتری باشد. عادیسازی باعث کاهش فضای ذخیرهسازی مورد نیاز یک پایگاه داده میشود، اما با این وجود میتوان عملکرد را پرس و جو کرد.
مدل داده را نهایی و تأیید کنید. مدلسازی داده فرایندی تکراری است که باید با تغییر نیازهای کسب و کار تکرار و اصلاح شود.
سه دسته مدل داده
سه دسته مدل داده مدلهای مفهومی (Conceptual)، منطقی (Logical) و فیزیکی (Physical) هستند. مدلهای داده برای تعریف دادهها و نحوه ذخیرهسازی آنها در یک پایگاه داده و تعیین رابطه بین عناصر داده استفاده میشوند.
مدل داده مفهومی
از مدل داده مفهومی برای تعریف آنچه سیستم شامل میشود استفاده میگردد. این مدل برای سازماندهی، دامنهگذاری و نشان دادن مفاهیم کسب و کار نیز استفاده میشود.
هدف از ایجاد یک مدل داده مفهومی، توسعه نهادها، روابط و ویژگیها است. معماران و ذینفعان دادهها معمولاً در حال ساخت یک مدل داده مفهومی هستند.
سه مالک اصلی مدل دادههای مفهومی عبارتند از:
- نهاد (Entity): یک چیز واقعی است
- ویژگی (Attribute): ویژگیهای نهاد
- رابطه (Relationship): ارتباط بین دو نهاد
بیایید نمونهای از این مدل داده را بررسی کنیم.
دو نهاد مانند محصول و مشتری را در نظر بگیرید. نام و قیمت محصول از مشخصات نهاد محصول و نام و شماره مشتری از مشخصات نهاد مشتری است. رابطه بین این دو نهاد، فروش است.
- مدل داده مفهومی برای مخاطبان کسب و کار طراحی و توسعه داده شد.
- یک توصیف در کل سازمان از مفاهیم کسب و کار را ارائه میدهد.
- به طور مستقل با مشخصات سختافزاری مانند موقعیت مکانی، ظرفیت ذخیرهسازی دادهها یا مشخصات نرمافزاری مانند فناوری ساخته شده است.
مدل داده منطقی
از مدل داده منطقی برای تعریف ساختار اشیاء داده و ترتیب دادن رابطهای بین آنها استفاده میشود. این مدل، زمینه را برای شکلگیری یک مدل فیزیکی فراهم میکند. این مدل به افزودن اطلاعات بیشتر به عناصر مدل دادههای مفهومی کمک میکند. در مدل منطقی، هیچ کلید اصلی یا ثانویه تعریف نشده است. این مدل به کاربران امکان میدهد جزئیات اتصال را که قبلاً برای روابط تنظیم شدهاند، تنظیم و تأیید کنند.
مدل منطقی، داده مورد نیاز دادهها را برای یک پروژه واحد توصیف میکند اما بسته به دامنه پروژه با سایر مدلهای داده منطقی ادغام میشود. ویژگیهای داده دارای انواع دادههای مختلف با ابعاد و دقت دقیق هستند.
- مدل داده منطقی به طور مستقل از سیستم مدیریت پایگاه داده توسعه و طراحی شده است.
- ویژگیهای داده دارای انواع داده با ابعاد و دقت هستند.
- این مدل دادههای مورد نیاز برای یک پروژه را تعریف میکند اما بسته به دامنه پروژه با سایر مدلهای داده منطقی ادغام میشود.
مدل داده فیزیکی
مدل داده فیزیکی پیادهسازی مدل در پایگاه داده را تعریف میکند. جاذبه پایگاه داده را فراهم کرده و به تولید طرح کمک میکند. این مدل داده با تکرار محدودیتهای پایگاه داده، محرکها، کلیدهای ستون، سایر ویژگیهای پایگاه داده رابطهای (RDMS) و نمایهها به تجسم ساختار پایگاه داده کمک میکند. در این مدل، نماها، نمایههای دسترسی، مجوزها، کلیدهای اصلی و خارجی و … تعریف شده است.
مدل داده شامل رابطه بین جداولی است که روابط اکثریت و اقلیت را توصیف میکند. این مدل برای نسخه خاصی از سیستم مدیریت پایگاه داده، ذخیره سازی دادهها و مکان مورد استفاده در پروژه ساخته شده است.
- مدل دادههای فیزیکی برای نسخه سیستم مدیریت پایگاه داده، ذخیره سازی دادهها، مکانی که در پروژه استفاده میشود، ایجاد شده است.
- این مدل شامل روابط بین جداول است که پوچ پذیری و اساسی بودن روابط را نشان می دهد.
- این مدل نماها، نمایههای دسترسی، مجوزها، کلیدهای اصلی و خارجی و غیره را تعریف میکند.