هوش تجاری
متادیتا (Metadata) یا فراداده چیست و انواع آن کدامند؟
متادیتا (Metadata) اغلب به دادههایی گفته میشود که دادههای دیگر را توصیف میکنند. در واقع دادههای مرجع ساختاریافتهای هستند که به مرتب سازی و شناسایی صفات دادههایی که توصیف میکنند، کمک خواهند کرد. جان دبلیو وارن در کتاب ” Zen and the Art of Metadata Maintenance “، فراداده را به عنوان ” جهان و DNA” توصیف میکند. در متن پیش رو به بررسی این مهم و انواع آن خواهیم پرداخت.
متادیتا (Metadata) یا فراداده چیست؟
در یک مثال ساده، فراداده برای یک سند شامل مجموعهای از اطلاعات مانند نویسنده، اندازه سند، تاریخ ایجاد و کلمات کلیدی برای توصیف آن، خواهد بود. فراداده برای یک فایل موسیقی ممکن است شامل نام هنرمند، آلبوم و سال انتشار آن باشد.
برای پروندههای رایانهای، فراداده را میتوان درون خود پرونده یا جاهای دیگر ذخیره کرد. مانند مورد برخی از پروندههای کتاب EPUB که فرادادهها را در یک پرونده ANNOT مرتبط نگه میدارد.
فراداده اطلاعات پشت صحنه را نشان میدهد که در هر مکانی، توسط هر صنعت، به روشهای مختلفی استفاده میشود. فراداده در سیستمهای اطلاعاتی، رسانههای اجتماعی، وبسایتها، نرمافزار، خدمات موسیقی و خردهفروشی آنلاین وجود دارد. فراداده را میتوان به صورت دستی برای انتخاب و گزینش موارد موجود ایجاد کرد، اما همچنین میتواند براساس دادهها به صورت خودکار تولید شود. این مسئله را در ادامه توضیح میدهیم.
Meta پیشوندی است که (در بیشتر کاربردهای فناوری اطلاعات) به معنای “تعریف یا توصیف زیربنایی” در نظر گرفته میشود. در بیان کلی، فراداده اطلاعات اساسی مربوط به دادهها را خلاصه میکند که میتواند یافتن، استفاده و بازنگری از نمونههای خاص دادهها را آسان کند. به عنوان مثال، نویسنده، تاریخ ایجاد، تاریخ اصلاح و اندازه پرونده، نمونههایی از فراداده پرونده اصلی سند هستند. داشتن توانایی جستجوی یک عنصر خاص (یا عناصری) از این فراداده، موقعیت مکانی یک سند خاص را برای افراد بسیار آسان میکند.
فراداده علاوه بر پروندههای مروبط به اسناد، برای موارد زیر استفاده میشود:
- پروندههای رایانهای
- تصاویر
- پایگاه داده رابطهای
- صفحات گسترده
- فیلمها
- فایلهای صوتی
- صفحات وب
فراداده در صفحات وب
استفاده از فراداده در صفحات وب میتواند بسیار مهم باشد. این فراداده حاوی توصیفاتی از محتوای صفحه و همچنین کلمات کلیدی مرتبط با محتوا است. این فراداده اغلب توسط موتورهای جستجو در نتایج جستجو نمایش داده میشود. به این معنی که دقت و جزئیات آن میتواند در تصمیمگیری کاربر برای بازدید از یک سایت تأثیر بگذارد. این اطلاعات معمولا به صورت برچسبهای متا بیان میشوند.
موتورهای جستجو برای کمک به تصمیمگیری در مورد ارتباط یک صفحه وب، متاتگها را ارزیابی میکنند. تا اواخر دهه ۱۹۹۰ از برچسبهای متا به عنوان عامل اصلی در تعیین موقعیت در جستجو استفاده میشد. افزایش بهینهسازی موتور جستجو (SEO) نسبت به اواخر دهه ۱۹۹۰ منجر به این شد که بسیاری از وبسایتها کلمات کلیدی را برای پر کردن موتورهای جستجو در نظر بگیرند. به این ترتیب وبسایتهای آنها بیش از سایرین مرتبط به نظر میرسند. از آن زمان، موتورهای جستجو وابستگی خود را به برچسبهای متا کاهش دادهاند، اگرچه هنوز در هنگام فهرستبندی صفحات مورد استفاده قرار میگیرند. بسیاری از موتورهای جستجو همچنین سعی میکنند توانایی صفحات وب را برای فریب سیستم با تغییر منظم معیارهای رتبهبندی گوگل، مشهور به تغییر مکرر الگوریتمهای رتبهبندی، ناکام بگذارند.
اشاره کردیم که فراداده را میتوان به صورت دستی یا با پردازش خودکار اطلاعات ایجاد کرد. ایجاد دستی آن دقیقتر است و به کاربر اجازه میدهد هر اطلاعاتی را که احساس میکند مرتبط است، وارد نموده یا به توصیف پرونده کمک کند. ایجاد متاداده خودکار میتواند بسیار ابتدایی باشد. معمولا فقط اطلاعاتی مانند اندازه، پسوند، زمان ایجاد پرونده و فرد ایجادکننده را نمایش میدهد.
فراداده در رسانههای اجتماعی
هر زمان شخصی را در فیسبوک به لیست دوستان خود اضافه میکنید، به موسیقی توصیه شده توسط اسپاتیفای گوش میدهید، در واتساپ استتوس پست میکنید یا توییت شخصی را به اشتراک میگذارید، از دادههایی که در پس زمینه وجود دارند، استفاده میکنید. کاربران پینترست میتوانند تابلوها و تصاویر مرتبط را به دلیل فراداده ذخیره شده در آن موضوع، ایجاد کنند.
فراداده در موقعیتهای بسیار خاص شبکههای اجتماعی مانند زمانی که به دنبال شخصی در فیسبوک میگردید، مفید است. شما میتوانید یک تصویر پروفایل و یک توضیح مختصر از کاربر فیسبوک مشاهده کنید تا قبل از تصمیمگیری برای فرستادن درخواست دوستی یا ارسال پیام، اطلاعات اولیه را به دست آورید.
نتیجه سخن
فراداده، دادهای است که داده را توصیف میکند، اما خود داده نیست. به عنوان مثال فراداده نویسنده و تاریخ ایجاد ذخیره شده در یک سند ورد را نشان میدهد اما تمام سند نیست. بلکه در عوض فقط جزئیاتی در مورد پرونده را بیان کرده است. از آنجا که فراداده، داده واقعی نیست معمولا میتواند با خیال راحت علنی شود. زیرا به کسی دسترسی به داده خام را نمیدهد. برای مثال دانستن جزئیات خلاصهای درباره یک صفحه وب یا فایل ویدیوئی کافی است تا بفهمید فایل چیست اما برای دیدن کل صفحه یا پخش کل فیلم کافی نیست.