در تجزیه و تحلیل دادهها، تجسم داده (Data Visualization) یک روش حیاتی برای پیدا کردن الگوها و ارائه یافتهها است. اما متداولترین انواع تجسم داده کدامند؟
تجسم داده یکی از مهمترین جنبههای تجزیه و تحلیل داده است. نقشهبرداری از دادههای خام با استفاده از عناصر گرافیکی برای کمک به پیدا کردن الگو و به اشتراک گذاشتن یافتهها به روشی قابل درک و چشمنواز برای هر کسب و کاری مفید است. اگرچه اولویت باید همیشه یکپارچگی دادهها باشد اما تجسم داده اگر به خوبی انجام شود، میتواند بسیار سرگرمکننده نیز باشد.
با کسب مهارت تجسم داده، مزایای بسیاری به دست خواهید آورد. اما ابتدا باید انواع تجسم داده و موارد استفاده آنها را بررسی کنیم. در این مقاله ما ۱۳ نوع رایج تجسم داده را مورد بررسی قرار میدهیم. این موارد عبارتند از:
۱- جدول محوری (Pivot Table)

هنگام رویارویی با مخازن وسیع اطلاعات (آنهایی که برای درک آسان بیش از حد بزرگ هستند) Pivot Table به ما کمک میکنند تا آمار کلیدی را در یک نمای واحد خلاصه کنیم. نوع اطلاعات جمعآوریشده در Pivot Table ممکن است شامل جمع، میانگین یا سایر خلاصههای عددی باشد.
اگرچه Pivot Table همیشه از لحاظ بصری بیشترین خلاقیت را ندارند، اما در زمینه مناسب بسیار مفید هستند. به عنوان مثال، جداول برجسته (Highlight Table)، همانطور که در تصویر نشان داده شده است، از سایهها یا رنگهای مختلف استفاده میکنند تا به راحتی بالاترین و کمترین مقادیر را در یک مجموعه داده پرچمگذاری کنند. گاهی اوقات این تنها چیزی است که شما نیاز دارید که باعث میشود Pivot Table یک شکل اساسی اما موثر از دادهها باشند. آنها همچنین معمولاً برای حمایت از اشکال پیچیدهتری از تجسم داده مورد استفاده قرار میگیرند.
۲- نمودار جعبهای (Boxplot)

یکی دیگر از انواع مفید توصیفی (نه چندان خلاقانه از لحاظ بصری)، نمودار جعبهای است. مانند جدولهای محوری، نمودارهای جعبهای برای تجسم آمار کلیدی یک مجموعه داده مفید هستند. ما میتوانیم از آنها برای نشان دادن مقادیر حداقل و حداکثر، مقدار میانه و چارکهای پایین و بالا استفاده کنیم (یعنی میانه نیمه پایین و بالای دادهها).
نمودار جعبهای “غیر پارامتری” شناخته میشود. این بدان معنی است که آنها تنوع در یک نمونه داده را بدون هیچ فرضی در مورد توزیع داده نمایش میدهند. این باعث میشود که آنها برای تجزیه و تحلیل دادههای اکتشافی و توضیحی مفید باشند، یعنی قبل از نتیجهگیری گسترده در مورد یک مجموعه داده، از ویژگیهای اصلی آن مطلع شوید.
۳- نمودار نقطهای (Scatterplot)

نمودار نقطهای (که به آن Scattergraph، Scattergram یا Scatter Chart نیز گفته میشود) رابطه بین دو متغیر را در محورهای x و y نشان میدهد. هر مورد از دادهها به عنوان یک نقطه واحد نشان داده میشود و اثر “پراکندگی” تصویری نمودار را ایجاد میکند. در صورت وجود سه نقطه داده بهم پیوسته (یعنی اگر محور Z وجود داشته باشد) پراکندگیهای سه بعدی نیز امکانپذیر است.
نمودارهای نقطهای بهتر است برای مجموعه دادههای بزرگ استفاده شوند که زمان در آنها فاکتور مهمی نیست. به عنوان مثال، یک نمودار نقطهای ساده ممکن است وزن افراد را در برابر قد آنها اندازهگیری کند. این امر به شناسایی هرگونه همبستگی بین این دو معیار کمک میکند. با این حال، از آنجا که عوامل دیگری بر دادهها تأثیر میگذارند (به عنوان مثال وزن افراد به رژیم غذایی آنها نیز مربوط میشود) نمودار نقطهای برای استنباط روابط بین متغیرها روش بهتری است تا نتیجهگیری دقیق. با این وجود، آنها ابزاری عالی برای ایجاد فرضیه هستند.
نوع متداول نمودار نقطهای، نمودار حبابی (Bubble Chart) است. نمودارهای حبابی با نمایش دایرههایی با اندازههای مختلف (به جای تک نقطه)، به جای دو حالت معمول، سه بعد داده را نشان میدهند.

۴- نمودار خطی (Line Graph)

نمودارهای خطی، یک جزء اصلی ساده اما موثر برای نمایش دادههای سری زمانی هستند. آنها از نظر بصری به نمودارهای نقطهای شباهت دارند اما نشاندهنده نقاط دادهای هستند که با فواصل زمانی با بخشهایی که توسط یک خط به هم متصل شدهاند، جدا میشوند. این امر، امکان مشاهده سریع ویژگیهایی مانند شتاب (هنگام بالا رفتن خط)، کاهش سرعت (هنگام پایین آمدن خط) و نوسانات (هنگامی که خط به طور نامنظم بالا و پایین میشود) را فراهم میکند.
در حالی که نمودار خطی ساده یک مجموعه داده واحد را نشان میدهد، نمودارهای خطی پیچیدهتر ممکن است چندین خط را شامل شوند تا دادههای مختلف را نشان دهند. این نمودار برای یافتن همبستگی یا انحراف مفید است. مثال متداول نمودار خطی در عمل، اندازهگیری رفتار بازار سهام یا هزینه منابع در طول زمان است، به عنوان مثال قیمت طلا طی چندین سال.
۵- نمودار منطقهای (Area Chart)

نمودارهای منطقهای همانند نمودارهای خطی، برای ردیابی دادهها در طول زمان استفاده میشوند. با این حال، در یک نمودار منطقهای، فضای بین خط رسمشده و محور x برای قابل مشاهده بودن سایهپردازی یا رنگی میشود. این امر به ویژه برای برجسته کردن تفاوت بین چند متغیر، یا برای اندازهگیری حجم کلی (به جای برجسته کردن تفاوت بین نقاط داده گسسته) بسیار مفید است.
به عنوان مثال در تصویر ارائه شده که به عنوان نمودار منطقهای انباشته (Stacked Area Chart) شناخته میشود، مهمترین عاملی که باید به آن توجه داشت، حجم محصولات فروختهشده در هر کشور است که توسط مناطق سایهدار نشان داده میشود. یک نوع متداول در نمودار منطقهای، جریان نگاره (Steamgraph) است که در آن دادهها در اطراف یک محور مرکزی رسم میشوند تا اصطلاحاً “لرزش” را به حداقل برسانند.

جمعبندی
در این مقاله، ما تعدادی از انواع اصلی تجسم داده را معرفی کردهایم. علیرغم سادگی، انواع تجسم داده بسیار متنوع است. حتی میتوان از این چند تکنیک برای ایجاد مجموعه دادههای پیچیده استفاده کرد. به هر حال تجسم داده درمورد سادگی و شفافیت است.
پس از تسلط بر اصول اولیه و ایجاد تجسم داده، در موقعیت خوبی برای شروع آزمایش خواهید بود. نمودارهای مختلف را ترکیب کنید، با رنگها و شکلها بازی کرده و سعی کنید انواع مختلف تجسم را با هم ترکیب نمایید. همچنین میتوانید با استفاده از برخی ابزارهای مختلف داده، با تعامل بازی کنید.
با اینکه بهترین تجسمها معمولاً ساده هستند، این امر نباید شما را در تلاش برای کشف رویکردها و روشهای جدید بازنمایی بصری اطلاعات متوقف کند.