ایجاد مدل داده ای مناسب یکی از مهمترین وظایفی است که یک تحلیلگر داده ها می تواند در مایکروسافت پاور بی آی انجام دهد. شما با ایجاد یک مدل داده ای مناسب باعث خواهید شد تا سایر افراد براحتی با داده های شما آشنا شوند و امکان تهیه گزارشات پاور بی آی باارزش برای شما و سایر افراد راحتتر باشد.
برخی از مزایای یک مدل داده ای مناسب
- پیدا کردن داده ها سریعتر است.
- تجمیع داده ها سریعتر صورت میگیرد.
- گزارشات دقیقتر خواهند بود.
- نوشتن گزاراشات به زمان کمتری نیاز خواهند داشت.
- حفظ کردن گزارشات در آینده راحتتر خواهد بود.
ارائه یک سری قواعد برای ایجاد یک مدل داده ای مناسب سخت میباشد، بدلیل اینکه تمامی داده ها و کاربرد آنها متفاوت است. معمولا یک مدل داده ای ساده تر مناسب تر میباشد، چرا که سریعتر اجرا می شود و استفاده از آن راحتتر است. با این وجود تعریف مدل داده ای کوچکتر به همان اندازه مشکل میباشد چرا که یک مفهوم ابتکاری و ذهنی است.
معمولا یک مدل داده ای کوچکتر شامل یک سری جداول کمتر و تعداد ستون های کمتر در هر جدول است که کاربر می تواند مشاهده کند. در صورتیکه شما تمامی جداول ضروری را از یک پایگاه داده فروش ها وارد کرده باشید، ولی تعداد کل جداول 30 جدول باشد، کاربر درک دقیقی از داده ها نخواهد داشت. جمع کردن این جداول در پنج جدول باعث خواهد شد که مدل داده ای برای کاربر مشهودتر باشد؛ در صورتیکه کاربر یک جدول دارای 100 ستون را در اختیار داشته باشد، کارکردن با این جدول گمراه کننده و خسته کننده خواهد بود. حذف کردن ستون های غیرضروری به منظور بدست آوردن یک تعداد قابل مدیریت باعث افزایش احتمال خواندن نام تمامی ستون ها توسط کاربر خواهد شد. به طور خلاصه میتوان گفت که هدف اصلی شما باید سادگی در حین طراحی مدل های داده ای خودتان باشد.
تصویر زیر یک مثال از مدل داده ای میباشد. باکس ها شامل جداول داده ای هستند و هر یک از آیتم های موجود در باکس ها عبارت از ستون ها میباشند. خطی که باکس ها را به هم متصل می کند بیانگر روابط موجود مابین جداول است. این روابط حتی در یک مدل ساده هم میتوانند پیچیده باشند. سازماندهی مدل داده ای براحتی از بین میرود و تعداد کل جداول موجود در این مدل به تدریج افزایش پیدا میکند. ساده، جامع و دقیق نگه داشتن مدل داده ای به تلاش مداوم نیاز دارد.
همانطور که در تصویر پایین نشان داده شده است، در حین ایجاد این رابطه و برمبنای نیازهایی که دارید، می توانید تصویر مدنظرتان را بسازید. در صورتیکه این رابطه را نسازید (با توجه به موارد مشترک مابین دو جدول) در حین ایجاد تصویر خودتان با مشکلات زیادی مواجه خواهید شد.
طرح های ستاره و مدل داده ای مربوطه مبنای اصلی گزارشات سازماندهی شده میباشند؛ هر چقدر که بخش بیشتری از زمان خودتان را وقف ایجاد این ارتباطات و طراحی ها بکنید، ایجاد و نگهداشتن گزارشات آسانتر خواهد بود.
ممنون که تا اینجا با ما همراه بودید. در قسمت بعد به کارکردن با جداول خواهیم پرداخت.
جداول واقعیت
جداول واقعیت شامل مقادیر داده ای مشاهده شده یا وقایع میباشد که عبارت از سفارشات فروش، تعداد محصولات، قیمت ها، تاریخ های معاملات و زمان معاملات و مقادیر کمّی هستند. جداول واقعیت یک سری مقادیر تکراری دارند. برای مثال این امکان وجود دارد که یک محصول چند بار در چندین سطر وجود داشته باشد یا برای مشتریان مختلف در تاریخ های متفاوت وجود داشته باشد. این مقادیر قابل تجمیع هستند و با استفاده از آنها میتوان یک سری نمودارها و تصاویری را ایجاد کرد.
برای مثال یک تصویر از کل سفارشات فروش عبارت از مجموع تمامی سفارشات فروش در یک جدول واقعیت میباشد. در جداول واقعیت مشاهده ستونی که با اعداد و تاریخ ها پر شده اند یک مورد رایجی است. اعداد میتوانند واحد اندازه گیری (همانند تعداد فروش) یا کلید (همانند ID مشتریان) باشند. تاریخ ها عبارت از زمان ثبت شده میباشند که برای مثال میتوان به تاریخ سفارش یا تاریخ حمل اشاره کرد.
جداول ابعاد
جداول ابعاد شامل جزئیات مربوط به داده های موجود در جداول واقعیت هستند که محصولات، موقعیتها، مستخدمان و نوع سفارشات از جمله موارد آنها میباشند. این جداول از طریق ستون های کلیدی به جدول واقعیت وصل شده اند. جداول ابعاد بمنظور فیلتر کردن و گروه بندی کردن داده ها در جداول واقعیت استفاده میشود. در نقطه مقابل، جداول ابعاد شامل مقادیر منحصر بفرد هستند که یک نمونه از آن عبارت از یک سطر برای هر محصول در جدول Products و یک سطر برای هر مشتری در جدول Customer میباشد. شما بمنظور بدست آوردن تصویر کل سفارشات فروش میتوانید داده ها را گروه بندی کنید تا تعداد کل سفارشات فروش را برای محصولات مشاهده کنید که در آن محصول عبارت از داده های موجود در جدول ابعاد میباشد.
معمولا جداول واقعیت بزرگتر از جداول ابعاد هستند، چرا که در جداول واقعیت اتفاقات بیشماری صورت میگیرد که برای مثال میتوان به فروشهای انفرادی اشاره کرد. معمولا جداول ابعاد کوچکتر هستند چرا که شما در مورد آیتم هایی که میتوانید فیلتر کنید یا براساس آن گروه بندی کنید، با یک سری محدودیت هایی مواجه هستید. برای مثال یک سال شامل تعداد زیادی ماه میباشد و ایالات متحده فقط از یک تعداد خاصی از ایالت ها تشکیل شده است.
با توجه به اطلاعاتی که در مورد جداول واقعیت و جداول ابعاد بدست آوردید، ممکن است این سوال برای شما پیش بیاید که چگونه میتوانید این تصویر را در پاور بی آی تهیه کرد؟
همانطور که در مدل داده ای زیر نمایش داده شده است، داده های مربوطه در دو جدول Employee و Sales قرار دارند. به دلیل اینکه جدول Sales شامل مقادیر سفارش فروش میباشد (که قابل تجمیع دارد) به عنوان جدول واقعیت در نظر گرفته میشود. جدول Employee شامل اسامی خاص مستخدم ها میباشد (که سفارشات فروش را فیلتر میکند)، به همین دلیل یک جدول ابعاد خواهد بود. ستون مشترک مابین دو جدول (که عبارت از کلید اصلی در جدول Employee میباشد) عبارت از EmployeeID است و به همین دلیل برمبنای این ستون میتوانید یک رابطه ای مابین دو جدول ایجاد کنید.
روابط مابین جداول با استفاده از کلیدهای اصلی و خارجی تعریف میشود. کلیدهای اصلی عبارت از ستون(هایی) هست(هستند) که تمامی سطرهای منحصر بفرد و غیرخالی را شناسایی میکند (میکنند). برای مثال در صورتیکه شما جدول Customers داشته باشید، یک شاخصی خواهید داشت که تمامی مشتریان منحصر بفرد را شناسایی میکند. اولین سطر یک ID برای 1، دومین سطر یک ID برای 2 و غیره خواهد داشت. به هر سطری یک مقدار منحصر بفرد اختصاص داده شده است که با استفاده از مقدار ساده (کلید اصلی) میتواند مورد اشاره قرار گیرد. در صورتیکه بخواهید در یک جدول متفاوت به سطرها اشاره کنید، این پروسه اهمیت پیدا میکند؛ این کار توسط کلیدهای خارجی صورت میگیرد. زمانیکه شما یک سری کلیدهای مشترک مابین جداول مختلف داشته باشید، روابط مابین دو جدول شکل خواهد گرفت.
پاور بی آی امکان ایجاد روابط مابین جداول مختلفی را فراهم می کند که منابع داده ای متفاوتی دارند؛ این قابلیت قدرتمند باعث میشود که شما بتوانید یک جدول را از مایکروسافت اکسل و دیتابیس رابطه ای دیگری وارد کنید. بعد از آن مابین این دو جدول رابطه ایجاد خواهید کرد و آنها را به عنوان یک مجموعه داده متحد مورد استفاده قرار خواهید داد.
همانطور که در تصویر پایین نشان داده شده است، در حین ایجاد این رابطه و برمبنای نیازهایی که دارید، می توانید تصویر مدنظرتان را بسازید. در صورتیکه این رابطه را نسازید (با توجه به موارد مشترک مابین دو جدول) در حین ایجاد تصویر خودتان با مشکلات زیادی مواجه خواهید شد.
طرح های ستاره و مدل داده ای مربوطه مبنای اصلی گزارشات سازماندهی شده میباشند؛ هر چقدر که بخش بیشتری از زمان خودتان را وقف ایجاد این ارتباطات و طراحی ها بکنید، ایجاد و نگهداشتن گزارشات آسانتر خواهد بود.
ممنون که تا اینجا با ما همراه بودید. در قسمت بعد به کارکردن با جداول خواهیم پرداخت.