پردازش تحلیلی آنلاین چیست؟
پردازش تحلیلی آنلاین (OLAP) یک فناوری نرمافزاری است که میتوانید از آن برای تجزیه و تحلیل دادههای تجاری از دیدگاههای مختلف استفاده کنید. سازمانها دادهها را از منابع دادهای متعدد، مانند وبسایتها، برنامهها، کنتورهای هوشمند و سیستمهای داخلی جمعآوری و ذخیره میکنند. OLAP این دادهها را ترکیب و در دستهبندیهایی گروهبندی میکند تا بینشهای عملی برای برنامهریزی استراتژیک ارائه دهد. به عنوان مثال، یک خردهفروش دادههایی در مورد تمام محصولاتی که میفروشد، مانند رنگ، اندازه، هزینه و مکان، ذخیره میکند. خردهفروش همچنین دادههای خرید مشتری، مانند نام موارد سفارش داده شده و ارزش کل فروش را در یک سیستم جداگانه جمعآوری میکند. OLAP مجموعههای داده را ترکیب میکند تا به سؤالاتی مانند اینکه کدام محصولات رنگی محبوبتر هستند یا چگونه مکان محصول بر فروش تأثیر میگذارد، پاسخ دهد.
چرا OLAP مهم است؟
پردازش تحلیلی آنلاین (OLAP) به سازمانها کمک میکند تا از حجم رو به رشد اطلاعات دیجیتال پردازش و بهرهمند شوند. برخی از مزایای OLAP به شرح زیر است:
- تصمیمگیری سریعتر: کسبوکارها از OLAP برای تصمیمگیری سریع و دقیق برای رقابت در یک اقتصاد پرشتاب استفاده میکنند. انجام پرسشهای تحلیلی بر روی چندین پایگاه داده رابطهای زمانبر است زیرا سیستم کامپیوتری جداول دادهای متعددی را جستجو میکند. از سوی دیگر، سیستمهای OLAP دادهها را از قبل محاسبه و یکپارچه میکنند، بنابراین تحلیلگران کسبوکار میتوانند در صورت نیاز گزارشها را سریعتر تولید کنند.
- پشتیبانی از کاربران غیر فنی: سیستمهای OLAP تجزیه و تحلیل پیچیده دادهها را برای کاربران غیر فنی کسبوکار آسانتر میکنند. کاربران کسبوکار میتوانند محاسبات تحلیلی پیچیده ایجاد کرده و گزارش تولید کنند، به جای اینکه یاد بگیرند چگونه با پایگاههای داده کار کنند.
- نمای یکپارچه از دادهها: OLAP یک پلتفرم واحد برای بازاریابی، امور مالی، تولید و سایر واحدهای تجاری فراهم میکند. مدیران و تصمیمگیرندگان میتوانند تصویر بزرگتر را ببینند و به طور مؤثر مشکلات را حل کنند. آنها میتوانند تجزیه و تحلیل “چه میشود اگر” را انجام دهند، که تأثیر تصمیمات گرفته شده توسط یک بخش بر سایر بخشهای کسبوکار را نشان میدهد.
معماری OLAP چیست؟
سیستمهای پردازش تحلیلی آنلاین (OLAP) دادههای چند بعدی را با نمایش اطلاعات در بیش از دو بعد یا دستهبندی ذخیره میکنند. دادههای دو بعدی شامل ستونها و ردیفها هستند، اما دادههای چند بعدی ویژگیهای متعددی دارند. به عنوان مثال، دادههای چند بعدی برای فروش محصول ممکن است شامل ابعاد زیر باشد:
- نوع محصول
- مکان
- زمان
مهندسان داده یک سیستم OLAP چند بعدی میسازند که از عناصر زیر تشکیل شده است:
- انبار داده: انبار داده اطلاعات را از منابع مختلف، از جمله برنامهها، فایلها و پایگاههای داده جمعآوری میکند. این اطلاعات را با استفاده از ابزارهای مختلف پردازش میکند تا دادهها برای اهداف تحلیلی آماده شوند. به عنوان مثال، انبار داده ممکن است اطلاعات را از یک پایگاه داده رابطهای که دادهها را در جداول ردیف و ستون ذخیره میکند، جمعآوری کند.
- ابزارهای ETL: ابزارهای استخراج، تبدیل و بارگذاری (ETL) فرآیندهای پایگاه داده هستند که به طور خودکار دادهها را بازیابی، تغییر و آماده میکنند تا به قالبی مناسب برای اهداف تحلیلی تبدیل شوند. انبارهای داده از ETL برای تبدیل و استانداردسازی اطلاعات از منابع مختلف قبل از در دسترس قرار دادن آنها برای ابزارهای OLAP استفاده میکنند.
- سرور OLAP: سرور OLAP دستگاه زیربنایی است که سیستم OLAP را تغذیه میکند. از ابزارهای ETL برای تبدیل اطلاعات در پایگاههای داده رابطهای و آمادهسازی آنها برای عملیات OLAP استفاده میکند.
- پایگاه داده OLAP: پایگاه داده OLAP یک پایگاه داده جداگانه است که به انبار داده متصل میشود. مهندسان داده گاهی اوقات از یک پایگاه داده OLAP برای جلوگیری از سنگین شدن انبار داده توسط تجزیه و تحلیل OLAP استفاده میکنند. آنها همچنین از یک پایگاه داده OLAP برای تسهیل ایجاد مدلهای داده OLAP استفاده میکنند.
- مکعبهای OLAP: یک مکعب داده مدلی است که آرایهای چند بعدی از اطلاعات را نشان میدهد. در حالی که تجسم آن به عنوان یک مدل داده سه بعدی آسانتر است، اکثر مکعبهای داده بیش از سه بعد دارند. یک مکعب OLAP یا ابرمکعب، اصطلاحی برای مکعبهای داده در یک سیستم OLAP است. مکعبهای OLAP صلب هستند زیرا پس از مدلسازی نمیتوانید ابعاد و دادههای زیربنایی را تغییر دهید. به عنوان مثال، اگر بعد انبار را به مکعبی با ابعاد محصول، مکان و زمان اضافه کنید، باید کل مکعب را دوباره مدل کنید.
- ابزارهای تحلیلی OLAP: تحلیلگران کسبوکار از ابزارهای OLAP برای تعامل با مکعب OLAP استفاده میکنند. آنها عملیاتی مانند برش، تاس ریزی و چرخش را برای به دست آوردن بینش عمیقتر در مورد اطلاعات خاص در مکعب OLAP انجام میدهند.
OLAP چگونه کار میکند؟
یک سیستم پردازش تحلیلی آنلاین (OLAP) با جمعآوری، سازماندهی، تجمیع و تجزیه و تحلیل دادهها با استفاده از مراحل زیر کار میکند:
- سرور OLAP دادهها را از منابع دادهای متعدد، از جمله پایگاههای داده رابطهای و انبارهای داده جمعآوری میکند.
- سپس، ابزارهای استخراج، تبدیل و بارگذاری (ETL) دادهها را تمیز، تجمیع، از قبل محاسبه و در یک مکعب OLAP مطابق با تعداد ابعاد مشخص شده ذخیره میکنند.
- تحلیلگران کسبوکار از ابزارهای OLAP برای پرسش و تولید گزارش از دادههای چند بعدی در مکعب OLAP استفاده میکنند.
- OLAP از عبارات چند بعدی (MDX) برای پرسش از مکعب OLAP استفاده میکند. MDX یک پرسش، مانند SQL است که مجموعهای از دستورالعملها را برای دستکاری پایگاههای داده ارائه میدهد.
انواع OLAP چیست؟
سیستمهای پردازش تحلیلی آنلاین (OLAP) به سه روش اصلی کار میکنند:
- MOLAP: پردازش تحلیلی آنلاین چند بعدی (MOLAP) شامل ایجاد یک مکعب داده است که دادههای چند بعدی را از یک انبار داده نشان میدهد. سیستم MOLAP دادههای از قبل محاسبه شده را در ابرمکعب ذخیره میکند. مهندسان داده از MOLAP استفاده میکنند زیرا این نوع فناوری OLAP تجزیه و تحلیل سریع را فراهم میکند.
- ROLAP: به جای استفاده از یک مکعب داده، پردازش تحلیلی آنلاین رابطهای (ROLAP) به مهندسان داده اجازه میدهد تا تجزیه و تحلیل دادههای چند بعدی را بر روی یک پایگاه داده رابطهای انجام دهند. به عبارت دیگر، مهندسان داده از پرسشهای SQL برای جستجو و بازیابی اطلاعات خاص بر اساس ابعاد مورد نیاز استفاده میکنند. ROLAP برای تجزیه و تحلیل دادههای گسترده و دقیق مناسب است. با این حال، ROLAP در مقایسه با MOLAP عملکرد پرسش کندی دارد.
- HOLAP: پردازش تحلیلی آنلاین ترکیبی (HOLAP) MOLAP و ROLAP را ترکیب میکند تا بهترینهای هر دو معماری را ارائه دهد. HOLAP به مهندسان داده اجازه میدهد تا به سرعت نتایج تحلیلی را از یک مکعب داده بازیابی کنند و اطلاعات دقیق را از پایگاههای داده رابطهای استخراج کنند.
مدلسازی داده در OLAP چیست؟
مدلسازی داده، نمایش دادهها در انبارهای داده یا پایگاههای داده پردازش تحلیلی آنلاین (OLAP) است. مدلسازی داده در پردازش تحلیلی آنلاین رابطهای (ROLAP) ضروری است زیرا دادهها را مستقیماً از پایگاه داده رابطهای تجزیه و تحلیل میکند. دادههای چند بعدی را به صورت طرحواره ستارهای یا دانهای برف ذخیره میکند.
طرحواره ستارهای
طرحواره ستارهای از یک جدول واقعیت و چندین جدول بُعد تشکیل شده است. جدول واقعیت، جدولی از دادهها است که شامل مقادیر عددی مربوط به یک فرآیند تجاری است و جدول بُعد شامل مقادیری است که هر ویژگی را در جدول واقعیت توصیف میکند. جدول واقعیت با کلیدهای خارجی به جداول بُعد ارجاع میدهد – شناسههای منحصربهفردی که با اطلاعات مربوطه در جدول بُعد مرتبط هستند.
در یک طرحواره ستارهای، یک جدول واقعیت به چندین جدول بُعد متصل میشود، بنابراین مدل داده شبیه به یک ستاره به نظر میرسد. در زیر مثالی از یک جدول واقعیت برای فروش محصول آمده است:
- شناسه محصول
- شناسه مکان
- شناسه فروشنده
- مبلغ فروش
شناسه محصول به سیستم پایگاه داده میگوید که اطلاعات را از جدول بُعد محصول بازیابی کند، که ممکن است به شکل زیر باشد:
- شناسه محصول
- نام محصول
- نوع محصول
- هزینه محصول
به همین ترتیب، شناسه مکان به یک جدول بُعد مکان اشاره میکند، که میتواند شامل موارد زیر باشد:
- شناسه مکان
- کشور
- شهر
جدول فروشنده ممکن است به شکل زیر باشد:
- شناسه فروشنده
- نام
- نام خانوادگی
- ایمیل
طرحواره دانهای برف
طرحواره دانهای برف، توسعهای از طرحواره ستارهای است. برخی از جداول بُعد ممکن است به یک یا چند جدول بُعد ثانویه منتهی شوند. این امر منجر به شکل دانهای برف میشود وقتی که جداول بُعد در کنار هم قرار میگیرند.
به عنوان مثال، جدول بُعد محصول ممکن است شامل فیلدهای زیر باشد:
- شناسه محصول
- نام محصول
- شناسه نوع محصول
- هزینه محصول
شناسه نوع محصول به جدول بُعد دیگری متصل میشود، همانطور که در مثال زیر نشان داده شده است:
- شناسه نوع محصول
- نام نوع
- نسخه
- گونه
عملیات OLAP چیست؟
تحلیلگران کسب و کار چندین عملیات تحلیلی اساسی را با یک مکعب پردازش تحلیلی آنلاین چند بعدی (MOLAP) انجام میدهند.
تجمیع (Roll up)
در تجمیع، سیستم پردازش تحلیلی آنلاین (OLAP) دادهها را برای ویژگیهای خاص خلاصه میکند. به عبارت دیگر، دادههای با جزئیات کمتر را نشان میدهد. به عنوان مثال، ممکن است فروش محصول را بر اساس نیویورک، کالیفرنیا، لندن و توکیو مشاهده کنید. یک عملیات تجمیع، نمایشی از دادههای فروش را بر اساس کشورها، مانند ایالات متحده، انگلستان و ژاپن ارائه میدهد.
جزئیات بیشتر (Drill down)
جزئیات بیشتر، برعکس عملیات تجمیع است. تحلیلگران کسب و کار در سلسله مراتب مفهومی به سمت پایین حرکت میکنند و جزئیات مورد نیاز خود را استخراج میکنند. به عنوان مثال، آنها میتوانند از مشاهده دادههای فروش بر اساس سال به تجسم آن بر اساس ماه حرکت کنند.
برش (Slice)
مهندسان داده از عملیات برش برای ایجاد یک نمای دو بعدی از مکعب OLAP استفاده میکنند. به عنوان مثال، یک مکعب MOLAP دادهها را بر اساس محصولات، شهرها و ماهها مرتب میکند. با برش مکعب، مهندسان داده میتوانند جدولی شبیه به صفحه گسترده ایجاد کنند که شامل محصولات و شهرها برای یک ماه خاص باشد.
تکه (Dice)
مهندسان داده از عملیات تکه برای ایجاد یک زیرمکعب کوچکتر از یک مکعب OLAP استفاده میکنند. آنها ابعاد مورد نیاز را تعیین میکنند و یک مکعب کوچکتر از ابرمکعب اصلی میسازند.
چرخش (Pivot)
عملیات چرخش شامل چرخاندن مکعب OLAP در امتداد یکی از ابعاد آن برای به دست آوردن دیدگاه متفاوت در مورد مدل داده چند بعدی است. به عنوان مثال، یک مکعب OLAP سه بعدی دارای ابعاد زیر در محورهای مربوطه است:
- محور X – محصول
- محور Y – مکان
- محور Z – زمان
پس از چرخش، مکعب OLAP پیکربندی زیر را دارد:
- محور X – مکان
- محور Y – زمان
- محور Z – محصول
OLAP چگونه با سایر روشهای تجزیه و تحلیل داده مقایسه میشود؟
دادهکاوی
دادهکاوی، فناوری تحلیلی است که حجم زیادی از دادههای تاریخی را برای یافتن الگوها و بینشها پردازش میکند. تحلیلگران کسب و کار از ابزارهای دادهکاوی برای کشف روابط درون دادهها و پیشبینی دقیق روندهای آینده استفاده میکنند.
OLAP و دادهکاوی
پردازش تحلیلی آنلاین (OLAP) یک فناوری تجزیه و تحلیل پایگاه داده است که شامل پرس و جو، استخراج و مطالعه دادههای خلاصه شده است. از سوی دیگر، دادهکاوی شامل بررسی عمیق اطلاعات پردازش نشده است. به عنوان مثال، بازاریابان میتوانند از ابزارهای دادهکاوی برای تجزیه و تحلیل رفتارهای کاربر از سوابق هر بازدید از وبسایت استفاده کنند. سپس ممکن است از نرمافزار OLAP برای بررسی آن رفتارها از زوایای مختلف، مانند مدت زمان، دستگاه، کشور، زبان و نوع مرورگر استفاده کنند.
OLTP
پردازش تراکنش آنلاین (OLTP) یک فناوری داده است که اطلاعات را به سرعت و به طور قابل اعتماد در یک پایگاه داده ذخیره میکند. مهندسان داده از ابزارهای OLTP برای ذخیره دادههای تراکنشی، مانند سوابق مالی، اشتراک خدمات و بازخورد مشتری، در یک پایگاه داده رابطهای استفاده میکنند. سیستمهای OLTP شامل ایجاد، به روز رسانی و حذف سوابق در جداول رابطهای هستند.
OLAP و OLTP
OLTP برای مدیریت و ذخیره جریانهای متعدد تراکنش در پایگاههای داده عالی است. با این حال، نمیتواند پرس و جوهای پیچیده را از پایگاه داده انجام دهد. بنابراین، تحلیلگران کسب و کار از یک سیستم OLAP برای تجزیه و تحلیل دادههای چند بعدی استفاده میکنند. به عنوان مثال، دانشمندان داده یک پایگاه داده OLTP را به یک مکعب OLAP مبتنی بر ابر متصل میکنند تا پرس و جوهای محاسباتی فشرده را روی دادههای تاریخی انجام دهند.