فابریک داده (Data Fabric) چیست؟
فابریک داده به یک معماری یکپارچهسازی داده مبتنی بر ماشین اشاره دارد که از داراییهای متاداده برای یکپارچهسازی، ادغام و مدیریت محیطهای دادهای متنوع استفاده میکند. با استانداردسازی، اتصال و خودکارسازی روشها و فرآیندهای مدیریت داده، فابریکهای داده امنیت و دسترسی به دادهها را بهبود میبخشند و یکپارچگی کامل خطوط لوله داده و پلتفرمهای داخلی، ابری، چندابری هیبریدی و دستگاههای لبهای را فراهم میکنند.
چرا مهم است؟
احتمالاً شما با مجموعههای دادهای بزرگ و پیچیده از منابع مختلف و غیرمرتبط احاطه شدهاید—مانند CRM، امور مالی، اتوماسیون بازاریابی، عملیات، اینترنت اشیا/محصولات، و حتی دادههای جریانی در زمان واقعی. علاوه بر این، سازمان شما ممکن است از نظر جغرافیایی پراکنده باشد، موارد استفاده پیچیدهای داشته باشد، یا با مسائل پیچیده دادهای مانند ذخیرهسازی دادهها در ابر، چندابری هیبریدی، داخلی و دستگاههای لبهای مواجه باشد.
معماری فابریک داده به شما کمک میکند تا دادهها را از این منابع و مخازن مختلف گردآوری کنید و با استفاده از یادگیری ماشینی آنها را تبدیل و پردازش کنید تا الگوها را کشف کنید. این کار تصویر جامعی از کسبوکار شما ارائه میدهد و به شما امکان کاوش و تحلیل دادههای قابل اعتماد و مدیریتشده را میدهد. در نهایت، این به شما کمک میکند تا بینشهای عملی را کشف کنید که کسبوکار شما را بهبود میبخشد.
در اینجا مزایای کلیدی پذیرش این مفهوم برای سازمان شما آورده شده است:
- شکستن سیلوهای دادهای و دستیابی به یکپارچگی در محیطهای یکپارچه از طریق استفاده از مدیریت متاداده، گرافهای دانش معنایی و یادگیری ماشینی.
- ایجاد یک دیدگاه جامع از کسبوکار برای توانمندسازی کاربران تجاری، تحلیلگران و دانشمندان داده برای یافتن روابط بین سیستمها.
- حداکثر استفاده از قدرت ابر هیبریدی و کاهش زمان توسعه و مدیریت برای طراحی، استقرار و نگهداری یکپارچگی با سادهسازی پیکربندی زیرساخت.
- آسانتر کردن کاوش و تحلیل دادهها برای کاربران تجاری بدون وابستگی به بخش فناوری اطلاعات.
- در دسترس قرار دادن تمام روشهای تحویل داده از طریق پشتیبانی از دستههای ETL، مجازیسازی داده، ضبط تغییرات داده، جریان داده و APIها.
- کارآمدتر کردن مدیریت داده از طریق استفاده از خودکارسازی برای وظایف روزمره مانند تنظیم طرحواره با منابع داده جدید و پروفایلبندی مجموعههای داده.
معماری فابریک داده
فابریک داده یک محیط داده توزیعشده را تسهیل میکند که در آن دادهها میتوانند برای طیف گستردهای از مخازن و موارد استفاده مانند ابزارهای هوش تجاری یا برنامههای عملیاتی، جمعآوری، تبدیل، مدیریت، ذخیره و دسترسی پیدا کنند. این کار را با استفاده از تحلیلهای مستمر بر روی داراییهای متاداده فعلی و استنباطی برای ایجاد یک لایه شبکهمانند انجام میدهد که فرآیندهای داده و منابع، انواع و مکانهای متعدد داده را یکپارچه میکند. همچنین از فرآیندهای مدرن مانند مدیریت متاداده فعال، گرافهای دانش معنایی و یادگیری ماشینی و AutoML تعبیهشده استفاده میکند.
برای بررسی عمیقتر، بیایید ابتدا شش عاملی را که فابریک داده را از یک اکوسیستم یکپارچگی داده استاندارد متمایز میکند، بحث کنیم:
- کاتالوگ داده غنیشده. کاتالوگ داده شما شامل و تحلیل تمام انواع متاداده (ساختاری، توصیفی و مدیریتی) خواهد بود تا زمینهای برای اطلاعات شما فراهم کند.
- گراف دانش. برای کمک به شما و الگوریتمهای AI/ML در تفسیر معنای دادههایتان، شما یک گراف دانش خواهید ساخت و مدیریت خواهید کرد که روابط بین موجودیتهای داده شما (مفاهیم، اشیاء، رویدادها و غیره) را به صورت رسمی نشان میدهد. این باید با معناشناسی داده یکپارچه تقویت شود، که معنای اجزای داده را توصیف میکند.
- فعالسازی متاداده. شما از متاداده دستی (غیرفعال) به متاداده خودکار (فعال) تغییر خواهید کرد. مدیریت متاداده فعال از یادگیری ماشینی برای امکان ایجاد و پردازش متاداده در مقیاس عظیم استفاده میکند.
- موتور توصیه. بر اساس متاداده فعال شما، الگوریتمهای AI/ML به طور مداوم تحلیل، یادگیری و ارائه توصیهها و پیشبینیهایی درباره اکوسیستم یکپارچگی و مدیریت داده شما خواهند داشت.
- آمادهسازی و جمعآوری داده. تمام روشهای آمادهسازی و تحویل داده رایج پشتیبانی خواهند شد، شامل پنج الگوی کلیدی یکپارچگی داده: ETL، ELT، جریان داده، یکپارچگی برنامه و مجازیسازی داده.
- DataOps. تیم DevOps شما را با مهندسان داده و دانشمندان داده گرد هم آورید تا اطمینان حاصل کنید که فابریک شما نیازهای کاربران فناوری اطلاعات و تجاری را پشتیبانی میکند.
همانطور که در دیاگرام بالا نیز دیده میشود، با تأمین داده از منابع به مصرفکنندگان، فابریک داده دادهها را از منابع سیستمی متنوع در سراسر سازمان شما، از جمله منابع داده عملیاتی و مخازن داده مانند انبار داده، دریاچههای داده و دیتامارتها گرد میآورد. این یکی از دلایلی است که فابریک داده برای طراحی مش داده مناسب است. فابریک داده همچنین معماری مدیریت داده پایهای است که تحویل بهینه محصولات داده به تیمهای حوزه را امکانپذیر میکند.
فابریک داده مقیاس دادههای بزرگ را برای فرآیندهای دستهای و دادههای جریانی در زمان واقعی پشتیبانی میکند و قابلیتهای یکسانی را در ابر، چندابری هیبریدی، داخلی و دستگاههای لبهای ارائه میدهد. این باعث ایجاد سیالیت در محیطهای داده میشود و مجموعه دادهای کامل، دقیق و بهروز را برای تحلیل، سایر برنامهها و فرآیندهای تجاری فراهم میکند. همچنین با ارائه اجزا و اتصالدهندههای از پیش بستهبندیشده برای اتصال همه چیز، زمان و هزینه را کاهش میدهد. به این ترتیب، نیازی به کدگذاری دستی هر اتصال ندارید.
معماری فابریک داده خاص شما به نیازها و موقعیت داده خاص شما بستگی دارد. اما، طبق تحقیقات شرکت Forrester، شش لایه رایج برای فابریکهای داده سازمانی مدرن وجود دارد:
- مدیریت داده مدیریت و امنیت را فراهم میکند.
- جمعآوری داده اتصالات بین دادههای ساختاریافته و غیرساختاریافته را شناسایی میکند.
- پردازش داده فقط دادههای مرتبط را استخراج میکند.
- سازماندهی داده دادهها را پاکسازی، تبدیل و یکپارچه میکند.
- کشف داده راههای جدیدی برای یکپارچهسازی منابع داده مختلف شناسایی میکند.
- دسترسی به داده به کاربران امکان میدهد دادهها را از طریق ابزارهای تحلیلی و هوش تجاری بر اساس مجوزهای دسترسی کاوش کنند.
پیادهسازی فابریک داده
در حال حاضر هیچ ابزار یا پلتفرم مستقل واحدی وجود ندارد که بتوانید از آن برای ایجاد کامل معماری فابریک داده استفاده کنید. شما باید ترکیبی از راهحلها را به کار ببرید، مانند استفاده از یک ابزار مدیریت داده برتر برای اکثر نیازهایتان و سپس تکمیل معماری خود با ابزارهای دیگر و/یا راهحلهای کدگذاریشده سفارشی.
برای مثال، پیادهسازی معماری فابریک داده با یک پلتفرم یکپارچگی به عنوان سرویس (iPaaS) نیازمند رویکردی جامع است که بر ایجاد یک لایه یکپارچه و استاندارد از خدمات داده تأکید دارد، در حالی که کیفیت داده، مدیریت و دسترسی خودکار را در اولویت قرار میدهد.
طبق تحقیقات شرکت Gartner، چهار ستون برای پیادهسازی باید در نظر گرفته شود:
- جمعآوری و تحلیل تمام انواع متاداده
- تبدیل متاداده غیرفعال به متاداده فعال
- ایجاد و مدیریت گرافهای دانش که دادهها را با معناشناسی غنی میکنند
- اطمینان از یک پایه یکپارچگی داده قوی
علاوه بر این ستونها، شما باید عناصر معمول یک راهحل یکپارچگی داده قوی را در اختیار داشته باشید. این شامل مکانیزمهایی برای جمعآوری، مدیریت، ذخیره و دسترسی به دادههایتان است. همچنین، داشتن یک چارچوب مدیریت داده مناسب که شامل مدیریت متاداده، ردیابی داده و بهترین روشهای یکپارچگی داده باشد.