مخزن داده چیست؟
مخزن داده یک مخزن دیجیتالی است که اطلاعات را در سیستمهای کامپیوتری ذخیره و محافظت میکند. مخزن داده میتواند فضای ذخیرهسازی متصل به شبکه، فضای ذخیرهسازی ابری توزیعشده، یک هارد دیسک فیزیکی یا فضای ذخیرهسازی مجازی باشد. میتواند هم دادههای ساختاریافته مانند جداول اطلاعات و هم دادههای بدون ساختار مانند ایمیلها، تصاویر و ویدیوها را ذخیره کند. سازمانها از مخازن داده برای نگهداری، اشتراکگذاری و مدیریت اطلاعات در واحدهای تجاری استفاده میکنند.
چرا مخزن داده مهم است؟
میتوانید از یک مخزن داده برای ذخیره مطمئن اطلاعات در سیستمهای کامپیوتری و جلوگیری از از دست رفتن دادهها استفاده کنید. سیستمهای کامپیوتری اطلاعات را در دستگاههای ذخیرهسازی دائمی ذخیره میکنند. ذخیرهسازی دائمی غیر فرار است، به این معنی که حتی پس از خاموش شدن دستگاه، دادهها را حفظ میکند. این امر تضمین میکند که سیستم کامپیوتری پس از روشن شدن مجدد، به همان دادهها دسترسی دارد.کسبوکارها از مخازن داده برای مدیریت، دستهبندی و سادهسازی دادهها برای عملیات، تجزیه و تحلیل، گزارشدهی و نگهداری دادهها استفاده میکنند که برای انطباق با مقررات مهم است. مخازن داده کاربردهای متعددی دارند، مانند دادههای ایجاد و مصرف شده توسط برنامهها، آرشیو دادهها، تجزیه و تحلیل دادهها و بازیابی فاجعه.به دلیل پیچیدگیهای مورد نیاز دادهها، شرکتها از انواع مختلف زیرساختهای ذخیرهسازی داده برای ارائه دسترسی، افزونگی، حاکمیت و شفافیت استفاده میکنند. به عنوان مثال، سازمانها از Amazon Elastic File System (Amazon EFS) برای یک سیستم فایل بدون سرور و Amazon Simple Storage Service (Amazon S3) برای ذخیرهسازی شیء استفاده میکنند.
برخی از اصطلاحات مرتبط با مخازن داده کدامند؟
در زمینه ذخیرهسازی داده، چندین اصطلاح اغلب به جای یکدیگر استفاده میشوند، اما معانی کمی متفاوت دارند. در زیر چند مثال ارائه میکنیم.
پایگاه داده
پایگاه داده یک سیستم ذخیرهسازی سازمانیافته است. بیشتر پایگاههای داده بر اساس معماری پایگاه داده رابطهای ساخته شدهاند. سیستم مدیریت پایگاه داده رابطهای (RDBMS) به کاربران اجازه میدهد دادهها را در جداولی مرتبط با نقاط داده خاص ذخیره کنند. سازمانها از پایگاههای داده برای ذخیره دادههای تراکنشی، مانند گزارشهای حسابداری، فروش و اداری استفاده میکنند.
مقایسه مخازن داده با پایگاههای داده
بحث در مورد مخازن داده شامل روشهای مختلفی برای ذخیره و بازیابی اطلاعات است. پایگاه داده یک روش است که به برنامهها اجازه میدهد دادهها را به راحتی ذخیره، به اشتراک بگذارند و بازیابی کنند. برخلاف سیستمهای فایل، پایگاه داده از قوانین خاصی در مورد نحوه سازماندهی، قالببندی و ذخیره دادهها در پایگاه داده پیروی میکند.
انبار داده
انبار داده مجموعهای گسترده از اطلاعات مربوط به تجارت است که از منابع مختلف به دست میآید. شرکتها از انبارهای داده برای پشتیبانی از هوش تجاری و تجزیه و تحلیل استفاده میکنند. تحلیلگران کسبوکار و دانشمندان داده از انبار داده بینشهای عملی استخراج میکنند.
مقایسه مخازن داده با انبارهای داده
مخزن داده یک اصطلاح کلی است که شامل سختافزار، فناوریها، قالبها و معماریهای مختلف برای ذخیره و بازیابی اطلاعات است. انبار داده نوع خاصی از مخزن داده برای تجمیع دادههای تحلیلی برای کسبوکارها است. به عنوان مثال، GE Renewable Energy از AWS Redshift برای کسب بینشهای جدید در مورد دادههای جمعآوریشده خود استفاده میکند.
مخزن داده چگونه کار میکند؟
دستگاه ذخیرهسازی داده فیزیکی فناوری زیربنایی یک مخزن داده است. میتوانید اطلاعات را با فرمتهای خاصی مانند فایلها، جداول یا بلوکها روی دستگاه بخوانید و بنویسید. دستگاه میتواند محلی، راه دور یا در ابر باشد. مخازن داده بزرگ معمولاً در چندین دستگاه فیزیکی در مکانهای جغرافیایی مختلف توزیع میشوند. سیستمها و خدمات نرمافزاری عملیات زیربنایی مخزن داده را انتزاع میکنند.
در زیر چند نمونه از دستگاههای فیزیکی ارائه میدهیم. انواع مختلف دستگاههای ذخیرهسازی داده درجههای مختلفی از امنیت و افزونگی را ارائه میدهند.
درایوهای فلش و SSD
درایو حالت جامد (SSD) یک فناوری نیمهرسانا است که امکان نوشتن و خواندن دادهها را در تراشههای حافظه فلش فراهم میکند. فناوری ذخیرهسازی فلش قبل از تبدیل شدن به جایگزینی برای هارد دیسک درایوها (HDD) به صورت تجاری در درایوهای قلمی موجود بود. در مقایسه با HDD، یک SSD فیزیکی قطعات متحرک ندارد، به این معنی که عملکرد سریعتر و عمر طولانیتری دارد.
آرایه ذخیرهسازی هیبریدی
آرایه ذخیرهسازی هیبریدی یک تنظیم ذخیرهسازی فیزیکی است که از یک SSD و یک HDD تشکیل شده است. در حالی که SSD عملکرد با تأخیر کم را ارائه میدهد، هزینه هر واحد ذخیرهسازی آن بسیار بیشتر از HDD است. بنابراین، سازمانها از آرایه ذخیرهسازی هیبریدی برای متعادل کردن عملکرد، ظرفیت و هزینه استفاده میکنند.
RAID
RAID مخفف آرایه افزونه دیسکهای مستقل است. این فناوری دادههای یکسان را در چندین مکان روی SSD نگه میدارد.
قالبهای مختلف مخازن داده کدامند؟
مخازن داده برای پردازش و سازماندهی دادهها در قالبهای مختلف طراحی شدهاند.
ذخیرهسازی فایل
ذخیرهسازی فایل اطلاعات ذخیرهشده را در یک سلسله مراتب بالا به پایین از فایلها و پوشهها سازماندهی میکند. رایانهها از ذخیرهسازی فایل برای آسان کردن ذخیره، جستجو و بازیابی اطلاعات برای کاربران استفاده میکنند. میتوانید از سیستم ذخیرهسازی فایل برای ذخیره و سازماندهی تقریباً هر نوع دادهای استفاده کنید. در حالی که استفاده از ذخیرهسازی فایل آسان است، به دلیل معماری محکم متصل آن، مقیاسبندی افقی آن دشوار است.
ذخیرهسازی بلوکی
ذخیرهسازی بلوکی دادهها را به چندین قطعه از بخشهای با اندازه یکسان به نام بلوک تقسیم میکند. سیستم ذخیرهسازی بلوکی بلوکهای داده مختلف را در دستگاههای فیزیکی مختلف ذخیره میکند. هنگامی که کاربران دادههای خاصی را درخواست میکنند، قطعات را بازیابی و دوباره مونتاژ میکند. از یک سیستم نگاشت برای یافتن دادههای درخواستی بر اساس فراداده بلوک استفاده میکند. فراداده اطلاعات اضافی است که به کاربران یا برنامهها کمک میکند اطلاعات خاصی را در ذخیرهسازی پیدا کنند.
ذخیرهسازی شیء
ذخیرهسازی شیء دادههای بدون ساختار را در یک مخزن مقیاسپذیر و مستقل ذخیره میکند که میتواند روی سرورهای مختلف میزبانی شود. هر بلوک دادهای که متعلق به یک شیء است در فراداده آن توضیح داده میشود. به عنوان مثال، یک شیء میتواند محتوای رسانههای اجتماعی، ویدیوها، ایمیلها و فایلهای صوتی را ذخیره کند. برنامهها با استفاده از ویژگیهای فراداده خاص مانند وضوح ویدیو، مدت زمان و مکان، اطلاعات را در ذخیرهسازی شیء جستجو میکنند.
انواع مختلف مخازن داده کدامند؟
انواع مختلفی از مخازن داده وجود دارد که هر کدام دارای تنظیمات و ویژگیهای منحصر به فردی هستند.
ذخیرهسازی متصل مستقیم
ذخیرهسازی متصل مستقیم (DAS) شامل دستگاههای ذخیرهسازی است که به صورت فیزیکی به رایانه متصل میشوند. به عنوان مثال، یک تنظیم DAS یک هارد دیسک، دیسک نوری یا درایو فلش را به رایانه متصل میکند. ایجاد نسخههای پشتیبان در DAS نسبتاً ساده است، اما اشتراکگذاری دادهها با رایانههای دیگر دشوار است.
ذخیرهسازی متصل به شبکه
ذخیرهسازی متصل به شبکه (NAS) یک دستگاه ذخیرهسازی اختصاصی فایل است که دادهها را به طور مداوم برای برنامهها و کاربران در دسترس قرار میدهد تا به طور موثر در یک شبکه با هم همکاری کنند. دستگاههای NAS سرورهای تخصصی هستند که فقط درخواستهای ذخیرهسازی داده و اشتراکگذاری فایل را مدیریت میکنند. آنها خدمات ذخیرهسازی سریع، ایمن و قابل اعتماد را به شبکههای خصوصی ارائه میدهند.
درباره NAS بخوانید »
شبکه منطقه ذخیرهسازی
شبکه منطقه ذخیرهسازی (SAN) یک زیرساخت ذخیرهسازی داده با سرعت بالا است که از انواع مختلف رسانهها و پروتکلهای ذخیرهسازی استفاده میکند. کسبوکارها از SAN برای مقیاسبندی آسان و مقرونبهصرفه ذخیرهسازی بلوکی استفاده میکنند. SAN از مجازیسازی ذخیرهسازی برای پنهان کردن پیچیدگی زیرساخت از چندین دستگاه استفاده میکند.
ذخیرهسازی ابری
ذخیرهسازی ابری زیرساخت ذخیرهسازی توزیعشده است که توسط ارائهدهندگان ابر میزبانی و مدیریت میشود. در مقایسه با ذخیرهسازی محلی، مقیاسپذیرتر، انعطافپذیرتر و قابل دسترسی از راه دور است. به عنوان مثال، کاربران میتوانند تا زمانی که اتصال اینترنت داشته باشند و مجوز دسترسی به دادهها را داشته باشند، به خدمات ذخیرهسازی ابری AWS متصل شوند. ذخیرهسازی ابری همچنین مقرونبهصرفه است زیرا کاربران فقط برای ظرفیت استفادهشده هزینه پرداخت میکنند.
ذخیرهسازی ابری هیبریدی
ذخیرهسازی ابری هیبریدی به شرکتها اجازه میدهد دادهها را بین خدمات ذخیرهسازی محلی و ابری جدا کنند. ذخیرهسازی ابری هیبریدی به شرکتها کمک میکند از معماری قدیمی به یک محیط ابری کمهزینهتر و ایمنتر مهاجرت کنند.