یک پایگاه داده سری زمانی (TSDB) پایگاه دادهای است که برای دادههای دارای برچسب زمانی یا دادههای سری زمانی بهینهسازی شده است. دادههای سری زمانی در سادهترین شکل، اندازهگیریها یا رویدادهایی هستند که در طول زمان ردیابی، پایش، نمونهبرداری کاهشی و تجمیع میشوند. این دادهها میتوانند شامل متریکهای سرور، پایش عملکرد برنامهها، دادههای شبکه، دادههای حسگرها، رویدادها، کلیکها، معاملات بازار و بسیاری از انواع دیگر دادههای تحلیلی باشند.
پایگاه داده سری زمانی بهطور خاص برای مدیریت متریکها و رویدادها یا اندازهگیریهایی که دارای برچسب زمانی هستند ساخته شده است. یک TSDB برای اندازهگیری تغییرات در طول زمان بهینه شده است. ویژگیهایی که دادههای سری زمانی را بسیار متفاوت از سایر بارهای کاری داده میکنند شامل مدیریت چرخه عمر داده، خلاصهسازی و اسکن بازههای بزرگ از تعداد زیادی رکورد است.
چرا پایگاه داده سری زمانی اکنون اهمیت دارد؟
پایگاههای داده سری زمانی جدید نیستند، اما نسل اول آنها عمدتاً بر بررسی دادههای مالی، نوسانات معاملات سهام و سیستمهایی که برای حل مسائل معاملاتی ساخته شده بودند تمرکز داشتند. اما دادههای مالی دیگر تنها کاربرد دادههای سری زمانی نیستند — در واقع، تنها یکی از کاربردهای متعدد در صنایع مختلف بهشمار میروند. شرایط بنیادین محاسبات در دهه گذشته بهطور چشمگیری تغییر کرده است. همهچیز به اجزا تقسیم شده است. مینفریمهای یکپارچه ناپدید شدهاند و جای خود را به سرورلس، میکروسرویسها و کانتینرها دادهاند.
امروزه هر چیزی که میتواند یک مؤلفه باشد، یک مؤلفه است. علاوه بر این، شاهد ابزارمند شدن هر سطح در دسترس از دنیای مادی هستیم — خیابانها، خودروها، کارخانهها، شبکههای برق، کلاهکهای یخی، ماهوارهها، پوشاک، تلفنها، مایکروویوها، ظروف شیر، سیارات و بدن انسان. همهچیز دارای حسگر است یا خواهد بود. بنابراین اکنون همهچیز در داخل و خارج از شرکت، جریان بیوقفهای از متریکها و رویدادها یا دادههای سری زمانی تولید میکند.
این بدان معناست که پلتفرمهای زیربنایی باید برای پشتیبانی از این بارهای کاری جدید تکامل یابند — نقاط داده بیشتر، منابع داده بیشتر، پایش بیشتر و کنترلهای بیشتر. آنچه شاهد آن هستیم و آنچه زمانه طلب میکند، یک تغییر پارادایمی در رویکرد ما به زیرساخت داده و شیوه ساخت، پایش، کنترل و مدیریت سیستمها است. آنچه نیاز داریم یک پایگاه داده سری زمانی کارآمد، مقیاسپذیر و هدفمحور است.
چه چیزی بار کاری سری زمانی را متمایز میکند؟
پایگاههای داده سری زمانی دارای ویژگیهای معماری کلیدی هستند که آنها را از سایر پایگاههای داده بسیار متفاوت میکند. این ویژگیها شامل ذخیرهسازی و فشردهسازی دادههای دارای برچسب زمانی، مدیریت چرخه عمر داده، خلاصهسازی داده، توانایی مدیریت اسکنهای وابسته به زمان در بازههای بزرگ از رکوردها و کوئریهای آگاه از سری زمانی است.

برای مثال: در یک پایگاه داده سری زمانی، درخواست خلاصهای از دادهها در یک بازه زمانی بزرگ امری رایج است. این کار نیازمند پیمایش یک بازه از نقاط داده برای انجام محاسباتی مانند افزایش صدکی یک متریک در این ماه نسبت به همان بازه در شش ماه گذشته، بهصورت خلاصهشده بر اساس ماه است. بهینهسازی چنین بار کاریای با یک ذخیرهساز توزیعشده کلید-مقدار بسیار دشوار است. TSDBها دقیقاً برای این مورد استفاده بهینه شدهاند و زمان پاسخ کوئری در حد میلیثانیه را روی ماهها داده ارائه میدهند.
مثال دیگر: در پایگاههای داده سری زمانی، نگهداشتن دادههای با دقت بالا برای یک بازه زمانی کوتاه امری معمول است. این دادهها سپس تجمیع و نمونهبرداری کاهشی میشوند تا دادههای روند بلندمدت ایجاد شود. این بدان معناست که برای هر نقطه دادهای که وارد پایگاه داده میشود، پس از پایان دوره زمانی آن باید حذف شود. پیادهسازی چنین مدیریت چرخه عمر دادهای روی پایگاههای داده معمولی برای توسعهدهندگان برنامه دشوار است. آنها باید طرحهایی برای حذف ارزان مجموعههای بزرگ داده و خلاصهسازی مداوم آن دادهها در مقیاس بالا طراحی کنند. در یک پایگاه داده سری زمانی، این قابلیت بهصورت پیشفرض فراهم است.
رتبهبندی مستقل ۱۵ پایگاه داده برتر سری زمانی
پایگاههای داده سری زمانی سریعترین بخش در حال رشد صنعت پایگاه داده هستند. اما کدام پایگاه داده سری زمانی بهترین و محبوبترین است؟ راههای مختلفی برای تعیین محبوبیت وجود دارد، اما وبسایت مستقلی به نام DB-Engines پایگاههای داده را بر اساس محبوبیت در موتورهای جستوجو، اشاره در شبکههای اجتماعی، آگهیهای شغلی و حجم بحثهای فنی رتبهبندی میکند. نتایج فعلی به شرح زیر است:
- InfluxDB
- Prometheus
- Kdb+
- TimescaleDB
- Graphite
- DolphinDB
- Apache Druid
- TDengine
- RRDTool
- QuestDB
- OpenTSDB
- GridDB
- Fauna
- VictoriaMetrics
- Amazon Timestream
برای مشاهده روندها در طول زمان، نمودار زیر ۱۰ پایگاه داده برتر سری زمانی و تغییرات تاریخی آنها را نشان میدهد:

سری زمانی — سریعترین دسته در حال رشد پایگاه داده
DB-Engines همچنین سیستمهای مدیریت پایگاه داده سری زمانی (Time Series DBMS) را بر اساس محبوبیت رتبهبندی میکند. پایگاههای داده سری زمانی در سال گذشته سریعترین بخش در حال رشد صنعت پایگاه داده بودهاند.

چه چیزی پایگاه داده سری زمانی InfluxDB را منحصربهفرد میکند؟
InfluxDB از ابتدا بهعنوان یک پایگاه داده سری زمانی هدفمحور ساخته شده است؛ یعنی برای سری زمانی بازطراحی نشده، بلکه زمان از همان ابتدا در هسته آن لحاظ شده است. InfluxDB بخشی از یک پلتفرم جامع است که جمعآوری، ذخیرهسازی، پایش، مصورسازی و هشداردهی دادههای سری زمانی را پشتیبانی میکند. این ابزار بسیار فراتر از یک پایگاه داده سری زمانی ساده است.
کل پلتفرم InfluxData بر پایه یک هسته پایگاه داده متنباز ساخته شده است. InfluxData مشارکتکننده فعالی در پروژههای Telegraf، InfluxDB، Chronograf و Kapacitor (پشته TICK) است — بخشهای «I,C,K» از پشته TICK در InfluxDB 2.0 در یک باینری واحد ادغام شدهاند — و همچنین InfluxDB Enterprise و InfluxDB Cloud را بر پایه همین هسته متنباز ارائه میدهد. مدل داده InfluxDB با سایر راهکارهای سری زمانی مانند Graphite، RRD یا OpenTSDB تفاوت قابلتوجهی دارد. InfluxDB از یک پروتکل خطی برای ارسال دادههای سری زمانی استفاده میکند که به شکل زیر است:
measurement-name tag-set field-set timestamp.
نام اندازهگیری یک رشته است، مجموعه برچسبها مجموعهای از جفتهای کلید/مقدار است که همه مقادیر آن رشته هستند، و مجموعه فیلدها مجموعهای از جفتهای کلید/مقدار است که مقادیر آنها میتواند int64، float64، bool یا string باشد. نام اندازهگیری و مجموعه برچسبها در یک ایندکس معکوس نگهداری میشوند که جستوجو برای سریهای خاص را بسیار سریع میکند. برای مثال، اگر متریکهای CPU داشته باشیم:
cpu, host=serverA, region=uswest idle=23, user=42, system=12 1464623548s
برچسبهای زمانی در InfluxDB میتوانند با دقت ثانیه، میلیثانیه، میکروثانیه یا نانوثانیه باشند. مقیاسهای میکرو و نانوثانیه InfluxDB را به گزینهای مناسب برای کاربردهای مالی و محاسبات علمی تبدیل میکنند که در آنها سایر راهکارها کنار گذاشته میشوند. فشردهسازی بسته به سطح دقت موردنیاز کاربر متغیر است. روی دیسک، دادهها بهصورت ستونی سازماندهی میشوند، بهطوری که بلوکهای پیوسته زمانی برای اندازهگیری، مجموعه برچسبها و فیلدها تنظیم میشوند. بنابراین هر فیلد برای بلوکهایی از زمان بهصورت متوالی روی دیسک ذخیره میشود که محاسبه تجمیعها روی یک فیلد را بسیار سریع میکند. هیچ محدودیتی برای تعداد برچسبها و فیلدهایی که میتوان استفاده کرد وجود ندارد.
سایر راهکارهای سری زمانی از چندین فیلد پشتیبانی نمیکنند، که این موضوع میتواند پروتکلهای شبکه آنها را هنگام انتقال داده با مجموعه برچسبهای مشترک حجیم کند. بیشتر راهکارهای دیگر سری زمانی فقط از مقادیر float64 پشتیبانی میکنند، که به این معناست کاربر نمیتواند فراداده اضافی را همراه با سری زمانی کدگذاری کند. حتی OpenTSDB و KairosDB که از برچسبها پشتیبانی میکنند (برخلاف Graphite و RRD)، محدودیتهایی در تعداد برچسبهای قابل استفاده دارند. حدود ۵ تا ۶ برچسب که استفاده شود، کاربر شروع به مشاهده نقاط داغ در خوشه ماشینهای HBase یا Cassandra خواهد کرد.
InfluxDB این محدودیت را ندارد زیرا مدل داده آن بهطور خاص برای سریهای زمانی طراحی شده است. این مدل توسعهدهنده را به مسیر درست هدایت میکند تا با ایندکس کردن برچسبها و بدون ایندکس کردن فیلدها، عملکرد خوبی از پایگاه داده بگیرد. این سیستم انعطافپذیر است، انواع داده زیادی را پشتیبانی میکند و کاربر میتواند فیلدها و برچسبهای متعددی داشته باشد. بهدلیل همه این عوامل، یک پایگاه داده سری زمانی هدفمحور مانند InfluxDB بهترین راهکار برای کار با دادههای سری زمانی است.
موارد استفاده پایگاه داده سری زمانی
پایگاههای داده سری زمانی به زیرساختی ضروری برای سازمانهایی تبدیل شدهاند که با جریانهای پیوسته دادههای دارای برچسب زمانی سروکار دارند. معماری تخصصی آنها آنها را برای سناریوهایی ایدهآل میکند که پایگاههای داده سنتی در عملکرد و مقیاسپذیری با مشکل مواجه میشوند. بیایید رایجترین موارد استفادهای را بررسی کنیم که در آنها پایگاههای داده سری زمانی واقعاً میدرخشند.
پایش زیرساخت و برنامهها
یکی از گستردهترین کاربردهای پایگاههای داده سری زمانی، پایش زیرساخت IT و برنامهها است. سازمانها از آنها برای ردیابی متریکهای سرور مانند مصرف CPU، مصرف حافظه، ورودی/خروجی دیسک و ترافیک شبکه استفاده میکنند. این پایگاهها در جذب میلیونها نقطه داده در ثانیه از هزاران سرور، کانتینر و میکروسرویس، در حالی که عملکرد کوئری در حد زیرثانیه را حفظ میکنند، برتری دارند.
تیمهای DevOps برای شناسایی ناهنجاریها، راهاندازی سیستمهای هشداردهی هوشمند و انجام تحلیل ریشهای مشکلات به این قابلیت تکیه میکنند. توانایی تجمیع سریع دادهها در بازههای زمانی از نانوثانیه تا ماهها، هم عیبیابی بلادرنگ و هم برنامهریزی ظرفیت بلندمدت را ممکن میسازد.
اینترنت اشیا (IoT)
اینترنت اشیا حجم عظیمی از دادههای سری زمانی را از حسگرهایی تولید میکند که همهچیز را از دما و رطوبت گرفته تا ارتعاش و فشار اندازهگیری میکنند. پایگاههای داده سری زمانی ستون فقرات شهرهای هوشمندی هستند که الگوهای ترافیک را ردیابی میکنند، کارخانههایی که سلامت تجهیزات را پایش میکنند و سیستمهای کشاورزی که آبیاری را بر اساس رطوبت خاک بهینه میسازند.
این پایگاهها چالشهای منحصربهفرد دادههای IoT را مدیریت میکنند: بهروزرسانیهای با فرکانس بالا، ورود دادهها بهصورت خارج از ترتیب و نیاز به ذخیره دادههای خام در کنار خلاصههای تجمیعشده. آنها به سازمانها امکان میدهند سیستمهای نگهداری پیشبینانه بسازند که خرابی تجهیزات را پیش از وقوع پیشبینی میکنند و میتوانند میلیونها هزینه توقف را کاهش دهند.
بازارهای مالی و معاملات
مؤسسات مالی از پایگاههای داده سری زمانی برای ذخیره و تحلیل دادههای بازار، از جمله قیمت سهام، حجم معاملات و اطلاعات دفتر سفارشها استفاده میکنند. توانایی پردازش میلیونها معامله در ثانیه در حالی که دقت داده حفظ میشود، برای سیستمهای معاملات الگوریتمی، پلتفرمهای مدیریت ریسک و انطباق مقرراتی حیاتی است.
این پایگاهها از کوئریهای پیچیده موردنیاز برای تحلیل تکنیکال پشتیبانی میکنند، مانند محاسبه میانگینهای متحرک، شناسایی الگوهای قیمتی و بکتست استراتژیهای معاملاتی در سالها داده تاریخی. ترکیب توان نوشتن بالا و کوئریهای تحلیلی سریع آنها را برای فناوری مالی مدرن غیرقابلجایگزین میکند.
مدیریت انرژی و خدمات شهری
شبکههای برق، سیستمهای آب و تأسیسات انرژی تجدیدپذیر جریانهای پیوستهای از دادههای عملیاتی تولید میکنند. پایگاههای داده سری زمانی به شرکتهای خدماتی کمک میکنند پایداری شبکه را پایش کنند، الگوهای تقاضا را پیشبینی کنند و توزیع منابع را بهینه سازند. استقرار کنتورهای هوشمند که میتوانند هر چند دقیقه از میلیونها خانه داده تولید کنند، بهشدت به این پایگاههای داده تخصصی متکی هستند.
شرکتهای انرژی از این دادهها برای متعادلسازی عرضه و تقاضا بهصورت بلادرنگ، یکپارچهسازی مؤثرتر منابع تجدیدپذیر و ارائه بینشهای دقیق مصرف به مشتریان استفاده میکنند. توانایی انجام تجمیعهای پیچیده در مناطق جغرافیایی و بازههای زمانی مختلف، مدیریت بهتر شبکه و صورتحساب دقیقتر را ممکن میسازد.
تحلیل کسبوکار و رفتار کاربران
شرکتها متریکهای زمانمحور متعددی را برای درک عملکرد کسبوکار و رفتار کاربران ردیابی میکنند. تحلیل وبسایت، متریکهای عملکرد برنامه، دادههای فروش و آمار تعامل مشتری همگی بهطور طبیعی با مدل سری زمانی سازگار هستند. این پایگاهها به کسبوکارها امکان میدهند شاخصهای کلیدی عملکرد را بهصورت بلادرنگ ردیابی کنند، روندها را شناسایی کنند و تصمیمهای مبتنی بر داده بگیرند.
پلتفرمهای تجارت الکترونیک از پایگاههای داده سری زمانی برای پایش نرخ تبدیل، ردیابی سطح موجودی و تحلیل الگوهای فصلی استفاده میکنند. توانایی مقایسه سریع عملکرد فعلی با مبناهای تاریخی به کسبوکارها کمک میکند بهسرعت به شرایط متغیر بازار واکنش نشان دهند.
پایگاه داده سری زمانی: پرسشهای متداول
در ادامه، پاسخهای کوتاهی به پرسشهای متداول درباره پایگاههای داده سری زمانی آمده است:
پایگاه داده سری زمانی چیست؟
در اینجا یک تعریف کوتاه آمده است: پایگاه داده سری زمانی (TSDB) پایگاه دادهای است که برای دادههای دارای برچسب زمانی (سری زمانی) و برای اندازهگیری تغییرات در طول زمان بهینهسازی شده است.
بهترین پایگاه داده سری زمانی کدام است؟
برای آشنایی با ویژگیهای یک پایگاه داده سری زمانی قدرتمند و اینکه کدام پایگاه داده برای ذخیره حجم بالای دادههای سری زمانی مناسبتر است، به این صفحه مراجعه کنید.
نمونههای داده سری زمانی چیست؟
برای مشاهده نمونههای داده سری زمانی به صفحه «داده سری زمانی چیست» مراجعه کنید.
آیا InfluxDB متنباز است؟
InfluxDB یک پایگاه داده سری زمانی متنباز با جامعهای بزرگ و پویا است.
آیا میتوانم از InfluxDB با Grafana استفاده کنم؟
هزاران مورد استفاده وجود دارد که از InfluxDB و Grafana بهره میبرند. برای مطالعه آنها به Community Showcase مراجعه کنید.
InfluxDB در مقایسه با سایر پایگاههای داده چگونه است؟
آزمونهای بنچمارک InfluxDB را مشاهده کنید که عملکرد آن را با پایگاههای داده دیگر (مانند Cassandra، Elasticsearch، MongoDB، OpenTSDB، Graphite و Splunk) بر اساس پارامترهایی مانند توان نوشتن، توان کوئری و ذخیرهسازی روی دیسک مقایسه میکند.
آیا پایگاه داده سری زمانی برای مدیریت دادههای سری زمانی بهتر از پایگاه داده رابطهای است؟
اگر در حال مقایسه پایگاه داده سری زمانی با پایگاه داده رابطهای هستید، TSDB بهطور خاص برای مرتبسازی و کوئری دادههای سری زمانی طراحی شده و معمولاً کارآمدتر از پایگاه داده رابطهای عمومی است.
آیا میتوان از پایگاه داده سری زمانی برای رایانش لبه استفاده کرد؟
انتقال قابلاعتماد داده از لبه به ابر همچنان برای بسیاری از کسبوکارها چالشبرانگیز است. برای آشنایی با مفهوم لبه، موارد استفاده و مزایا، و اینکه چگونه پایگاه داده سری زمانی InfluxDB میتواند برای رایانش لبه استفاده شود، کتاب الکترونیکی Edge Computing & Data Replication with InfluxDB را مطالعه کنید.
تفاوت پایگاه داده سری زمانی با انبار داده چیست؟
در حالی که پایگاه داده سری زمانی برای دادههای دارای برچسب زمانی یا سری زمانی بهینهسازی شده است، انبار داده دادهها را از منابع متعدد در یک مکان مرکزی ذخیره و سازماندهی میکند.
