Master Replication: شش گام آسان برای راه‌اندازی MySQL Master-Slave

هزینه‌های توقف پایگاه داده برای کسب‌وکارها به طور متوسط هزاران دلار در هر دقیقه است، با این حال بسیاری از سازمان‌ها هنوز به معماری‌های تک‌سروری وابسته هستند که نقاط شکست فاجعه‌بار ایجاد می‌کنند.

Master replication این آسیب‌پذیری حیاتی را با حفظ کپی‌های همگام‌سازی‌شده از پایگاه داده شما در سراسر سرورهای متعدد حل می‌کند و تداوم کسب‌وکار را در هنگام شکست سیستم‌های اصلی تضمین می‌نماید.

این راهنمای جامع شش گام اثبات‌شده برای پیاده‌سازی Master replication در MySQL را آشکار می‌کند، به علاوه استراتژی‌های پیشرفته برای معماری‌های داده مدرن.

Master Replication چیست و چرا مهم است؟

Master replication، که همچنین به عنوان primary-secondary replication در اصطلاحات مدرن شناخته می‌شود، کپی‌های همگام‌سازی‌شده از پایگاه داده اصلی شما را در سراسر سرورهای متعدد ایجاد می‌کند. سرور اصلی تمام عملیات نوشتن را مدیریت می‌کند در حالی که سرورهای ثانویه کپی‌های یکسان داده را از طریق فرآیندهای همگام‌سازی مداوم حفظ می‌کنند.

این استراتژی تکثیر ریسک‌های اساسی کسب‌وکار را که استقرارهای تک‌سروری نمی‌توانند غلبه کنند، برطرف می‌کند. هنگامی که پایگاه داده اصلی شما با شکست سخت‌افزاری، مسائل شبکه یا نیازهای نگهداری مواجه می‌شود، سرورهای ثانویه بلافاصله دسترسی بدون وقفه به داده‌ها را فراهم می‌کنند. فراتر از بازیابی فاجعه، Master replication مقیاس‌پذیری افقی را با توزیع پرس‌وجوهای خواندنی در سراسر سرورهای متعدد امکان‌پذیر می‌سازد در حالی که عملیات نوشتن را روی سیستم اصلی بهینه‌شده متمرکز می‌کند.

سازمان‌های مدرن Master replication را برای دستیابی به سه هدف حیاتی پیاده‌سازی می‌کنند:

حذف نقاط شکست واحد که عملیات کسب‌وکار را تهدید می‌کنند. بهبود عملکرد برنامه از طریق پردازش خواندنی توزیع‌شده. ایجاد زیرساخت پایه برای توزیع جغرافیایی داده.

اصطلاحات اطراف تکثیر برای منعکس کردن ابتکارات فراگیری صنعت تکامل یافته است. در حالی که “master-slave” در مستندات legacy رایج باقی مانده، پیاده‌سازی‌های معاصر به طور فزاینده اصطلاح “primary-secondary” را اتخاذ می‌کنند. خود MySQL از اصطلاح “slave” در نسخه ۸.۰.۲۶ فاصله گرفت و آن را با “replica” در پارامترهای پیکربندی و مستندات سیستم جایگزین کرد.

انواع مختلف تکثیر پایگاه داده چیست؟

تکثیر پایگاه داده چندین رویکرد معماری را در بر می‌گیرد که هر کدام برای الزامات عملکرد و سازگاری خاص بهینه‌سازی شده‌اند:

تکثیر ناهمزمان: رایج‌ترین پیاده‌سازی است که در آن سرور اصلی تراکنش‌ها را بلافاصله بدون انتظار برای تأیید سرور ثانویه متعهد می‌کند. این رویکرد عملکرد نوشتن را به حداکثر می‌رساند و از تأثیر مسائل سرور ثانویه بر عملیات اصلی جلوگیری می‌کند. با این حال، ناسازگاری‌های داده کوتاه‌مدت ممکن است رخ دهد اگر اصلی قبل از رسیدن تغییرات به سرورهای ثانویه شکست بخورد.

تکثیر همزمان: نیازمند این است که سرور اصلی حداقل برای یک تأیید سرور ثانویه منتظر بماند قبل از اینکه تراکنش‌ها را متعهد شده تلقی کند. این رویکرد سازگاری داده را در تمام سرورها تضمین می‌کند اما تأخیر را معرفی می‌کند که می‌تواند عملکرد برنامه را در عملیات با حجم بالا تحت تأثیر قرار دهد.

تکثیر نیمه‌همزمان: مزایای هر دو رویکرد را با نیازمند تأیید از سرورهای ثانویه بدون انتظار برای اعمال کامل تراکنش ترکیب می‌کند. این روش ریسک از دست رفتن داده را کاهش می‌دهد در حالی که ویژگی‌های عملکرد قابل قبولی را برای اکثر برنامه‌های کسب‌وکار حفظ می‌کند.

تکثیر مبتنی بر دستور: دستورات SQL را از اصلی به سرورهای ثانویه منتقل می‌کند و پهنای باند شبکه حداقلی نیاز دارد اما ممکن است ناسازگاری ایجاد کند زمانی که دستورات نتایج متفاوتی در سرورها تولید می‌کنند.

تکثیر مبتنی بر ردیف: تغییرات داده واقعی را منتقل می‌کند و سازگاری را تضمین می‌کند اما منابع شبکه بیشتری مصرف می‌کند.

تکثیر مختلط: به طور پویا روش بهینه را بر اساس ویژگی‌های دستور انتخاب می‌کند.

Master Replication در عمل چگونه کار می‌کند؟

Master replication از طریق چرخه مداوم ضبط تغییرات، انتقال و اعمال در سراسر سرورهای پایگاه داده توزیع‌شده عمل می‌کند. درک این فرآیند به مدیران پایگاه داده کمک می‌کند تا عملکرد تکثیر را بهینه کنند و مسائل پیش‌آمده در طول عملیات را عیب‌یابی نمایند.

تشخیص و ضبط تغییرات

سرور اصلی تمام عملیات تغییر داده را از طریق مکانیسم‌های لاگ باینری نظارت می‌کند که جزئیات تراکنش را در فایل‌های لاگ متوالی ضبط می‌کنند. این لاگ‌ها نه تنها تغییرات داده بلکه اطلاعات ترتیب تراکنش ضروری برای حفظ سازگاری در سراسر سرورهای ثانویه را ضبط می‌کنند.

MySQL لاگ باینری را از طریق فرمت‌های قابل پیکربندی پیاده‌سازی می‌کند که عملکرد را با الزامات سازگاری تعادل می‌بخشد. لاگ‌گیری مبتنی بر ردیف دقت بالاتری با ضبط تغییرات داده دقیق فراهم می‌کند، در حالی که لاگ‌گیری مبتنی بر دستور عملکرد بهتری برای عملیات bulk ارائه می‌دهد. فرمت مختلط به طور خودکار رویکرد بهینه را بر اساس ویژگی‌های تراکنش انتخاب می‌کند.

انتقال داده و همگام‌سازی

سرورهای ثانویه اتصال به سرور اصلی برقرار می‌کنند و داده‌های لاگ باینری را از آخرین موقعیت پردازش‌شده درخواست می‌کنند. این مدل pull-based به سرورهای ثانویه اجازه می‌دهد تا سرعت همگام‌سازی خود را کنترل کنند و از اختلالات شبکه موقت بدون مداخله بازیابی نمایند.

فرآیند تکثیر ردیابی موقعیت را از طریق نام‌های فایل لاگ و موقعیت‌هایی حفظ می‌کند که نقطه دقیق همگام‌سازی هر سرور ثانویه با اصلی را شناسایی می‌کنند. این مکانیسم بازیابی دقیق پس از وقفه‌های شبکه را امکان‌پذیر می‌سازد و افزودن سرورهای ثانویه جدید بدون اختلال در تکثیر موجود را پشتیبانی می‌کند.

اعمال تراکنش و سازگاری

سرورهای ثانویه تغییرات دریافت‌شده را دقیقاً به همان ترتیبی که در سرور اصلی رخ داده اعمال می‌کنند و سازگاری داده را در کل توپولوژی تکثیر تضمین می‌کنند. قابلیت‌های اعمال چندریسمانی پردازش موازی تراکنش‌های بدون تعارض را امکان‌پذیر می‌سازد و عملکرد تکثیر را برای بارهای کاری با حجم بالا بهبود می‌بخشد.

لاگ‌های relay روی سرورهای ثانویه داده‌های لاگ باینری دریافت‌شده را قبل از اعمال ذخیره می‌کنند و بافرینگ فراهم می‌کنند که تفاوت‌های عملکرد موقت بین سرورهای اصلی و ثانویه را جای می‌دهد. این مکانیسم از cascade شدن تأخیر تکثیر در توپولوژی‌های پیچیده در سراسر سرورهای ثانویه متعدد جلوگیری می‌کند.

چگونه ادغام Change Data Capture می‌تواند Master Replication را بهبود بخشد؟

معماری‌های داده مدرن به طور فزاینده نیازمند قابلیت‌های همگام‌سازی داده زمان واقعی هستند که عملکرد تکثیر Master سنتی را فراتر می‌برند. ادغام Change Data Capture این الزامات را با فراهم کردن انتشار داده با تأخیر زیرثانیه و یکپارچگی روان با پلتفرم‌های تحلیلی streaming برطرف می‌کند.

پیاده‌سازی CDC مبتنی بر لاگ

CDC مبتنی بر لاگ از لاگ‌های تراکنش پایگاه داده که قبلاً برای اهداف بازیابی وجود دارند، بهره می‌برد و تأثیر عملکرد بر عملیات پایگاه داده اصلی را به حداقل می‌رساند. ابزارهایی مانند Debezium و کانکتورهای CDC Airbyte لاگ‌های باینری MySQL را مستقیماً می‌خوانند و عملیات insert، update و delete را بدون نیاز به تغییرات برنامه یا بار اضافی پایگاه داده ضبط می‌کنند.

این روش چندین مزیت نسبت به رویکردهای تکثیر سنتی ارائه می‌دهد. CDC تغییرات schema را به طور خودکار ضبط می‌کند و ساختارهای داده در حال تکامل را بدون مداخله دستی پشتیبانی می‌کند. همچنین همگام‌سازی داده انتخابی را امکان‌پذیر می‌سازد و به سازمان‌ها اجازه می‌دهد جداول یا ستون‌های خاص را بر اساس الزامات کسب‌وکار به جای کل پایگاه‌های داده تکثیر کنند.

یکپارچگی تحلیلی زمان واقعی

Master replication بهبودیافته با CDC خطوط لوله داده streaming را امکان‌پذیر می‌سازد که هوش تجاری زمان واقعی و تحلیلی‌های عملیاتی را پشتیبانی می‌کنند. سازمان‌ها می‌توانند همزمان سرورهای ثانویه سنتی را برای بازیابی فاجعه حفظ کنند در حالی که تغییرات را به پلتفرم‌های تحلیلی مانند Snowflake، BigQuery یا سیستم‌های پردازش زمان واقعی stream می‌کنند.

این یکپارچگی سناریوهای مسیریابی داده پیچیده را پشتیبانی می‌کند که مصرف‌کنندگان داده مختلف نیازمند ویژگی‌های همگام‌سازی متفاوت هستند. تحلیلی‌های بازاریابی ممکن است به‌روزرسانی‌های رفتار مشتری زمان واقعی نیاز داشته باشند در حالی که گزارش‌گیری مالی خلاصه‌های روزانه batch-oriented نیاز دارد. معماری‌های CDC هر دو الگو را از طریق قابلیت‌های مسیریابی و تحول قابل پیکربندی جای می‌دهند.

پشتیبانی از معماری رویدادمحور

برنامه‌های مدرن به طور فزاینده معماری‌های رویدادمحور را اتخاذ می‌کنند که به تغییرات داده در زمان واقعی پاسخ می‌دهند. ادغام CDC تکثیر Master را از مکانیسم پشتیبان passive به پلتفرم streaming رویداد active تبدیل می‌کند که پردازش downstream و منطق کسب‌وکار را trigger می‌کند.

این قابلیت معماری‌های microservices را امکان‌پذیر می‌سازد تا سازگاری eventual را حفظ کنند در حالی که رویدادهای کسب‌وکار را در مقیاس پردازش می‌کنند. به‌روزرسانی‌های پروفایل مشتری می‌تواند بلافاصله موتورهای personalization را trigger کند، تغییرات موجودی سیستم‌های recommendation را به‌روزرسانی کند، و تراکنش‌های مالی workflowهای تشخیص تقلب را بدون تأخیر polling یا batch processing آغاز کنند.

الگوریتم‌های اجماع در رهبری Master Replication چه نقشی ایفا می‌کنند؟

Master replication سنتی به فرآیندهای failover دستی وابسته است که تأخیرهای بازیابی و ناسازگاری‌های داده بالقوه در طول شکست‌های سرور اصلی ایجاد می‌کند. الگوریتم‌های اجماع انتخاب رهبری را خودکار می‌کنند و سازگاری داده را در طول سیستم‌های توزیع‌شده در سناریوهای شکست تضمین می‌نمایند.

Failover و بازیابی خودکار

Master replication مبتنی بر اجماع مداخله دستی را در طول شکست‌های سرور اصلی حذف می‌کند با ترویج خودکار سرورهای ثانویه سالم به وضعیت اصلی. الگوریتم تضمین می‌کند که سرور ترویج‌شده تمام تراکنش‌های متعهد را شامل می‌شود و از دست رفتن داده را در طول فرآیند انتقال جلوگیری می‌کند.

الگوریتم اجماع Raft سرورها را به نقش‌های leader، follower و candidate تقسیم می‌کند با مسئولیت‌ها و قوانین انتقال به وضوح تعریف‌شده. هنگامی که followerها شکست leader را از طریق timeoutهای heartbeat تشخیص می‌دهند، فرآیندهای election را آغاز می‌کنند که رهبران جدید را بر اساس کامل بودن داده و در دسترس بودن انتخاب می‌کنند. این رویکرد زمان failover را از دقیقه‌ها به ثانیه‌ها کاهش می‌دهد در حالی که یکپارچگی داده را حفظ می‌کند.

تضمین‌های سازگاری توزیع‌شده

الگوریتم‌های اجماع تضمین‌های سازگاری قوی‌تری نسبت به تکثیر ناهمزمان سنتی فراهم می‌کنند با نیازمند توافق اکثریت قبل از متعهد کردن تراکنش‌ها. این رویکرد تضمین می‌کند که داده متعهد حتی زمانی که پارتیشن‌های اقلیت از گروه اکثریت ایزوله می‌شوند، در دسترس باقی می‌ماند.

الگوریتم سازگاری را در طول پارتیشن‌های شبکه حفظ می‌کند با اجازه تنها به پارتیشن اکثریت برای پذیرش writes در حالی که پارتیشن‌های اقلیت read-only باقی می‌مانند. این طراحی به‌روزرسانی‌های متعارض را جلوگیری می‌کند و تضمین می‌کند که بازسازی سرویس رویه‌های پیچیده حل تعارض نیاز ندارد.

پشتیبانی از استقرار چندمنطقه‌ای

الگوریتم‌های اجماع Master replication را در سراسر مناطق جغرافیایی امکان‌پذیر می‌سازد در حالی که ویژگی‌های سازگاری و عملکرد را حفظ می‌کند. سازمان‌ها می‌توانند سرورها را در سراسر مراکز داده متعدد با failover خودکار مستقر کنند که هم سلامت سرور و هم اتصال شبکه را در نظر می‌گیرد.

پیاده‌سازی‌های پیشرفته اجماع سلسله‌مراتبی را پشتیبانی می‌کنند که رهبران منطقه‌ای در تصمیمات اجماع جهانی شرکت می‌کنند در حالی که replicaهای محلی را مستقل مدیریت می‌کنند. این رویکرد ترافیک شبکه cross-region را کاهش می‌دهد در حالی که سازگاری جهانی را برای عملیات کسب‌وکار حیاتی حفظ می‌کند.

چگونه Master Replication را در MySQL راه‌اندازی کنید؟

پیاده‌سازی Master replication در MySQL نیازمند پیکربندی سیستماتیک هر دو سرور اصلی و ثانویه با توجه دقیق به امنیت، عملکرد و الزامات نظارت است. این شش گام را دنبال کنید تا زیرساخت تکثیر قابل اطمینان برقرار شود.

پیش‌نیازها و برنامه‌ریزی

Master replication موفق با برنامه‌ریزی زیرساخت مناسب و تأیید پیش‌نیاز آغاز می‌شود. اطمینان حاصل کنید که حداقل دو سرور MySQL با نسخه‌های سازگار، اتصال شبکه قابل اطمینان و ظرفیت ذخیره‌سازی کافی برای نگهداری لاگ باینری دارید.

پیکربندی شبکه باید اتصال مداوم بین سرورها با پهنای باند کافی برای ترافیک تکثیر را پشتیبانی کند. حجم لاگ باینری مورد انتظار را بر اساس الگوهای تراکنش نوشتن محاسبه کنید و ظرفیت شبکه را بر اساس آن برنامه‌ریزی نمایید. قوانین فایروال را برای اجازه ترافیک تکثیر MySQL در حالی که مرزهای امنیتی حفظ می‌شود، پیکربندی کنید.

برنامه‌ریزی ذخیره‌سازی باید الزامات نگهداری لاگ باینری و سناریوهای تأخیر تکثیر بالقوه را در نظر بگیرد. سرورهای اصلی فضای دیسک کافی برای لاگ‌های باینری بر اساس سیاست نگهداری شما نیاز دارند، در حالی که سرورهای ثانویه فضا برای لاگ‌های relay و دوره‌های buffer تأخیر بالقوه نیاز دارند.

گام ۱:

پیکربندی سرور اصلی فایل پیکربندی MySQL (معمولاً /etc/mysql/mysql.conf.d/mysqld.cnf یا /etc/my.cnf) را ویرایش کنید:

ini

[mysqld]
# Unique identifier for this server
server-id = 1

# Enable binary logging
log-bin = mysql-bin

# Specify databases to replicate (optional)
binlog-do-db = production_db

# Binary log format (ROW recommended for consistency)
binlog-format = ROW

# Enable GTIDs for easier management (MySQL 5.6+)
gtid-mode = ON
enforce-gtid-consistency = ON

سرویس MySQL را برای اعمال تغییرات پیکربندی restart کنید. فعال بودن لاگ باینری را با بررسی حضور فایل‌های لاگ باینری در دایرکتوری داده MySQL تأیید کنید.

گام ۲:

ایجاد حساب کاربری Master Replication به سرور اصلی متصل شوید و حساب کاربری اختصاصی برای تکثیر با مجوزهای مناسب ایجاد کنید:

sql

CREATE USER 'replication_user'@'%' IDENTIFIED BY 'secure_password_here';
GRANT REPLICATION SLAVE ON *.* TO 'replication_user'@'%';
FLUSH PRIVILEGES;

‘%’ را با آدرس‌های IP سرورهای ثانویه خاص برای امنیت بهبودیافته جایگزین کنید. از رمزهای عبور قوی استفاده کنید و احراز هویت مبتنی بر گواهی را برای محیط‌های تولیدی در نظر بگیرید.

گام ۳:

ضبط وضعیت سرور اصلی موقعیت فعلی لاگ باینری را برای پیکربندی سرور ثانویه ضبط کنید:

sql

SHOW MASTER STATUS;

مقادیر ستون‌های File و Position را یادداشت کنید. این مختصات مشخص می‌کنند که سرورهای ثانویه تکثیر را از کجا آغاز کنند. اگر از GTIDها استفاده می‌کنید، می‌توانید این گام را رد کنید زیرا GTIDها مدیریت موقعیت خودکار فراهم می‌کنند.

گام ۴:

ایجاد Snapshot داده برای پایگاه‌های داده موجود، snapshot سازگار ایجاد کنید در حالی که در دسترس بودن سرور اصلی حفظ می‌شود:

sql

FLUSH TABLES WITH READ LOCK;

پشتیبان‌گیری با mysqldump با گزینه master data ایجاد کنید:

bash

mysqldump --all-databases --master-data --single-transaction > backup.sql

sql

UNLOCK TABLES;

فایل پشتیبان را به سرورهای ثانویه منتقل کنید و داده را بازگردانی کنید. برای پایگاه‌های داده جدید، فقط پایگاه‌های داده خالی با ساختار matching روی سرورهای ثانویه ایجاد کنید.

گام ۵:

پیکربندی سرورهای ثانویه فایل پیکربندی سرور ثانویه را ویرایش کنید:

ini

[mysqld]
# Unique identifier (must differ from primary)
server-id = 2

# Enable relay logging
relay-log = mysql-relay-bin

# Read-only mode (recommended for secondary servers)
read-only = ON

# Enable GTIDs (if used on primary)
gtid-mode = ON
enforce-gtid-consistency = ON

سرویس MySQL را روی سرور ثانویه restart کنید و تأیید کنید که تغییرات پیکربندی فعال هستند.

گام ۶:

مقداردهی اولیه اتصال Master Replication به سرور ثانویه متصل شوید و پارامترهای تکثیر را پیکربندی کنید:

sql

CHANGE MASTER TO
MASTER_HOST = '192.168.1.10',
MASTER_USER = 'replication_user',
MASTER_PASSWORD = 'secure_password_here',
MASTER_LOG_FILE = 'mysql-bin.000001',
MASTER_LOG_POS = 12345;

START SLAVE;

برای تکثیر مبتنی بر GTID، از پیکربندی ساده‌شده استفاده کنید:

sql

CHANGE MASTER TO
MASTER_HOST = '192.168.1.10',
MASTER_USER = 'replication_user',
MASTER_PASSWORD = 'secure_password_here',
MASTER_AUTO_POSITION = 1;

START SLAVE;

وضعیت تکثیر را با SHOW SLAVE STATUS\G تأیید کنید و اطمینان حاصل کنید که هر دو Slave_IO_Running و Slave_SQL_Running Yes نشان می‌دهند.

مزایای کلیدی Master Replication چیست؟

Master replication ارزش کسب‌وکار قابل اندازه‌گیری را از طریق قابلیت اطمینان سیستم بهبودیافته، ویژگی‌های عملکرد بهبودیافته و انعطاف‌پذیری عملیاتی که رشد کسب‌وکار و گسترش جغرافیایی را پشتیبانی می‌کند، ارائه می‌دهد.

در دسترس بودن بالا و تداوم کسب‌وکار مزایای اصلی را نشان می‌دهند که هزینه‌های پیاده‌سازی تکثیر را توجیه می‌کنند. سازمان‌ها اهداف زمان بازیابی نزدیک به صفر را با ترویج سرورهای ثانویه به وضعیت اصلی در طول نگهداری برنامه‌ریزی‌شده یا شکست‌های غیرمنتظره دستیابی می‌کنند. این قابلیت توقف پرهزینه را که تجربه مشتری و تولید درآمد را مختل می‌کند، حذف می‌کند.

مقیاس‌پذیری خواندنی و بهینه‌سازی عملکرد به برنامه‌ها اجازه می‌دهد بار پرس‌وجو را در سراسر سرورهای متعدد توزیع کنند در حالی که عملیات نوشتن را روی زیرساخت اصلی بهینه‌شده متمرکز می‌کنند. پلتفرم‌های e-commerce می‌توانند پرس‌وجوهای کاتالوگ محصول را به سرورهای ثانویه توزیع‌شده جغرافیایی route کنند در حالی که به‌روزرسانی‌های موجودی را روی سیستم‌های اصلی متمرکز حفظ می‌کنند.

بازیابی فاجعه و حفاظت داده بیمه‌ای در برابر سناریوهای از دست رفتن داده فاجعه‌بار فراهم می‌کند که بقای کسب‌وکار را تهدید می‌کنند. سازمان‌ها کپی‌های داده فعلی را در تأسیسات جداگانه یا مناطق ابر حفظ می‌کنند و بازیابی سریع از بلایای طبیعی، حوادث امنیتی یا شکست‌های زیرساختی را امکان‌پذیر می‌سازند.

توزیع جغرافیایی داده برنامه‌های جهانی را با موقعیت‌دهی کپی‌های داده نزدیک به کاربران در حالی که سازگاری را در سراسر مناطق حفظ می‌کند، پشتیبانی می‌کند. پلتفرم‌های رسانه‌های اجتماعی داده‌های پروفایل کاربر را به سرورهای منطقه‌ای تکثیر می‌کنند برای دسترسی سریع در حالی که به‌روزرسانی‌ها را به طور جهانی همگام‌سازی می‌کنند برای تجربیات کاربر سازگار.

چگونه عملکرد Master Replication را تست و نظارت کنید؟

نظارت و تست مؤثر قابلیت اطمینان تکثیر را تضمین می‌کند در حالی که گلوگاه‌های عملکرد را قبل از تأثیر بر عملیات کسب‌وکار شناسایی می‌کند. استراتژی‌های نظارت جامع را پیاده‌سازی کنید که هم معیارهای فنی و هم شاخص‌های مرتبط با کسب‌وکار را پیگیری کنند.

نظارت تأخیر Master Replication

تأخیر تکثیر بین سرورهای اصلی و ثانویه را با استفاده از خروجی SHOW SLAVE STATUS پیگیری کنید، به طور خاص معیار Seconds_Behind_Master. اندازه‌گیری‌های baseline تأخیر را در طول عملیات عادی برقرار کنید و هشدارها را زمانی که تأخیر از آستانه‌های قابل قبول فراتر می‌رود، پیکربندی کنید.

پرس‌وجوهای نظارت سفارشی را پیاده‌سازی کنید که مقادیر timestamp را بین سرورهای اصلی و ثانویه مقایسه می‌کنند تا تأخیرهای تکثیر را که ممکن است در معیارهای استاندارد MySQL ظاهر نشوند، تشخیص دهند. این رویکرد هشدار زودهنگام روندهای تخریب عملکرد فراهم می‌کند.

اعتبارسنجی سازگاری داده

بررسی‌های سازگاری منظم تأیید می‌کنند که سرورهای ثانویه داده‌های یکسان با سرور اصلی را شامل می‌شوند. از ابزارهای checksumming مانند pt-table-checksum از Percona Toolkit برای مقایسه داده در سراسر سرورها بدون تأثیر بر عملکرد تولیدی استفاده کنید.

نظارت سازگاری خودکار باید در طول پنجره‌های نگهداری اجرا شود تا هر drift داده را که ممکن است مسائل تکثیر یا باگ‌های برنامه را که مکانیسم‌های تکثیر را دور می‌زنند، نشان دهد، شناسایی کند.

ارزیابی تأثیر عملکرد

عملکرد سرور اصلی را در طول عملیات تکثیر نظارت کنید تا اطمینان حاصل شود که لاگ‌گیری باینری و اتصالات سرور ثانویه زمان‌های پاسخ برنامه را تخریب نمی‌کنند. الگوهای I/O دیسک، استفاده CPU و مصرف پهنای باند شبکه مرتبط با فعالیت‌های تکثیر را پیگیری کنید.

نظارت سرور ثانویه باید بر عملکرد thread تکثیر، نرخ‌های پردازش لاگ relay و الگوهای اجرای پرس‌وجو تمرکز کند که ممکن است فرصت‌های بهینه‌سازی یا الزامات برنامه‌ریزی ظرفیت را نشان دهد.

تست سناریوهای شکست

تست بازیابی فاجعه منظم تأیید می‌کند که رویه‌های failover درست کار می‌کنند و اهداف زمان بازیابی را برآورده می‌کنند. سناریوهای تست باید شامل شکست سرور اصلی، پارتیشن‌های شبکه و شکست‌های سرور ثانویه برای آمادگی جامع باشد.

رویه‌های بازیابی را مستند کنید و runbookهای به‌روز نگه دارید که شامل اطلاعات تماس، رویه‌های escalation و برنامه‌های rollback برای تلاش‌های failover ناموفق باشد.

چه استراتژی‌هایی عملکرد Master Replication را بهینه می‌کنند؟

بهینه‌سازی عملکرد الزامات سازگاری را با تقاضاهای throughput تعادل می‌بخشد در حالی که محدودیت‌های زیرساختی و ویژگی‌های برنامه را در نظر می‌گیرد. رویکردهای بهینه‌سازی سیستماتیک را پیاده‌سازی کنید که هم نیازهای عملکرد فوری و هم الزامات مقیاس‌پذیری بلندمدت را برطرف کنند.

تنظیم پیکربندی لاگ باینری

انتخاب فرمت لاگ باینری را بر اساس ویژگی‌های بار کاری و الزامات سازگاری بهینه کنید. لاگ‌گیری مبتنی بر ردیف سازگاری بالاتری برای تراکنش‌های پیچیده فراهم می‌کند در حالی که لاگ‌گیری مبتنی بر دستور عملکرد بهتری برای عملیات bulk با نتایج deterministic ارائه می‌دهد.

سیاست‌های نگهداری لاگ باینری را پیکربندی کنید که الزامات بازیابی فاجعه را با هزینه‌های ذخیره‌سازی تعادل ببخشد. دوره‌های نگهداری طولانی‌تر سناریوهای بازیابی نقطه‌در-زمان را پشتیبانی می‌کنند اما فضای دیسک اضافی و منابع پشتیبان مصرف می‌کنند.

بهینه‌سازی شبکه و اتصال

Pooling اتصال و فشرده‌سازی را برای ترافیک تکثیر پیاده‌سازی کنید تا سربار شبکه را کاهش دهید و throughput را بهبود بخشد. رمزنگاری SSL امنیت را اضافه می‌کند اما استفاده CPU و تأخیر شبکه را افزایش می‌دهد که ممکن است تنظیمات ظرفیت نیاز داشته باشد.

رابط‌های شبکه اختصاصی را برای ترافیک تکثیر در محیط‌های با حجم بالا در نظر بگیرید تا از تأثیر تأخیرهای تکثیر بر اتصال برنامه یا بالعکس جلوگیری شود.

Multi-Threading و پردازش موازی

پردازش تکثیر موازی را روی سرورهای ثانویه فعال کنید تا throughput را برای بارهای کاری با تراکنش‌های مستقل بهبود بخشد. MySQL 5.6+ حالت‌های تکثیر موازی مختلفی را پشتیبانی می‌کند که می‌تواند تأخیر را برای بارهای کاری سازگار به طور قابل توجهی کاهش دهد.

تعداد threadهای مناسب را بر اساس ظرفیت CPU سرور ثانویه و ویژگی‌های بار کاری پیکربندی کنید. threadهای بیش از حد می‌تواند contention ایجاد کند، در حالی که threadهای کم throughput بالقوه را محدود می‌کند.

بهینه‌سازی ذخیره‌سازی و I/O

پیکربندی ذخیره‌سازی را برای عملکرد هم لاگ باینری و هم لاگ relay بهینه کنید. از ذخیره‌سازی سریع برای لاگ‌های باینری روی سرورهای اصلی استفاده کنید و دستگاه‌های ذخیره‌سازی جداگانه را برای لاگ‌های relay روی سرورهای ثانویه در نظر بگیرید تا از contention I/O جلوگیری شود.

schedulerهای I/O مناسب و گزینه‌های سیستم فایل را برای بارهای کاری تکثیر که معمولاً شامل الگوهای نوشتن متوالی با عملیات fsync دوره‌ای هستند، پیکربندی کنید.

چه ملاحظات امنیتی برای Master Replication اعمال می‌شود؟

امنیت تکثیر نیازمند حفاظت جامع از داده در حال انتقال، مکانیسم‌های احراز هویت و کنترل‌های دسترسی است که دسترسی غیرمجاز به داده را جلوگیری می‌کند در حالی که کارایی عملیاتی حفظ می‌شود.

رمزنگاری و حفاظت داده

رمزنگاری SSL/TLS را برای تمام اتصالات تکثیر پیاده‌سازی کنید تا محرمانگی داده را در طول انتقال بین سرورها محافظت کند. از احراز هویت مبتنی بر گواهی برای تأیید هویت سرورها و جلوگیری از حملات man-in-the-middle استفاده کنید.

cipher suites و طول کلیدهای مناسب را پیکربندی کنید که الزامات امنیتی را با ویژگی‌های عملکرد تعادل ببخشد. رویه‌های چرخش گواهی منظم و مدیریت کلید اثربخشی امنیتی بلندمدت را تضمین می‌کنند.

احراز هویت و کنترل دسترسی

حساب‌های کاربری تکثیر اختصاصی با مجوزهای حداقلی مورد نیاز ایجاد کنید تا قرار گرفتن امنیتی بالقوه را محدود کند. از استفاده حساب‌های اداری برای اتصالات تکثیر اجتناب کنید و سیاست‌های رمز عبور قوی را برای تمام کاربران تکثیر پیاده‌سازی کنید.

احراز هویت مبتنی بر گواهی را برای اتصالات تکثیر در محیط‌های با الزامات امنیتی سختگیرانه در نظر بگیرید. این رویکرد آسیب‌پذیری‌های مبتنی بر رمز عبور را حذف می‌کند در حالی که تأیید هویت قوی‌تری فراهم می‌کند.

امنیت شبکه و ایزوله‌سازی

تقسیم‌بندی شبکه را پیاده‌سازی کنید که ترافیک تکثیر را از ترافیک برنامه عمومی ایزوله کند در حالی که اتصال لازم حفظ می‌شود. از فایروال‌ها و گروه‌های امنیتی برای محدود کردن اتصالات تکثیر به سرورهای مجاز تنها استفاده کنید.

الگوهای اتصال تکثیر را نظارت کنید و سیستم‌های تشخیص نفوذ را پیاده‌سازی کنید که تلاش‌های اتصال غیرعادی یا الگوهای دسترسی داده را که ممکن است حوادث امنیتی را نشان دهد، شناسایی کنند.

الزامات حسابرسی و رعایت

لاگینگ حسابرسی جامع را پیکربندی کنید که فعالیت‌های کاربر تکثیر، تلاش‌های اتصال و تغییرات پیکربندی را پیگیری کند. ردپاهای حسابرسی را حفظ کنید که الزامات رعایت و رویه‌های تحقیق حادثه امنیتی را پشتیبانی کنند.

ارزیابی‌های امنیتی منظم را پیاده‌سازی کنید که پیکربندی تکثیر را در برابر بهترین شیوه‌های امنیتی فعلی و سیاست‌های سازمانی ارزیابی کنند. رویه‌های امنیتی را با تکامل تهدیدها و ظهور آسیب‌پذیری‌های جدید به‌روزرسانی کنید.

سوالات متداول

تفاوت بین Master replication و Master-Slave replication چیست؟

Master replication و Master-Slave replication به همان مفهوم تکثیر پایگاه داده اشاره دارند، جایی که سرور اصلی (Master) کپی‌های همگام‌سازی‌شده داده را روی سرورهای ثانویه (Slave/Replica) حفظ می‌کند. اصطلاحات با “Master replication” و “primary-secondary replication” به عنوان اصطلاحات ترجیحی در پیاده‌سازی‌های مدرن تکامل یافته‌اند.

Master replication شکست‌های شبکه بین سرورها را چگونه مدیریت می‌کند؟

سیستم‌های Master replication شکست‌های شبکه را به طور خودکار از طریق مکانیسم‌های buffering و بازیابی مدیریت می‌کنند. سرورهای ثانویه موقعیت همگام‌سازی آخر خود را ذخیره می‌کنند و تکثیر را از آن نقطه زمانی که اتصال بازمی‌گردد، از سر می‌گیرند. لاگ‌های باینری روی سرور اصلی تاریخچه کافی را برای پشتیبانی از بازیابی پس از قطعی‌های شبکه موقت حفظ می‌کنند.

آیا Master replication در سراسر ارائه‌دهندگان ابر مختلف کار می‌کند؟

بله، Master replication در سراسر ارائه‌دهندگان ابر مختلف و محیط‌های hybrid عمل می‌کند. سازمان‌ها معمولاً تکثیر cross-cloud را برای بازیابی فاجعه و توزیع جغرافیایی پیاده‌سازی می‌کنند. اتصال شبکه، پیکربندی امنیتی و ملاحظات تأخیر نیازمند برنامه‌ریزی دقیق برای عملکرد بهینه هستند.

اگر سرور اصلی در طول یک تراکنش شکست بخورد چه اتفاقی می‌افتد؟

رفتار تراکنش در طول شکست سرور اصلی به حالت تکثیر بستگی دارد. تکثیر ناهمزمان ممکن است تراکنش‌های unmet تعهد را از دست بدهد، در حالی که تکثیر همزمان تضمین می‌کند تراکنش‌های متعهد روی سرورهای ثانویه وجود دارند. رویه‌های failover مناسب شامل تأیید سازگاری داده قبل از ترویج سرورهای ثانویه به وضعیت اصلی است.

Master replication معمولاً چقدر پهنای باند شبکه نیاز دارد؟

الزامات پهنای باند شبکه بر اساس حجم تراکنش نوشتن، انواع داده و پیکربندی فرمت لاگ باینری متفاوت است. تکثیر مبتنی بر ردیف معمولاً پهنای باند بیشتری نسبت به تکثیر مبتنی بر دستور نیاز دارد. سازمان‌ها باید الگوهای استفاده واقعی را نظارت کنند و ظرفیت را بر اساس دوره‌های تراکنش peak به جای بارهای متوسط برنامه‌ریزی کنند.