همانند سازی در ارائه دسترسی فوری به داده ها عالی است، اما نباید تنها محافظ در برابر خطاهای انسانی، خراب شدن داده ها یا حملات سایبری باشد.
همانند سازی داده ها به مرور قابلیت خود را اثبات کرده است و برای چندین دهه ابزار قابل اعتمادی را برای حفاظت از اطلاعات حیاتی در اختیار سازمان ها قرار داده است. همانندسازی، کپیهای اضافی از دادههای حیاتی ایجاد میکند و از در دسترس بودن و انعطافپذیری آن در صورت بروز بلایا یا خرابی سیستم اطمینان حاصل میکند. در این مقاله، پیچیدگیهای تکثیر دادهها را بررسی میکنم، اجزای اساسی، انواع و محدودیتهای بالقوه آن را بررسی میکنم.
تکثیر داده ها با انتخاب حجم منبع یا فایل سیستمی که نیاز به محافظت دارد شروع می شود. این حجم منبع ممکن است یک دیسک مجازی باشد که اغلب به عنوان LUN (شماره واحد منطقی) شناخته میشود که از یک آرایه ذخیرهسازی یا مدیریت حجم منبع گرفته میشود. همچنین ممکن است به شکل یک فایل سیستم باشد. همانندسازی میتواند در سطح بلوک اتفاق بیفتد، یک روش معمول به دلیل کارایی آن، یا در سطح سیستم فایل، اگرچه دومی به دلیل عملکرد نسبتاً پایینتر مورد علاقه کمتری است.
پس از انتخاب منبع، باید حجم یا فایل سیستم دیگری را از یک میزبان مجزا انتخاب کنید تا به عنوان هدف برای همانند سازی عمل کند. امیدواریم در یک مکان جغرافیایی مجزا قرار گیرد – یک جنبه حیاتی برای اطمینان از افزونگی داده ها و تنوع جغرافیایی.
سازمان ها از سیستم های تکثیر متنوعی استفاده می کنند که توسط فروشندگان آرایه ذخیره سازی، فروشندگان مدیریت حجم، فروشندگان سیستم فایل و ارائه دهندگان شخص ثالث ارائه می شود. این راه حل ها قلب فرآیند همانند سازی را تشکیل می دهند و همگام سازی داده ها را بین حجم منبع و هدف تسهیل می کنند.
مرحله همگام سازی اولیه با اطمینان از اینکه حجم هدف منعکس کننده محتوای حجم منبع است، پایه و اساس را برای تکرار تنظیم می کند. هنگامی که این نقطه عطف به دست آمد، سیستم تکثیر با جدیت هر تغییری را که در حجم منبع رخ می دهد به حجم هدف ردیابی و منتشر می کند. این همگام سازی مداوم، که معمولاً در سطح بلوک اجرا می شود، تضمین می کند که ثبات داده ها در هر دو حجم حفظ می شود. این که حجم هدف چقدر حجم منبع را منعکس میکند، بر این اساس که از همانند سازی همزمان یا ناهمزمان استفاده میکنید، استوار خواهد بود.
یک سیستم تکرار همزمان، هر تغییری را قبل از تأیید آن تغییرات در برنامهای که آنها را ایجاد کرده است، تکرار میکند. (زمانی که یک برنامه یک بلوک از داده ها را در یک جلد می نویسد، منتظر تایید یا ACK است که قبل از نوشتن بلوک بعدی، نوشتن موفقیت آمیز در حجم منبع را تایید می کند). این فرآیند شبیه یک commit دو مرحله ای در دنیای پایگاه داده است. که در آن هر دو نوشتن در حجم منبع و کپی آن نوشتن در حجم هدف به عنوان یک رویداد اتمی درک می شوند.
مزیت اصلی همانند سازی همزمان در توانایی آن برای تضمین سطح بالایی از حفاظت از داده ها نهفته است. با همگام سازی مداوم حجم منبع و هدف، خطر از دست رفتن داده ها به دلیل یک فاجعه یا خرابی تا حد زیادی کاهش می یابد. با این حال، یک معامله وجود دارد: عملکرد سیستم هدف و مسیر تکثیر داده ها می تواند تاخیرهای قابل توجهی را در تحویل ACK ایجاد کند که بر زمان پاسخگویی برنامه تاثیر می گذارد.
یک مثال تلخ از پیامدهای عملکردی همانند سازی همزمان پس از حوادث غم انگیز 11 سپتامبر پدیدار شد. در پاسخ به آسیبپذیریهای آشکار شده در طول حملات، تنظیمکنندههای ایالات متحده تلاش کردند تا سازمانهای مالی را موظف کنند که همانندسازی همزمان را در فواصل بیش از ۳۰۰ مایل، با هدف افزایش حفاظت از دادهها و قابلیتهای بازیابی بلایا، اجرا کنند. با این حال، تأخیر بین سایتها بسیار زیاد تلقی میشد که در نهایت منجر به کنار گذاشتن این برنامهها شد.
در مقابل، تکثیر ناهمزمان رویکرد عملگرایانه تری دارد و تکرار فوری تغییرات را به نفع قرار دادن آنها در صف برای انتقال بعدی به تعویق می اندازد. نوشته ها تقسیم می شوند و یکی از آنها به سیستم تکرار ارسال می شود که آن را به انتهای صف اضافه می کند. بسته به پهنای باند و تأخیر، حجم هدف ممکن است از چند ثانیه تا چند ساعت از حجم منبع فاصله داشته باشد.
در حالی که همانند سازی ناهمزمان تعادل مطلوبی بین عملکرد و حفاظت از داده ها ارائه می دهد، نگرانی های بالقوه ای را ایجاد می کند. یکی از ملاحظات کلیدی، خطر عقب افتادن بیش از حد فرآیند تکرار است که منجر به چالش هایی در مواجهه با حجم روزافزون تغییرات پشت سر هم می شود. تحت شرایط خاص، برخی از برنامههای کاربردی ممکن است از ادغام نوشتن پشتیبانی کنند، فرآیندی که در آن نوشتههای قدیمی حذف میشوند تا سیستم تکثیر بتواند عقبنشینی کند. با این وجود، چنین اقداماتی باید با احتیاط انجام شوند، زیرا می توانند بر روی سازگاری داده ها و گزینه های بازیابی تأثیر بگذارند.
در حالی که بخشهای قبلی عمدتاً بر روی تکرار در سطح بلوک متمرکز بودند، مفهوم مشابهی به مفهوم تکرار پایگاه داده نیز گسترش مییابد. در اینجا، تأکید از همانند سازی در سطح بلوک به تکرار تراکنشهای فردی بین پایگاههای داده تغییر میکند. همانند سایر اشکال تکثیر، تکثیر پایگاه داده معمولاً به صورت ناهمزمان انجام می شود که بر کاربرد آن در حفاظت از رکوردهای پایگاه داده حیاتی تأکید می کند.
همانند سازی مدتهاست که روش انتخابی برای سازمانهایی بوده است که به دنبال محافظت از برنامههای کاربردی حیاتی هستند، که ناشی از توانایی آن در ارائه بازیابی سریع و کارآمد دادهها است. در واقع، قابلیتهای همگامسازی دادههای آنی آن را به ابزاری ضروری برای اطمینان از در دسترس بودن دادهها در طول بحران تبدیل میکند. با این حال، تشخیص این موضوع ضروری است که همانندسازی، زمانی که به صورت مجزا به کار گرفته شود، با محدودیتهای ذاتی همراه است.
شاید چشمگیرترین محدودیت در عدم وجود “دکمه برگشت” در سیستم های تکرار سنتی باشد. در صورت بروز خطاهای انسانی، مانند حذف یا خرابی تصادفی داده ها (یا حملات باج افزار)، همانند سازی به طور صادقانه این اقدامات را به حجم مورد نظر منتشر می کند و منجر به از دست دادن داده های غیرقابل برگشت می شود.
در نتیجه، تکیه بر تکثیر صرفاً برای حفاظت از دادهها، از قانون آزمایش شده و واقعی 3-2-1 پیروی نمیکند: سه نسخه از داده در دو رسانه مختلف، با یک نسخه خارج از سایت. ممکن است به نظر برسد که مطابقت دارد. با این حال، از آنجایی که یک اقدام میتواند همه نسخهها را حذف کند، با جنبه «2» قرار دادن نسخههای مختلف در رسانههایی با پروفایلهای ریسک متفاوت مطابقت ندارد.
ملاحظات دیگر مربوط به سربار عملکرد بالقوه است که توسط تکرار معرفی می شود. هنگامی که پشتیبانگیریهای معمولی را با تکثیر دادهها همراه میکنید، دادهها به طور موثر دو بار کپی میشوند، که منجر به تأثیر عملکردی میشود که ممکن است در انزوا ناچیز تلقی شود، اما زمانی که عوامل دیگر وارد میشوند، انباشته میشوند.
تکثیر داده ها به عنوان یک مکانیسم حفاظت از داده های محترم شناخته می شود و سازمان ها را با توانایی ایجاد نسخه های بلادرنگ از داده های حیاتی توانمند می کند و انعطاف پذیری و تداوم داده ها را تقویت می کند. با این وجود، همانطور که در پیچیدگیهای آن تحقیق میکنیم، محدودیتهای آن و نقش اساسی آن را در مجموعه گستردهتر حفاظت از دادهها آشکار میکنیم.
در حالی که همانند سازی در ارائه دسترسی فوری به داده ها عالی است، نمی توان تنها به آن برای محافظت در برابر خطاهای انسانی، خرابی داده ها، حملات سایبری یا از دست دادن چندین نسخه اعتماد کرد. از این رو، تکمیل تکثیر با استراتژی های جامع پشتیبان گیری از داده ها، رعایت قانون 3-2-1 و گنجاندن قابلیت های نسخه سازی بسیار مهم است. (تصویر لحظه ای داده ها نمونهای عالی از یک ابزار همراه هستند که میتوانند همانند سازی را ارزشمندتر کنند).
با پذیرش یک رویکرد جامع برای حفاظت از داده ها، ترکیب قدرت تکثیر داده ها با شیوه های پشتیبان گیری قوی، سازمان ها می توانند با اطمینان در چشم انداز دیجیتال حرکت کنند و از با ارزش ترین دارایی خود: داده ها محافظت کنند. با تأکید بر هم افزایی بین تکثیر بلادرنگ و پشتیبانگیری با ساختار مناسب، کسبوکارها میتوانند با اطمینان به چالشهای در حال تکامل حفاظت از دادهها رسیدگی کنند و از انعطافپذیری عملیات خود اطمینان حاصل کنند.