¿Alguna vez ha tenido la sensación de que su sistema de backup está retrasado? ¿Lee revistas de comercio y se pregunta si es el único que sigue utilizando un sistema de copia de seguridad anticuado? Lo primero que debe saber es que no es el único. Pero su sistema de backup probablemente podría modernizarse.
Las nuevas tecnologías han cambiado la naturaleza del juego de los backups de una manera fundamental, con los discos desempeñando un papel cada vez más importante y desplazando a la cinta a un segundo plano. Muchos de los riesgos y problemas de rendimiento que han afectado las copias de seguridad del centro de datos desde siempre, ahora tienen soluciones tecnológicas plausibles, siempre que esas soluciones se apliquen con cuidado, y concuerden con la estrategia principal de almacenamiento. Realmente es un nuevo amanecer.
Antes de que contemple un plan de modernización, es necesario que profundice en el conocimiento de las nuevas soluciones basadas en discos de alta velocidad, en los esquemas que reducen el volumen de datos replicados, y en cómo trabajan realmente las técnicas de protección en tiempo real. Con todo eso a cuestas ya puede comenzar a aplicar esos avances a los problemas de protección de datos del mundo real que todo centro de datos enfrenta.
El disco en el centro
Las estrategias D2D2T (de disco a disco a cinta) han ganado popularidad en años recientes debido a la gran disparidad entre los dispositivos a ser copiados (discos), la red que transporta el backup, y los dispositivos que reciben el material (cintas). El rendimiento promedio de una unidad de disco hace 15 años era de aproximadamente 4 Mbps a 5 Mbps, y la unidad de cinta más popular era de 256KBps, por lo que el cuello de botella era la unidad de cinta.
Hoy en día tenemos unidades de disco de 70Mbps, pero unidades de cinta que quieren 120Mbps. Los discos se han vuelto de 15 a 20 veces más rápidos, pero las unidades de cinta son ¡casi 500 veces más rápidas! La cinta ya no es el cuello de botella, pero está agonizando. Esto es especialmente cierto cuando usted se da cuenta de que la mayoría de las copias de seguridad son incrementales y se apoderan de una unidad de cinta durante horas solo para mover unos pocos gigabytes de datos.
Las estrategias D2D2T resuelven este problema mediante la colocación de un buffer de alta velocidad entre los sistemas de archivos basados en disco, fragmentados, y las bases de datos que están siendo respaldadas y la hambrienta unidad de cinta. Este buffer es un sistema de almacenamiento basado en disco diseñado para recibir copias de seguridad de suministro lento y entregarlas muy rápidamente a una unidad de cinta de alta velocidad.
El desafío que enfrentan algunos clientes (especialmente los grandes) es que muchos sistemas de copias de seguridad no sabían cómo compartir un sistema de discos grandes y utilizarlo para copias de seguridad. Claro que podían realizar las copias en una unidad de disco pero ¿qué ocurría si necesitaba compartir ese disco entre múltiples servidores de backup?
Muchos productos de backup todavía no pueden hacer eso, especialmente las unidades de discos conectadas a Fibre Channel. La llegada de las librerías virtuales de cintas o VTL solucionaron el problema de compartir, presentando las unidades de disco como librerías de cintas, las cuales los productos de software de backup ya han aprendido cómo compartir. Entonces ahora podía compartir un sistema de disco grande entre múltiples servidores.
Además, a los clientes, que ya estaban más familiarizados con la interfase de cinta, se les presentó como una transición muy fácil para hacer copias de seguridad en disco. Otro método para crear un disco de destino compartido es el disco inteligente de destino, o IDT (intelligent disk target). Los fabricantes de sistemas IDT consideraban que el mejor método era utilizar el protocolo NFS o CIFS para presentar el sistema de disco al sistema de backup. Estos protocolos también permitían compartir fácilmente entre múltiples servidores de backup.
Pero ambos, los proveedores de VTL y de IDT tenían un problema fundamental: El costo del disco convertía a sus sistemas rentables en solo dispositivos de etapas. Los clientes almacenaban backups de una sola noche en el disco y luego rápidamente los transferían a cinta. Querían almacenar más backups en disco, pero no podían afrontar el costo.
La magia de la deduplicación de datos
Los backups típicos crean data duplicada de dos maneras: repetidas copias de seguridad completas, y repetidas copias incrementales del mismo archivo cuando cambia varias veces. Un sistema de deduplicación identifica las dos situaciones y elimina los archivos redundantes, reduciendo la cantidad de disco necesario para almacenar las copias de seguridad en cualquier lugar de 10:1 a 50:1 y más allá, dependiendo del nivel de redundancia en sus datos.
Los sistemas de deduplicación también brindan su magia a nivel de subarchivos. Para ello, se identifican los segmentos de datos (un segmento suele ser más pequeño que un archivo, pero más grande que un byte) que son redundantes con otros segmentos y los elimina. El uso más obvio de esta tecnología es permitir a los usuarios cambiar de estrategias de etapas (en las que almacenan en backup solo lo de una noche) a estrategias de backup de discos (en las que almacenan todos los backups del sitio en disco).
Hay dos tipos principales de deduplicación:
* Los sistemas de deduplicación de destino permiten a los clientes enviar copias de seguridad tradicionales a un sistema de almacenamiento que a continuación hace la deduplicación. Estos normalmente se usan en centros de datos medianos a grandes y se desempeñan a gran velocidad.
* Los sistemas de deduplicación de fuente utilizan diverso software backup para eliminar datos redundantes desde el comienzo del proceso, y sirven para copia de seguridad de oficinas remotas y usuarios móviles.
Copias de seguridad sobre la marcha
La protección continua de datos (o CDP) es otra tecnología de backup basada en disco, cada vez más popular. Piense en ella como la réplica de un botón de Deshacer. Cada vez que un bloque de datos cambia en el sistema a ser respaldado, es transferido al sistema CDP. Sin embargo, a diferencia de la replicación, el CDP almacena los cambios en una bitácora, así que puede deshacer esos cambios a un nivel muy granular. De hecho, puede recuperar el sistema a literalmente cualquier punto en el tiempo en que los datos fueron almacenados dentro del sistema CDP.
Un sistema “Casi CDP” funciona en forma similar, excepto que tiene puntos discretos en el tiempo, los cuales puede recuperar. Para decirlo de otra manera, el “Casi CDP” combina tomas instantáneas con la replicación. Por lo general, se toma una instantánea del sistema que es respaldado, con lo cual esa instantánea se replica en otro sistema que almacena la copia de seguridad. ¿Por qué tomar la instantánea en la fuente antes de la replicación? Debido a que solo en la fuente se puede normalmente inmovilizar la escritura de las aplicaciones hacia el almacenamiento, de modo que la instantánea sea significativa.
W. Curtis Preston, InfoWorld (US)