Last updated on Monday 28th of February 2022 08:52:48 PM

Deduplicación de datos a nivel de bloque

¿Que es la deduplicación?, como aprovechar esta tecnología

 Please note that this post is relative to old deprecated software ©XSIBackup-Classic. Some facts herein contained may still be applicable to more recent versions though.

For new instalations please use new ©XSIBackup which is far more advanced than ©XSIBackup-Classic.

Lea tambien: How to use deduplication resources effectively

La deduplicación de datos es una tecnología antigua que cayó en desuso debido al rápido desarrollo de nuevas tecnologías que permitían aumentar el tamaño de los discos duros al tiempo que se abarataba su coste. La deduplicación de datos consiste en almacenar cada dato una sóla vez.

Existe deduplicación a nivel de archivo, de forma que si en el backup de mañana sólo unos pocos de los archivos han cambiado, el sistema de deduplicación no copiará los archivos preexistentes, sinó que los almacenará como un puntero a una copia única de cada archivo.

La deduplicación a nivel de archivo es diferente al backup diferencial en un aspecto importante, y es que genera estructuras de backup que nos permiten movernos en el tiempo para acceder a la configuración de archivos de una determinada fecha, pero ocupando prácticamente el mismo espacio en disco que si tuvieramos una sóla copia del backup.

Naturalmente la deduplicación a nivel de archivo tiene un serio inconveniente cuando queremos hacer backup de pocos ficheros muy grandes, como una base de datos o un conjunto de máquinas virtuales.

Lógicamente el cambio de un sólo byte de información en una base de datos o en una máquina virtual hará que el archivo entero (que puede ocupar cientos o miles de gigabytes) sea distinto a la copia previamente almacenada, y este se copiará de nuevo, perdiendo así la ventaja de la deduplicación. Deduplicación a nivel de bloque

Para solucionar el problema planteado en el párrafo anterior existe la deduplicación a nivel de bloque. Los bloques son los elementos constitutivos lógicos que componen los datos almacenados en cualquier disco duro y que suelen ser un múltiplo entero del tamaño del sector del médio físico que los alberga. La deduplicación a nivel de bloque permite que un nuevo backup grabe solamente los bloques que han cambiado y almacene el resto como punteros a los bloques que no han cambiado.

Esto es ideal para almacenar ficheros muy grandes que comparten muchos bloques, como por ejemplo un disco duro virtual de VMWare, Hyper-V, Xen o cualquier otro sistema de virtualización, ya que muchos de los bloques de cualquier máquina virtual albergarán los archivos constituyentes del sistema operativo o los programas instalados, y sólo una parte corresponderá a los archivos de usuario.

E incluso dentro de los archivos de usuario, no todos cambian a diario, con lo cual un sistema de almacenamiento con deduplicación a nivel de bloque será ideal para minimizar el espacio de almacenamiento y la velocidad de copiado en los backup diarios.

La velocidad de backup de datos puede aumentar mucho, dependiendo de las características de los datos y los ajustes en el sistema de deduplicación empleado, dado que para copiar un bloque de por ejemplo 8 mb. bastará con comprobar que existe un checksum para el bloque en cuestión, y si es así ahorramos el copiado de esos 8 mb. cambiándolo por una transferencia de unos pocos bytes de largo correspondientes al checksum.

En los últimos años, debido sobre todo al rápido desarrollo de tecnologías relacionadas con la virtualización, la deduplicación ha resurgido como una forma de reducir drásticamente el espacio requerido para almacenar sistemas operativos virtualizados, tanto en espacios de producción como en sistemas de backup. También resulta de gran utilidad en el backup de bases de datos y todo tipo de archivos.

En 33HOPS aplicamos tecnología de deduplicación a nivel de bloque para minimizar su espacio de backup y maximizar la velocidad a la que este se produce. Al mismo tiempo podrá disponer de un histórico de backups, de forma que podrá revertir sus sistemas a cualquier punto en el tiempo que sea necesario.

Amplie información sin ningún compromiso