Diferencias de la tecnología de deduplicación de Lortu con respecto a otras tecnologías de deduplicación.
Hay varias formas de implementar la deduplicación y aunque cada sistema tiene sus ventajas e inconvenientes, algunas son mucho más óptimas que otras.
Principales diferencias entre cada tipo de tecnología:
Deduplicación Post-process vs. Deduplicación in-line:
La principal ventaja de la deduplicación post-process en relación a la deduplicación in-line es su mayor velocidad en el proceso de almacenamiento de backup, reduciendo la ventana de tiempo de backup. Esto es debido a que la información es primero almacenada en el dispositivo y luego deduplicado sin interferir en el proceso de almacenamiento de backups.
Lortu implementa un sistema de deduplicación post-process.
Diferencia binaria a nivel de Byte vs. pattern matching (almacena un hash por cada patrón o bloque):
El sistema basado en Pattern matching es menos escalable que el basado en diferencia binaria a medida que crece la cantidad de datos a deduplicar. Ello es debido a que los sistemas basados en Pattern matching utilizan una tabla de hashes que a medida que crece requiere de más CPU y memoria para realizar las búsquedas. Sin embargo el mayor inconveniente de las tecnologías basadas en Pattern matching es el tiempo de restauración.
Si el tiempo de backup es crítico, el de restauración es mucho más crítico. Como los patrones están esparcidos por todo el disco en bloques de datos muy pequeños, el sistema requiere leer uno o dos clusters por cada pequeño patrón de datos a restaurar. Esto implica que con estos sistemas, el tiempo de restauración puede ser de 10 veces mayor o más con respecto a un sistema sin deduplicación. Con los sistemas basados en diferencia binaria, la información es almacenada en bloques mucho más grandes y normalmente el tiempo de restauración es similar al de un sistema sin deduplicación.
Además las tecnologías basadas en Pattern matching requieren varias semanas hasta que el proceso de deduplicación sea eficiente. Con los sistemas de deduplicación de diferencia binaria a nivel de byte la deduplicación es muy eficiente a partir del segundo backup y va mejorando a medida que se almacenan nuevos backups.
Lortu implementa un sistema de deduplicación de diferencia binaria a nivel de byte.
Agnóstico a los datos vs. content-aware:
Las tecnologías agnósticas a los datos pueden trabajar con cualquier tipo de dato o formato de fichero. El inconveniente de las tecnologías "content-aware" es que necesitan conocer el formato de los ficheros que tratan. Si el formato es diferente al esperado (por ejemplo una nueva versión de la aplicación) o si simplemente la aplicación no es soportada por la tecnología, el proceso de deduplicación no es posible.
La tecnología de deduplicación de Lortu es agnóstica a los datos. Puede deduplicar datos de cualquier tipo, formato de fichero o tipo de fichero.
[ Haga click aquí para obtener el White Paper de deduplicación de Lortu ]