Los archivos duplicados causan errores y pérdida de tiempo

Shares

Los buenos informáticos odian duplicar archivos o datos. La única excepción es cuando se trata de copias de seguridad. Duplicar archivos y en general los datos creará siempre y a la larga un montón de problemas.

duplicate-content

En informática a la duplicidad de las cosas se la denomina Redundancia, es cuando por ejemplo puedes tener dos discos en tu ordenador, uno es el principal y el otro posee un sistema que permite mantener una copia del principal, a esto se le llama discos redundantes o espejo. Esto es otro ejemplo donde mantener duplicados no es negativo, se usa para evitar perder la información cuando el disco principal se rompe, lo podemos considerar como una copia de seguridad en permanente actualización.

duplicadosEste artículo no queremos hablar de copias de seguridad. Estas copias de archivos se realizan para recurrir a ellas sólo en caso de catástrofe o de un borrado accidental de los datos. Podemos decir que son copias para archivar, sin que exista ninguna intención de usar esos archivos en el día a día.

Las copias perniciosas son aquellas que duplican la información sin que su objetivo sea el archivado, es decir, son archivos que pretendemos usar en un corto intervalo de tiempo. Ocurre mucho con aquellos que usan un pen-drive para transportar archivos de un ordenador a otro, tarde o temprano vienen los problemas. Termina ocurriendo que no se sabe bien cual es la última versión del archivo y al final se tienen  hasta varias copias de diferentes modificaciones del mismo archivo.

Existe una ley que dice que “La redundancia genera inconsistencia”. Cualquier alumno de informática de cualquier universidad del mundo conoce esta ley universal promulgada por el que se considera el padre de las bases de datos, el célebre Dr. Edgar Frank Codd .

Esta ley es muy sencilla de entender y al final se refiere al simple hecho de que si tienes una cosa repetida en varios sitios, es muy posible que en alguno de ellos esa cosa cambie y ya no sea igual en todos los sitios.

Cuando hablamos de redundancia de archivos, nos referimos a la existencia de copias de un mismo archivo en diferentes lugares. La inconsistencia es el efecto de que la información sobre una cosa no sea la misma en varios sitios. Lo peor de esto es no saber que información es la correcta.

Imagina que guardas las direcciones  de tus amigos en un archivo “direcciones.xlsx”, este archivo lo tienes en tu portátil y en tu ordenador de sobremesa. Un buen día, un amigo te llama y te comenta que se ha mudado, entonces como estás con tu portátil, vas y cambias su dirección en el archivo. Aquí tenemos un caso de Inconsistencia, la dirección de nuestro amigo es diferente en dos sitios, ha cambiado en el portátil pero no en el de sobremesa, pasado un tiempo puede que no recordemos cuál es la verdadera, la redundancia ha generado inconsistencia.

free-from-duplicate-filesLos pioneros de la incipiente ciencia de la computación no tardaron en atisbar los problemas que conllevaría la facilidad en copiar archivos. Podría ser un grave problema tener un mismo archivo copiado en diferentes lugares sin saber cuál era el correcto.

Cuando aparecieron las redes surgió de inmediato la solución al problema. Como las redes permitían compartir recursos tales como una impresora, por qué no hacer que los archivos estén en un lugar único y central de la red. Esto funcionaría siempre que los usuarios fuesen cuidadosos y mantuviesen actulizado el repositorio de archivos. En las empresas no habría que aplicar técnicas especiales, bastaría con emplear los mismos criterios que, como por ejemplo, las cajas registradoras de un comercio, todas actualizarían las cuentas de una caja central. Las redes dieron lugar a las bases de datos centrales para aumentar la eficiencia y eliminar la Inconsistencia de los datos.

El paradigma ahora es el mantener un repositorio central pero en la Nube, un repositorio accesible desde cualquier lugar de forma segura y controlada. Existen varias formas de hacerlo pero ya sabemos que los sistemas que se basan en sincronizaciones de archivos generan redundancia. El futuro será de aquellos sistemas que eviten la duplicidad de la información.

Shares

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *