Imprimir
Inicio »Noticias, Ciencia y Tecnología  »

La información digital generada en esta era será inaccesible para las generaciones futuras

| 14 |

Foto: Google

En las pocas décadas que la humanidad lleva inmersa en la era digital ha creado datos como para llenar la memoria de tantos iPad que, apilados, casi llegarían a la Luna. El ritmo de creación de información es tal que, según un estudio de la corporación EMC y la consultora IDC, se dobla cada dos años. Para antes de que acabe la década, habrá 44 zettabytes de datos (un ZB es igual a un billón de gigabytes) y el montón de tabletas habrá ido y vuelto al satélite más de tres veces. Lo paradójico es que buena parte de esa información se perderá para las generaciones futuras.

El vicepresidente de Google y uno de los padres de internet, Vinton Cerf, alertaba en una conferencia de la Asociación Estadounidense para el Avance de la Ciencia hace unos días del peligro de que lo creado por esta generación no deje apenas rastro. En la creencia de su eternidad, el homo digitalis ya no imprime fotos, las guarda en formato digital, no escribe cartas, sino que envía email, no almacena discos, sube las canciones a la nube. Una creciente parte de su vida se desarrolla en la red: juega en línea, publica selfies en Facebook y comparte sus pasiones en tuits. Pero lo digital no es tan eterno.

El deterioro de los soportes donde se almacena la información, la desaparición de los programas para interpretarla o las limitaciones impuestas por el copyright harán que, para los humanos del futuro, sea inaccesible. De hecho, ni siquiera habrá que esperar a que los arqueólogos del futuro descubran que, como decía Cerf al Financial Times, los comienzos del siglo XXI son "un agujero negro de información". Los primeros efectos de lo que los anglosajones llaman era digital oscura ya se están notando.

El caso de los disquetes ejemplifica el problema planteado por el vicepresidente de Google en toda su complejidad. Fueron el sistema de almacenamiento básico en los años 80. En ellos cabían tanto las fotos familiares como el trabajo hecho para la clase o los documentos del trabajo. La mayor parte de toda esa información ya se ha perdido. Y si aún queda algún disquete, es cuando empiezan de verdad los problemas: Habrá que encontrar una disquetera que lo lea, rezar para que los datos no se hayan corrompido por el paso del tiempo para que, probablemente, descubrir que el programa para abrir el archivo hace años que no existe.

Los disquetes de los 80 ejemplifican la complejidad y los riesgos reales de la pérdida de información

"Conservo viejos disquetes de 3,5 pulgadas que alojan archivos de texto escritos con un programa que ya no existe y que funcionaba con un Macintosh de 1986", dice el consultor tecnológico Terry Kuny. Este archivista digital canadiense fue uno de los primeros en hablar de este tiempo como una posible edad digital oscura hace ya casi 20 años. "¿Qué opciones tengo de que yo, o cualquiera, pueda acceder a esos datos hoy? Incluso si consigo una vieja disquetera, conseguir el sistema operativo y los programas no sería nada fácil en la actualidad. Y si uno no está para decirle a quien lo intente qué hay en esos discos y en qué formato está, el problema ya sería enorme", añade.

En 1997, cuando la actual era digital apenas comenzaba, cuando los ordenadores personales solo estaban al alcance de los más pudientes e internet era para una casta, cuando aún no existía Google y mucho menos Facebook o Twitter, y Microsoft dominaba el mundo con su Windows 95, Kuny, entonces asesor de la Biblioteca Nacional de Canadá dio una conferencia para la Federación Internacional de Asociaciones de Bibliotecas. Su título era premonitorio: ¿Una era digital oscura? Retos para la conservación de la información electrónica. La visión de Kuny, como la actual de Cerf, está más vigente que nunca.

"No creo que exista un riesgo de que la información de nuestro tiempo vaya a quedar inaccesible, creo que es una certeza. Ya está pasando, cada día, en todo tipo de organización, para todas las clases de datos", afirma Kuny. De hecho, cree que todo lo relacionado con la conservación digital está yendo a peor.  "Hay mucha más información nacida digital que antes y apenas hay unas pocas instituciones públicas o privadas que estén activamente implicadas en lidiar con este problema".

Enemigos de la memoria digital

El primer reto tiene que ver con la física. Cualquiera con una edad que haya intentado ver la cinta VHS con el vídeo de su boda sabe del deterioro de los soportes donde se almacenan los datos. La grabación magnética de la información ha sido la dominante en las primeras décadas de la era digital. Aún hoy, los discos duros guardan los datos jugando con la polaridad de las partículas y, por esas cosas del magnetismo, los datos acaban por perderse.

Si le pasó a la NASA, ¿por qué no iba a pasar con el vídeo de la boda? La agencia espacial estadounidense vio como buena parte de las imágenes tomadas por las sondas de la Misión Viking enviadas a Marte en los años 70 eran irrecuperables. Aunque la NASA transfirió los datos desde las cintas magnéticas originales a soportes ópticos, hasta el 20% del material no se pudo recuperar. El caso de las sondas Viking ilustra otro de los peligros de que este tiempo se convierta en una edad digital oscura. El 80% de la información enviada desde Marte se pudo salvar, pero se guardó en un formato y con unos programas que ya no existen. Solo hace un par de años, una empresa canadiense pudo volver a extraer las imágenes. Hay formatos que parecen que van a durar toda la vida y después de ella. Es el caso de las imágenes guardadas en formato JPEG o la música en mp3. Pero ¿y si aparece un nuevo formato mejor y los anteriores caen en desuso?

Solo en 2014 la industria ha cerrado los servidores para jugar en línea a 65 juegos

Y es que confiar la preservación de los datos a la buena fe de las compañías que los crean tiene sus peligros. Como denunció el mes pasado la Fundación Fronteras Electrónicas (EFF, por sus siglas en inglés) gigantes de los juegos como Electronic Arts cierran los servidores para jugar en línea con sus títulos en apenas un año y medio si el juego no ha tenido el éxito que esperaban. Solo en 2014, la industria abandonó 65 juegos. Pero, al mismo tiempo, las leyes de copyright impiden que los jugadores mantengan sus propios servidores.

Pero el mayor riesgo de que la información de este tiempo desaparezca en el futuro está en internet. Como muestra el estudio de IDC sobre el universo digital de 2014, la mayor parte de los datos son alojados en la red. Desde los millones de selfies hasta cada minuto de vídeo subido a YouTube, pasando por los comentarios en Facebook, cada vez más, la mayor parte de la vida de una persona se encuentra en algún servidor de alguna empresa y no ya en su álbum familiar de fotografías.

El 20% de los mensajes en Twitter ya han desaparecido

Se supone que ni Google ni Facebook van a cerrar mañana. Incluso cuando cierran algún servicio, como hizo el buscador con Wave, dan un tiempo razonable para que sus usuarios se descarguen todo lo que allí tenían. Google, por ejemplo, cuenta con Takeout, un sencillo sistema para hacer una copia de todos los datos creados y alojados en sus servicios. Pero no siempre es así.

A comienzos de la década pasada, había una red social mucho más importante y conocida que Facebook. Se llamaba Friendster y en su mejor momento llegó a tener 100 millones de usuarios. Sin embargo, errores propios y la popularidad de otras alternativas, hicieron que Friendster se hundiera y, con ella, todas las historias, conversaciones, amores y momentos que compartieron sus usuarios. Hoy, la empresa languidece como plataforma de juegos en el sudeste asiático.

"Tuvimos mucha suerte de que Internet Archive reaccionara a tiempo y capturara una copia de toda la información pública en Friendster justo antes de que la desactivaran", comenta el experto en redes sociales de la de la Escuela Técnica Federal de Zúrich (ETH), el español David García. La relevancia que tienen las redes sociales en la vida de hoy, las ha convertido para los científicos sociales en herramientas fundamentales para estudiar las sociedades humanas. Solo esa copia ha servido a García y otros investigadores estudiar fenómenos sociales que afectan a la privacidad, por ejemplo.

Uno de esos investigadores sociales es Alan Mislove, de la Universidad Northeastern (EE UU). Mislove ha estudiado a fondo Twitter. En un artículo publicado el año pasado, comprobó que casi el 20% de los tuits publicados en esta red social se habían esfumado. "Es difícil proyectar que pasará con los tuits perdidos en el futuro", aclara. Para Mislove, "los datos de sitios como Twitter y Facebook ofrecen a los investigadores una capacidad sin precedentes para estudiar la sociedad a una escala y granularidad que simplemente eran imposibles antes".

Luces contra la edad digital oscura

Si existen tantos riesgos, ¿qué se está haciendo para afrontarlos? Las soluciones son tanto tecnológicas como organizativas y hasta legislativas. Lo más urgente parece ser el problema de la longevidad de los datos, cómo conservarlos para los que vengan después.

Las tecnologías de almacenamiento no han variado mucho en todo este tiempo. O se graba la información en soportes magnéticos o, con la ayuda del láser, en discos ópticos. Aunque pudiera parecer que el DVD o el Blu-ray son las mejores alternativas, el futuro seguirá siendo magnético.

"La primavera pasada, IBM y FUJIFILM lograron una densidad de almacenamiento sobre cinta de 85,9 gigabytes por pulgada cuadrada lo que permitiría una capacidad de 154 terabytes [un terabyte son 1.000 gigabytes] en un cartucho que cabe en la palma de la mano. Eso es el texto de 154 millones de libros", recuerda el responsable de tecnologías avanzadas de cinta de IBM Research, Mark Lantz.

Quizá por eso de que IBM es la única empresa tecnológica con más de un siglo de vida, saben de la importancia de la preservación de los datos. Para Lantz, la cinta magnética no está muerta ni muchos menos. "En nuestro laboratorio de Zúrich estamos trabajando sobre una tecnología de cinta para la preservación de los datos a largo plazo", asegura. Con el mantenimiento y conservación adecuados, la grabación en soportes magnéticos mantiene la información intacta durante décadas.

Otra cuestión es la de poder reproducirlos con el paso del tiempo. Ese es el mayor temor que expresó Vinton Cerf en su conferencia. Sin las herramientas adecuadas que den contexto a los datos, aunque se conservaran, estos serían ilegibles. Cerf mencionó como solución un proyecto en el que también participa IBM. El gigante informático, junto a la universidad Carnegie Mellon tiene en marcha el proyecto Olive. Su objetivo es crear una especie de imágenes que incluyan todo, los datos del archivo, el programa con el que se creó y hasta el código. Por medio de máquinas virtuales, el contenido se podría ejecutar en cualquier sistema que apareciera en el futuro.

A iniciativas como esta ayudaría lo que está pidiendo la EFF a las autoridades de EEUU: que en la legislación sobre copyright se incluya una excepción que obligue a las empresas que crearon un programa o un juego a liberar su código cuando lo abandonen o, al menos, permitir su obtención mediante ingeniería inversa.

"Todos nosotros debemos convertirnos en nuestros propios bibliotecarios", dice el archivista digital Terry Kuny

Pero el mayor reto es conservar toda la información acumulada en algo tan grande y dinámico como es la web. Internet Archive es el mayor intento que hay para conservar la memoria de la red. Los robots de esta organización rastrean periódicamente la web haciendo copias de las páginas que encuentra y las van guardando. Así, si alguna página desaparece, siempre habrá la posibilidad de recordar como fue.

En España, la Biblioteca Nacional ha venido haciendo lo mismo con la ayuda de Internet Archive desde hace años. Pero el año pasado fue el primero que, con su propio robot, empezaron a escanear la red española. Ya han copiado 140 terabytes entre recursos, páginas web, blogs... Sin embargo, La BNE está a la espera de la aprobación de un reglamento sobre el depósito legal de publicaciones electrónicas que le permita conservar todo lo que la tecnología permita de la internet en español.

Pero evitar que esta sea una edad digital oscura es cosa de cada uno. "Todos nosotros debemos convertirnos en nuestros propios bibliotecarios. Cada uno deber ser el responsable de su vida digital. No podremos salvarlo todo y las cosas que decidamos salvar, deberemos hacerlo con cuidado", alerta Terry Kuny, el mismo que ya lo hacía hace 20 años, mucho antes que Vinton Cerf.

(Tomado de El país)

Se han publicado 14 comentarios



Este sitio se reserva el derecho de la publicación de los comentarios. No se harán visibles aquellos que sean denigrantes, ofensivos, difamatorios, que estén fuera de contexto o atenten contra la dignidad de una persona o grupo social. Recomendamos brevedad en sus planteamientos.

  • Carlos Parra Zaldivar dijo:

    Muy interesante el artículo, encierra una verdad irrefutable. El tema de poder acceder o no a la información que se pueda guardar para las futuras generaciones se mueve también en el campo de las aplicaciones, como bien lo dice el artículo, y es que las aplicaciones cambian y por tanto impiden la lectura de viejos formatos. Es por eso que otro tema que también se defiende en estos momentos es el uso de estándares abiertos, que le da la posibilidad al dueño de la información poder acceder a sus documentos en cualquier aplicación que respete esos estándares, y en el caso de documentos ofimáticos está aprobado por la ISO el formato ODF (Open Document Format).

    El próximo 25 de marzo se celebra internacionalmente el "Día del Documento Libre", así que asumamos esos formatos para también preservar nuestros datos para futuras generaciones, eso formaría parte también de la base de nuestra independencia tecnológica.

    Saludos

    Carlos Parra Zaldivar

    • yosjan dijo:

      Carlos, buena publicidad para Libre/Open office, que lo utilice el que no lo conozca. Por lo demás decir que me ha gustado mucho este artículo. Ya ven que El País también publica muy buenas cosas. No pensaba que sería de este modo o a tal escala la pérdida, pero es verdad que cada formato y software ha dejado en el olvido a los que triunfaron en otras épocas. Muy de acuerdo con lo que se expone, no con Carlos, .doc también ha subsistido desde la aparición de Microsoft Office, por solo citar un ejemplo. No creo que sea el .odt lo único que salve la información.

  • Susaku38 dijo:

    por favor, aqui en Cuba pasa lo mismo...cuantos mensajes y recuerdos he perdido yo por la constante caida de todo foro o red social que aparece en al red cubana...cuantas veces se han reiniciado bases de datos completas, con cuantos amigos he perdido el contacto porque simplemente en el momento menos imaginado encuentras el error mas temido de los sitios... [404 not found]...creo que deberiamos llamar a la red.cu la 404...asi es mas adecuada a su funcionamiento...

  • Joan dijo:

    Se parece a la opinión de que los siboneyes tenían WiFi... ni piedras, ni cables ni fibras han dejado detrás.

  • Agua por todas partes dijo:

    En una era donde el conocimiento se duplica cada dos años la Aduana General de la Republica de Cuba solo permite importar al país 5 memorias flash y un disco externo...el mundo tendrá un hueco negro informacional...nosotros no, por suerte no nos entra la información...asumo el hueco será en otra parte...
    Ps: No hablo del acceso a internet para no extenderme..y porque....mmm..ya no sé SI vale la pena.

  • Aroldo dijo:

    Excelente artículo.

  • adolfo tapia dijo:

    todo esto suena tremendista ............. SIN FE en el futuro ......... por ultimo ....... ¿cuales datos son tan "preciosos" para conservarlos ETERNAMENTE???

    lo positivo son las CONSECUENCIAS de la revolucion informatica: creacion de la CONCIENCIA COLECTIVA como una realidad tangible .....

    saludos desde el peru

    • Jonesk dijo:

      Estoy de acuerdo con adolfo tapia. La mayoría de la información generada en internet no tiene que ser guardada. Piense usted en todo lo que se pierde de información en el mundo real, y verás que olvidar es parte de la vida. No hay que guardar todo ni hacer esfuerzo para lograrlo, pues nuestro cerebro guarda todo lo importante para nosotros. Tener gigabytes de datos guardados en discos duros o en lo que sea, y no utilizarlos para nada, es lo mismo que no tener estos datos.

      • Emilio Suárez dijo:

        Adolfo Tapia, te respondo que la "fe en el futuro" me parece algo muy iluso, inconsciente, lo que hace falta no es fe en el futuro sino responsabilidad con el presente. Soy estudiante de Ciencias de la Información, y desde la perspectia de mi carrera te digo que no hay información que no sea valiosa, todo depende de quien, la use, para qué y el conocimiento de esa persona sobre la información que manipula. Perder toda esa información podría traer muy malas consecuencias a todos los que pensaron que no la necesitarían

    • Jonesk dijo:

      Estoy de acuerdo con adolfo tapia. La mayoría de la información generada en internet no tiene que ser guardada. Piense usted en todo lo que se pierde de información en el mundo real, y verás que olvidar es parte de la vida. No hay que guardar todo ni hacer esfuerzo para lograrlo, pues nuestro cerebro guarda todo lo importante para nosotros. Tener gigabytes de datos guardados en discos duros o en lo que sea, y no utilizarlos para nada, es lo mismo que no tener estos datos. Saludos desde Brasil

  • Yunier de la Isla dijo:

    La era de la Evolución ; muy interesante el articulo y totalmente cierto lo q se comentan, ya se vive o ya esta sucediendo desde hace unos años atras. Espero q de veras se invente algo para q nuestras huellas queden plasmadas para otros. :-)

  • M&M dijo:

    todo esto tiene un nombre: obsolecencia digital
    el asunto es mantener los datos pasandolos de un soporte a otro segun van cambiando
    lo de los programas y equipos, todo radica en dejar constancia de como estan estructurados los formatos y como funcionan los equipos que los leen
    por ejemplo, mencionan el JPEG, eso no "desaparecerá", pues primero debe desaparecer todo lo escrito y descrito al respecto y en buena medida es matematica la que lo hace funcionar, y esta no desaparece

    • Alex90 dijo:

      Creo que es real que la informacion digital al paso de los años puede perderse y hacerse irrecuperable; a cuantos de nosotros se nos ha roto un disco duro y con ello toda su valiosa información ? lo que cada cual debe valorar que es importante para si y valorar si es necesario guardar esa información en otro formato que no sea digital.

  • Fernando dijo:

    Todavía echan humo las chimeneas de los libros quemados a los largo de la historia. Aquí en Europa están destruyento todo los relacionado con el socialismo real y en la RDA borran toda huella a socialismo comenzando por destruir el Palacio de Cultura del pueblo. Los Nazis directamente quemanban los libros. El papel es frágil y recuerdo como perdimos mucha de la biblioteca familiar por una inundación. Agua y fuego vencen al papel, pero la cultura ha seguido imparable.

Se han publicado 14 comentarios



Este sitio se reserva el derecho de la publicación de los comentarios. No se harán visibles aquellos que sean denigrantes, ofensivos, difamatorios, que estén fuera de contexto o atenten contra la dignidad de una persona o grupo social. Recomendamos brevedad en sus planteamientos.

Vea también