Reparar, recuperar y revelar: los archivos de las dictaduras de América Latina renacen con ayuda de la inteligencia artificial
Una vez identificadas las secciones, otro algoritmo se encargó de clasificarlas, diferenciando, por ejemplo, entre los apellidos paterno y materno de las víctimas. Además, a través de este algoritmo, se identificó la nacionalidad de las personas, así como estado civil, domicilio, ocupación y otras características.
Finalmente, usaron distintas herramientas de reconocimiento óptico de caracteres (OCR), que ayudan a transcribir documentos impresos a un formato más similar al de los documentos de texto de Word. El programa que tuvo un mayor nivel de éxito en transcribir correctamente las fichas fue el software de código abierto Calamari. Sin embargo, los mejores resultados se obtuvieron después de que Mateo y sus colegas hicieran ajustes para que la herramienta se adaptara mejor al tipo de caracteres que estaba leyendo.
Durante cada etapa de la metodología, Mateo hizo pruebas con tal de medir la efectividad de las distintas herramientas. Para ello, él y su equipo iban tomando muestras de los rollos de microfilm y cotejaron cuánta información se extraía correctamente a través de la cadena de algoritmos.
Al evaluar la identificación de secciones de fichas, el nivel de éxito fue del 95%. La clasificación de secciones tuvo el mismo porcentaje de precisión global. El reconocimiento de caracteres tuvo más errores antes de recibir entrenamiento por parte del equipo de investigación. Sin embargo, tras las correcciones, el nivel de éxito aumentó considerablemente. De una muestra de 99 documentos, Calamari hizo 89 transcripciones correctas, sin embargo, tras la corrección y ajustes, el número aumentó a 95.
Después de todo ese trabajo, Mateo obtuvo su grado de maestría. Por su parte, las personas interesadas en revisar los documentos de la OCOA, como Ignacio Errandonea, recibieron un buscador que les ahorrará horas de revisión manual de documentos.
La tecnología al servicio del archivo en América Latina
El trabajo de Mateo no es el único de su tipo. En la Universidad de la República compañeros suyos han estado trabajando en otros aspectos de los archivos de la dictadura como parte del proyeto Cruzar, una iniciativa lanzada en 2018, en que docentes y alumnos de las facultades de Información y Comunicación, por un lado, y la de Ingeniería, por otro, se unieron en la tarea de sistematizar la información de los archivos de la dictadura.
Un ejemplo de estos esfuerzos lo ofrece Gregory Randall, profesor de la Facultad de Ingeniería y asesor de Mateo. Alumnos suyos desarrollaron una herramienta para reconocer los distintos sellos con los que las fuerzas represivas timbraban sus documentos, de tal forma que, con identificar la estampa, pueden saber de qué organismo provino una hoja.
El caso de Argentina
Fuera de Uruguay, también existen proyectos similares que buscan aprovechar la tecnología para el análisis de archivos de las dictaduras. Una de las alianzas con más trayectoria es la del Archivo Provincial de la Memoria con la Universidad Nacional de Córdoba (UNC), en Argentina.
Share this content:
Publicar comentario