Costó 2,5 millones de euros y cinco años de trabajo de un equipo de medio centenar de profesionales y más de quinientos voluntarios, pero este lunes ha llegado el momento: la base de datos goetgevonden.nl está en línea. A partir de ahora, cualquiera puede consultar las 680.000 resoluciones (decisiones) que los Estados Generales tomaron entre 1576 y 1796, el período de la revuelta contra España, la posterior Edad de Oro y la eventual desaparición de la República de los Siete Países Bajos Unidos tras la invasión. . por los ejércitos de la Revolución Francesa.
“El rápido desarrollo de la tecnología nos ha permitido hacer cosas que eran impensables hace cinco años, cuando comenzamos esta aventura”, dice el líder del proyecto Joris Oddens del Instituto Huygens de Historia y Cultura Holandesas. “Al poner a disposición esta base de datos, los Países Bajos están a la cabeza del mundo”.
Durante la época de la República, los Estados Generales formaron el máximo consejo administrativo de lo que se llamó la Generalidad, el nivel central de gobierno. Las provincias individuales enviaron representantes a La Haya para tomar decisiones que afectaban a todo el país. Oddens: “La ambición de hacer que todas las resoluciones de los Estados Generales estuvieran disponibles ya existía a principios del siglo pasado, pero solo cuando recibimos una subvención del financiador de investigación NWO en 2019 pudimos realmente comenzar”.
El nombre de la base de datos se toma de la frase ‘está bien fundamentado y comprendido’que fluía diariamente de la pluma del secretario de los Estados Generales cuando anotaba una decisión de la reunión. Todas estas resoluciones están encuadernadas en más de seiscientos gruesos libros que se guardan en el almacén del Archivo Nacional de La Haya. El primer paso del proyecto fue escanear todas las páginas de estos volúmenes. “Había alrededor de un millón”, dice Oddens. “Después de esto comenzó el trabajo difícil”.
2 por ciento de errores de lectura
Su equipo se enfrentaba a dos tipos de resoluciones, afirma Oddens. “Las decisiones del siglo XVIII estaban impresas, pero el escribano anotaba a mano las del siglo XVII. Inicialmente pensamos que la computadora sería capaz de leer esas resoluciones escritas a mano con un margen de error del 20 por ciento. Entonces en realidad no te sirve de nada. Pero, en última instancia, ahora estamos por debajo del 2 por ciento de errores de lectura en estas resoluciones, e incluso menos del 1 por ciento en las decisiones impresas”.
Ese éxito se debe en parte al trabajo de los voluntarios, afirma Oddens. “Corrigieron a mano las primeras transcripciones que había hecho la computadora. El programa aprendió de eso, lo que le permitió hacer mejor su trabajo”.
Después de leer y transcribir quedó disponible un enorme tejido de letras. Oddens: “Si quieres poder utilizarlo tendrás que dividir el texto en las partes que te interesan: las resoluciones individuales. Lo hicimos trabajando con voluntarios para buscar frases que fueran características del comienzo de una decisión tan destacada. Usamos esto para entrenar algoritmos y logramos distinguir alrededor de 680.000 resoluciones diferentes”.
Después de esto, el material podría enriquecerse, afirma Oddens. “Reconocimos todo tipo de elementos textuales en las transcripciones de las resoluciones. Hicimos esto con una técnica que ya funcionaba con textos modernos, pero aún no con material histórico”.
Según Oddens, también en este ámbito la evolución ha sido muy rápida. Hay uno ahora modelo de lenguaje grande – un programa impulsado por IA como el conocido ChatGPT – que puede funcionar con holandeses históricos. “Pedimos a los voluntarios que incluyeran nombres de lugares, personas y organizaciones en una pequeña parte del material. etiqueta. Luego, el programa se puso a trabajar para encontrar esas mismas palabras en todo el corpus. Nunca se ha hecho de esta manera en ningún lugar del mundo”.
Inteligencia artificial
El gran problema aquí fue que no hubo una ortografía general consistente durante los más de dos siglos en los que se tomaron las decisiones, dice Oddens. “A veces había docenas de formas de escribir el nombre de un lugar. Pero como investigador, naturalmente querrás encontrar todas las referencias a “Ámsterdam” cuando escribes esa palabra en la pantalla de búsqueda. Normalmente, vincular todas estas grafías se hace manualmente, pero hemos logrado hacerlo automáticamente”.
Esta combinación del trabajo manual de los voluntarios y la inteligencia artificial más moderna ha creado una enorme base de datos a la que todos pueden acceder a través de Internet. Oddens: “Para los historiadores interesados en los acontecimientos a largo plazo, ahora es posible realizar investigaciones que antes eran impensables, porque era difícil leer todos esos volúmenes página por página”.
Pero goetgevonden.nl también puede ser un tesoro para otros usuarios interesados, afirma Oddens. “Piense en las personas que investigan la historia de su familia o su lugar de residencia. Ahora pueden ver con sólo pulsar un botón si se ha dicho algo al respecto en los Estados Generales”.