¿Quiénes somos? | ¿Qué hacemos? | Clientes y colaboradores | Blog | English Castellano
Qué hacemos > Transcripción de textos antiguos
4state - Sistema multimodal de transcripción asistida de documentos antiguos
Sistema multimodal de transcripción asistida de documentos antiguos

4state es el resultado de la cooperación entre el grupo de investigación en "Percepción y Aprendizaje Computacionales" de la Universitat Jaume I y 4TIC.

En el siguiente vídeo se pueden apreciar las principales características y avances que ofrece 4state sobre los sistemas de transcripción convencionales:

1. Introducción

Actualmente se está experimentando un creciente interés por la digitalización de los materiales custodiados por las bibliotecas. Para dotar de una mayor utilidad al resultado de esta digitalización, es importante no limitarse a capturar y organizar imágenes de páginas de documentos; en su lugar, conviene enriquecer las imágenes con información que, por ejemplo, permita efectuar búsquedas por contenido en los documentos digitalizados. Por lo tanto, resulta de la mayor utilidad una herramienta que facilite la transcripción de tales documentos.

Aunque las herramientas de OCR convencionales ofrecen un rendimiento adecuado cuando se trata de documentos impresos modernos, sus elevadas tasas de error en otros contextos los descartan como una opción realista a la hora de enfrentarse a tipografía antigua o documentos manuscritos. Los documentos antiguos, aparte de presentar tipografías extrañas y palabras y sintaxis obsoletas, suelen verse afectados por muchas fuentes de ruido (humedad, manchas, agujeros, etc) que los hacen más difíciles de transcribir.

Principales características

  • Herramientas de tratamiento y análisis de la imagen
  • Variedad de reconocedores OCR específicos y automáticamente adaptables al tipo de texto manuscrito y mecanografiado
  • Entorno gráfico para facilitar la supervisión humana de las transcripciones automáticas
  • Soporte para lápiz electrónico y pantalla táctil
  • Distintos usuarios pueden transcribir a la vez
Firma digital y archivo

  • Firma digital de todas las transcripciones junto a la imagen original para garantizar su integridad
  • Integración con el repositorio Fedora Commons para almacenar toda la documentación
  • Soporte para esquemas de metadatos como Dublin Core

Descargar información comercial Descargar información comercial    Más información