
4state es el resultado de la cooperación entre el grupo de investigación en "Percepción y Aprendizaje Computacionales" de la Universitat Jaume I y 4TIC.
En el siguiente vídeo se pueden apreciar las principales características y avances que ofrece 4state sobre los sistemas de transcripción convencionales:
Actualmente se está experimentando un creciente interés por la digitalización de los materiales custodiados por las bibliotecas. Para dotar de una mayor utilidad al resultado de esta digitalización, es importante no limitarse a capturar y organizar imágenes de páginas de documentos; en su lugar, conviene enriquecer las imágenes con información que, por ejemplo, permita efectuar búsquedas por contenido en los documentos digitalizados. Por lo tanto, resulta de la mayor utilidad una herramienta que facilite la transcripción de tales documentos.
Aunque las herramientas de OCR convencionales ofrecen un rendimiento adecuado cuando se trata de documentos impresos modernos, sus elevadas tasas de error en otros contextos los descartan como una opción realista a la hora de enfrentarse a tipografía antigua o documentos manuscritos. Los documentos antiguos, aparte de presentar tipografías extrañas y palabras y sintaxis obsoletas, suelen verse afectados por muchas fuentes de ruido (humedad, manchas, agujeros, etc) que los hacen más difíciles de transcribir.