Cerrar panel

Cerrar panel

Cerrar panel

Cerrar panel

Agenda 18 may 2017

Evento: Análisis Automático de Imágenes de Documentos Bancarios

De 10:00h a 12:00h

Centro de Innovación BBVA

Eventos

El análisis automático de imágenes de documentos es una tarea compleja y que presenta un gran interés tanto científico como comercial. En particular, a partir de una imagen escaneada de un documento, se pueden extraer ciertas características que identifican a dicho documento y a su contenido. Una primera parte del análisis consiste en la detección del tipo de documento, la complejidad del problema varia según la estructura. Así, en documentos estructurados, como los formularios, el problema está resuelto. En documentos semi-estructurados, como las facturas o los contratos, el problema empieza a tener soluciones factibles. Finalmente, en documento no estructurados, como son las cartas, el problema continúa en el ámbito de la investigación. Otra parte del análisis corresponde al propio texto contenido en el documento, que puede ser manuscrito y mecanografiado.

En la charla abordaremos las soluciones existentes para el problema mecanografiado. Por otro lado, la variabilidad inter-personal e intra-personal en la escritura manuscrita es un factor que dificulta en gran medida la solución a este último problema. En los últimos años, el desarrollo de soluciones de aprendizaje automático, en particular el aprendizaje mediante redes neuronales profundas (deep neural networks) ha abierto la puerta a la resolución efectiva de problemas asociados al reconocimiento automático de texto manuscrito. Además, la extracción de información válida de los documentos, así como la generación de resúmenes automáticos de los mismos es también un tema actual de interés. En esta charla se motivará la complejidad de estos problemas mencionados y las soluciones principales propuestas actualmente para los mismos. Esta presentación se centrará principalmente en los documentos bancarios (p.ej. cheques, contratos, formularios...), donde aparecen simultáneamente ciertos elementos como logos, texto manuscrito, texto impreso, firmas, etc., que dificultan el análisis de los problemas asociados. Apúntate aquí.