Los diferentes tipos de documentos y el reconocimiento avanzado de datos

Los diferentes tipos de documentos y el reconocimiento avanzado de datos

Las soluciones de clasificación inteligente de documentos tienen que ser capaces de encontrar la información independientemente de los diferentes tipos de documentos que se vayan a gestionar dentro de la organización.

Documentos estructurados: Los documentos tienen la misma estructura o patrón, como por ejemplo pedidos de venta, partes de trabajo, notas de gastos, formularios, encuestas, etc.

Documentos semi-estructurados: Los documentos tienen una estructura o patrón similares, como por ejemplo facturas, pedidos de compra, confirmaciones de pedidos de venta, etc.

Documentos no estructurados: Los documentos no tienen ninguna estructura ni patrón parecido, como por ejemplo catálogos, presupuestos, ofertas, expedientes, proyectos, documentación técnica, escrituras, poderes, normas y procedimientos, etc.

Hay que tener en cuenta que, en el caso de los documentos estructurados, la información se encuentra siempre en el mismo sitio dentro del documento. En el caso de los documentos semi-estructurados o no estructurados, la información se puede encontrar por palabras o datos clave que se repiten en el documento.

Los diferentes tipos de documentos

 

¿En qué consiste el reconocimiento avanzado de datos de una solución tecnológica de clasificación inteligente de documentos?

Los diferentes tipos de documentos tienen que ser capturados, clasificados, procesados y validados antes de ser entregados a su destino dentro de la organización.

  1. Captura: Todos aquellos documentos que se vayan a gestionar tienen que ser capturados. Los documentos en papel tienen que ser digitalizados de forma manual mediante un escáner, utilizando soluciones de código de barras en caso de una digitalización masiva de documentos. Los documentos en formato digital pueden ser capturados mediante un proceso automatizado. Las imágenes en formato digital pueden ser incluso tratadas para mejorar su calidad y facilitar el proceso de reconocimiento posterior.
  2. Clasificación: Una vez capturados los documentos es necesario realizar una clasificación inteligente, antes de procesarlos y reconocer la información que es necesario obtener de los mismos. Los documentos tienen que ser clasificados por tipo, para después identificar aquellos campos dentro del documento de los cuáles hay que extraer la información. Las soluciones tecnológicas más avanzadas utilizan motores de auto-aprendizaje que combinan modelos o plantillas predefinidas, patrones dinámicos o reglas basadas en guiones y palabras clave.
  3. Proceso: Para reconocer con precisión la información contenida en cada uno de los campos de un documento se aplican las tecnologías de reconocimiento de caracteres. Las soluciones tecnológicas más avanzadas utilizan múltiples motores de reconocimiento óptico de caracteres impresos (OCR), reconocimiento inteligente de caracteres escritos a mano (ICR) y reconocimiento óptico de marcas y círculos (OMR), con diferentes métodos de votación, para conseguir una mayor precisión.
  4. Validación: Toda aquella información que haya sido rechazada por el sistema debido a alguna duda de interpretación, un campo irreconocible, un fallo de validación, etc, se mostrará a una persona para que la resuelva de forma manual.
  5. Flujo de aprobación: Adicionalmente al proceso de validación puede incluirse un flujo de aprobación que tenga que ser realizado internamente dentro de la organización, antes de entregar la información en el destino, para cualquier información recabada por el sistema o sólo ante determinadas excepciones que se programen.
  6. Entrega: Una vez completado el flujo de aprobación se entregará la información aprobada en el sistema corporativo de destino de forma automatizada (ERP, software contable, sistema de gestión documental, CRM, etc).
  7. Aprendizaje: Las soluciones tecnológicas más avanzadas aplican técnicas de inteligencia artificial y estadísticas para el aprendizaje de los diferentes tipos documentales que gestionan.

 

¿Que añadirías para completar el proceso de reconocimiento avanzado de datos de una solución de clasificación inteligente de documentos?

 

© Imagen superior publicada por Stuart Miles en freedigitalphotos.net bajo licencia estándar

0 comentarios

Dejar un comentario

¿Quieres unirte a la conversación?

Los comentarios de este blog están moderados y no aparecerán inmediatamente en la página al ser enviados. Evita, por favor, las descalificaciones personales, los comentarios maleducados, los ataques directos o ridiculizaciones personales, o los calificativos insultantes de cualquier tipo, sean dirigidos al autor del post o a cualquier otro comentarista. Estás en tu perfecto derecho de comentar anónimamente, pero no utilices el anonimato para decirles a las personas cosas que no les dirías en caso de tenerlas delante. Intenta mantener un ambiente agradable en el que las personas puedan comentar sin temor a sentirse insultados o descalificados. No comentes de manera repetitiva sobre un mismo tema, y mucho menos con varias identidades (astroturfing) o suplantando a otros comentaristas. Los comentarios que incumplan esas normas básicas serán eliminados.

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *
Gracias por tu participación.
Feel free to contribute!

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *