Un paso más allá de los OCR

Comunicación

20 diciembre - 4 min lectura

Reexdoc o cómo extraer el valor de la información de una empresa gracias a la IA

La transformación eficiente de los procesos en las empresas y, sobre todo, la gestión de los datos en lo que respecta a la identificación y extracción de los mismos en distintos tipos de documentos, se presenta como uno de los grandes desafíos a los que la automatización debe dar respuesta. Inteligencia Artificial, RPA y Machine Learning se unen para permitir una gestión de la información más ágil, segura y sencilla.

 

Facturas, hojas de pedido, albaranes, partes médicos, días de vacaciones, horas de trabajo… Datos, datos y más datos.

La información que, día a día, genera la actividad de cualquier empresa y, con ella las necesidades de extraerla y gestionarla de forma correcta, no deja de crecer.

Concretamente y según los resultados del tercer estudio Global Data Protection Index que realiza Dell, desde 2016 el volumen de datos que manejan las compañías ha crecido un 569%.

Junto a su almacenamiento, gestionarlos de forma correcta, pudiendo extraer la información que precisamos, con seguridad y sencillez, son algunos de los desafíos a los que se enfrentan las compañías..

Un reto en el que, afortunadamente, la Inteligencia Artificial y la Automatización Robótica de Procesos (RPA) se presentan como el aliado perfecto.

Así, IDC Research España ya prevé que la inversión en automatización de procesos en Europa alcance los 1.229 millones de euros en 2022.

Una de sus aplicaciones, sin duda, es la gestión y el análisis de datos, donde, desde la consultora, explican la RPA de ofrece ventajas consistentes como eficiencia operativa y reducción de costes.

 

Más allá del OCR

Hasta ahora, una de las tecnologías más extendidas para facilitar la recogida y extracción de datos, es el Reconocimiento Óptico de Caracteres (OCR, por sus siglas en inglés), una solución que permite convertir diferentes tipos de documentos, como documentos en papel escaneados, archivos PDF o imágenes captadas por una cámara, entre otros, en documentos cuyos datos son editables y con opción de búsqueda e indexación.

Esta tecnología se utiliza para escanear y reconocer caracteres e, incluso, códigos de barras en cualquier tipo de documento (albaranes, formularios, facturas, etc).

Pero, ¿qué ocurre cuándo la calidad de esos documentos no es la óptima o incluye texto manuscrito o tipografías poco comunes? ¿Cómo extraer información de documentos dispares, con campos de texto distintos y dotar de coherencia la selección de la información que precisamos?

La unión de Inteligencia Artificial y Automatización Robótica de Procesos (RPA) es la respuesta.

Una suma de tecnologías que da como resultado Reexdoc, una herramienta para el reconocimiento y extracción automatizada de datos de documentos semiestructurados con técnicas de Inteligencia Artificial que mejora la fiabilidad de los OCRs avanzados.

Datos encasillados letra por letra, firmas sobre el texto, documentos rotados o con cierta inclinación, tipologías de letras diferentes, etc. Esta tecnología resuelve estos casos de forma satisfactoria a diferencia de los motores de OCR existentes.

Basada en modelos de Inteligencia Artificial, esta solución permite el reconocimiento y extracción de información con una precisión muy elevada y preparada para su integración en sistemas Legacy, ERPs, CRMs, procesos RPA, etc. para facilitar la automatización de los procesos extremo a extremo.

 

Sus principales características y que la sitúan un paso más allá de los OCR tradicionales son:

  • Soporta varios tipos de documentos (facturas, albaranes, partes médicos, etc.) con la posibilidad de extender y ampliar a nuevos tipos de forma sencilla.
  • Utiliza machine learning para identificar el campo y la extracción de los datos.
  • Ofrece una fiabilidad aproximada del 90%.
  • Utiliza modelos entrenados por etiqueta asociados a cada tipo de documento.
  • Permite la extracción de campos principales, con la posibilidad de incorporar nuevos personalizados.
  • Es una solución segura (no almacena documentos).
  • Mejora la precisión al realizar la optimización del documento antes del procesado.
  • Construida sobre tecnología open source, lo que reduce el coste del licenciamiento y la implantación.
  • Con plugins específicos para el cliente.
  • Se integra con herramientas de RPA u otras aplicaciones mediante API.
  • No está basada en plantillas de documentos, lo que aporta gran escalabilidad y flexibilidad.
  • Apta para su despliegue e implementación en modelos cloud y on-premise.

 

Más agilidad, menores errores

Si aterrizamos las funcionalidades de Reexdoc en el día a día de una empresa, una de sus aplicaciones clave sería la extracción de datos de facturas de proveedores o pedidos de clientes para insertarlos en el sistema ERP de la compañía.

En este caso, las personas que realizan este proceso en una empresa, generalmente, reciben por email, correo ordinario, etc. cientos de facturas de sus proveedores, en miles de formatos y tipos distintos.

Normalmente, estas personas, a día de hoy, deben recoger estos ficheros, imprimirlos y, tras ello, introducir todos los datos de esos documentos en su sistema ERP, en muchos casos copiando y pegando la información o, en el peor de los escenarios, volviendo a «teclear» todos los datos desde un papel físico.

Reexdoc facilita la recogida de datos del documento, actuando como los ojos de la persona que lee la información y extrae los datos importantes y necesarios y, tras ello, se los envía a un robot RPA que es quien ya las introduce en el sistema ERP.

Otro ámbito especialmente indicado para la aplicación de Reexdoc es la recepción y gestión de partes médicos.

Los partes médicos de la Seguridad Social de alta/baja de empleado hay que registrarlos en las aplicaciones de RRHH de cada compañía y, en ese proceso, los profesionales al cargo se enfrentan a documentos que tienen diferentes formatos según la Comunidad Autónoma que lo emite.

Al igual que en el caso anterior, esta herramienta permite extraer la información importante de los partes médicos de forma automática para que un robot lo introduzca en la aplicación.

Una tecnología que ofrece importantes beneficios: Transformación eficiente de  los procesos (en muchos casos eliminando el papel), reducción de errores (gracias a la Inteligencia Artificial, el Machine Learning y la automatización robótica), procesos más ágiles (la herramienta es más rápida que cualquier persona y además soporta varios tipos de documentos a la vez), y con ello, más económicos pero, sobre todo, la capacidad de liberar tiempo de los empleados que pueden así dedicarse a tareas de mayor valor.

Un pilar en la transformación de procesos de las compañías que les aporta una mayor eficiencia y agilidad, situándoles en los niveles de competitividad que marcan la diferencia.