Módulo inteligente de RPA baseado em OCR e NLP desenvolvido pela SciCrop, otimizou o processo manual de cadastro de materiais da companhia, mitigando erros humanos e a duplicidade de registros, além de encurtar o tempo do processo.
Ctrl+F! Certamente você já pesquisou por alguma palavra chave dentro de um documento digital. Brincadeiras à parte, as teclas de atalho para busca de caracteres já são um grande avanço em relação ao método tradicional de leitura e comparação, entretanto, o NLP (Natural Language Processing) é a “última palavra” quando o assunto é a localização de elementos de interesse em textos digitalizados.
A técnica de IA permite através de machine learning, que algoritmos façam uma varredura em arquivos de texto de acordo com um conjunto de estruturas semânticas definidas pelo usuário (ontologia), para identificar as informações desejadas. Além de encontrar os trechos de interesse, a tecnologia ainda permite a extração, replicação, associação e resumo dos termos em questão.
A capacidade de análise textual conferida pelo NLP pode causar um impacto imenso em atividades que exigem a leitura de manuais e documentos técnicos, como por exemplo, o preenchimento de formulários e registros em softwares de gestão e ERP. Pensando exatamente em automatizar esse tipo de processo manual, ainda muito dependente de seres humanos, desenvolvemos uma prova de conceito para uma das maiores empresas de papel e celulose do Brasil, em um desafio de inovação aberta fomentado pelo Hub de IA do SENAI-PR.
O desafio: “Automatização de processo de cadastro de materiais”
A empresa enfrentava um desafio muito comum em companhias de grande porte: a necessidade de realizar o registro de todos os materiais e equipamentos adquiridos e/ou que venham a ser cotados. Tratando-se de uma organização do porte do cliente, esse número pode chegar a milhares por dia, com diversos modelos e categorias, envolvendo aparelhos para indústria, exploração agrícola, operacional, e escritório. Todo esse processo envolve sistemas legados robustos e engessados como o SAP (caso do cliente). São mais de duas mil categorias com centenas de produtos em cada uma delas, que possuem formulários específicos.
Todos estes materiais possuem especificações técnicas que precisam ser devidamente observadas para incluir em seu cadastro, e só podem ser obtidas através de manuais do fornecedor, notas técnicas e datasheets. Para dar conta de avaliar milhares de documentos com centenas de páginas, diariamente, a empresa alocava grande parte de seu capital humano nesta tarefa de baixo valor agregado.
O primeiro problema observado nesta rotina manual foi o alto tempo gasto para registro de um único material no sistema, visto que a leitura de extensos documentos técnicos era algo mandatório para captura das informações. Era necessário reduzi-lo para aproveitamento das equipes na operação de maior valor. Outro problema identificado neste fluxo de processo foi a quantidade excessiva de erros de preenchimento e duplicidade de cadastros, naturais em operações que envolvem a participação intensa de recursos humanos. Preenchimentos inadequados geravam retrabalho na gestão dos materiais, uma vez que não apresentavam todas as informações necessárias, ou estavam com inconsistências, para o controle de manutenção, vistorias, local de instalação, estoque e até mesmo novas cotações.
A Solução SciCrop: “Módulo de RPA para preenchimento automático de cadastro de materiais com uso de OCR e NLP“
Buscando a eliminação desses gargalos, apostamos em algoritmos de NLP. Essa técnica de inteligência artificial, é capaz de filtrar trechos de interesse dentro de um documento digital, pode inclusive identificar entre muitas e muitas páginas, apenas as partes necessárias para o preenchimento de formulários de registro, como por exemplo, números de série, marca de equipamentos, tamanho, cor ou outra especificação.
Entretanto, os algoritmos de NLP só podem realizar sua tarefa, se antes forem ajustadas algumas condições. A primeira delas é a existência de um banco de dados preparado para suportar grandes quantidades de arquivos técnicos e dados estruturados. Criamos, portanto, uma infraestrutura adequada a receber os datasheet técnicos e os metadados gerados a partir da digitalização destes documentos e posterior atuação dos algoritmos. Este banco de dados foi também condição essencial para possibilitar uma futura integração do módulo ao sistema SAP do cliente, com a normalização da base de materiais.
Feito isso, partimos para a definição de uma ontologia a ser obedecida pelo algoritmo. Em computação, a ontologia pode ser definida como um vocabulário condicionado a conversões sintáticas e semânticas inserido em um domínio de informações. No caso do cliente, ajustamos esses fatores a caraterísticas de datasheets em formato PDF, DOC e até mesmo fotos digitalizadas e produtos comumente utilizados pela empresa obtidos no passo anterior pelo condicionamento do histórico de registros presentes no sistema SAP.
Já com a infraestrutura adequada, realizamos a primeira etapa de treinamento do algoritmo em NLP, que é a construção de uma ontologia específica para o cenário do nosso cliente. Em computação, a ontologia pode ser definida como um vocabulário condicionado a conversões sintáticas e semânticas inserido em um domínio de informações. No caso do cliente, trabalhamos com o histórico de dados já cadastrados para classificar termos, dar sentido, e metrificar expressões técnicas encontradas em documentações disponibilizadas por fornecedores. Treinamos o modelo com diversos textos e documentos previamente obtidos com os fornecedores, até chegar em um resultado satisfatório, no qual o mesmo retornou com mais de 96% de assertividade os dados corretos a serem preenchidos nos formulários específicos do cliente.
Ainda precisávamos resolver uma etapa importante, que era a digitalização dos diversos formatos e tipos de documentos técnicos disponibilizados de forma impressa ou digital pelos fornecedores dos equipamentos e materiais. Para isso, utilizamos técnicas de machine learning por OCR (Reconhecimento Óptico de Caracteres). O modelo neste momento passou por uma fase de treinamento com diferentes tipos de arquivos, desde PDF, arquivos de textos e tabelas, até fotos das páginas. A técnica por OCR já é tecnologia dominada pela SciCrop, o que nos permitiu a rápida implementação.
Por fim, o novo fluxo de cadastramento de materiais pôde ser encapsulado em um algoritmo único, que atendeu todas as demandas do desafio. Programamos um software RPA (Robotic Process Automation), no qual incluímos a automação de todos esses modelos, seja o processo de NLP, OCR e até mesmo o cadastro integrado ao SAP. O cliente recebia agora em sua tela e poucos cliques, o preenchimento automático dos formulários. Todos esses benefícios, veremos com mais detalhes a seguir.
O Resultado: “Erros de preenchimento e duplicidade praticamente reduzidos a zero”
Os resultados positivos alcançados pelo nosso algoritmo de NLP, com mais de 90% de assertividade, garantiu a confiança do cliente no novo processo de cadastro dos materiais. O RPA conduzido por um sistema de computação, e não mais um processo manual por ser humano, reduziu quase que praticamente com todos os erros de preenchimento de campos técnicos e evitou as possibilidades de duplicidade nos registros.
Vale destacar também, que a automação de processos através de RPAs, possibilita o melhor aproveitamento dos recursos humanos. Em nosso cliente, o RPA retirou das equipes uma tarefa demorada e burocrática de baixo valor agregado, dando liberdade para o emprego do pessoal em tarefas mais criativas e produtivas. Como consequência, a empresa pode não só otimizar o cadastro dos materiais com a redução do tempo médio de registro no SAP, mas também, aumentar a produtividade com a disponibilização de mais horas produtivas de sua equipe.
São muitos os processos operacionais e manuais nas empresas. O trabalho manual deve ser valorizado e, portanto, alocado nas tarefas de maior valor agregado para aumentar a produtividade. Olhe para o lado, com certeza irá identificar algo que hoje está sendo feito de forma demorada por pessoas que poderiam estar te ajudando em alguma atividade mais importante. Deixe a burocracia e o trabalho repetitivo para os computadores. Se dá para automatizar, a SciCrop saberá como criar o RPA perfeito para sua necessidade. Fale Conosco.