Sistema de inspeção de etiquetas por visão computacional e aprendizado profundo na indústria 4.0
Arquivos
Data
2023-04-03
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade do Estado do Amazonas
Resumo
A inspeção de produto é um passo essencial nos processos de fabricação para garantir a
qualidade do produto final. Tradicionalmente, essa inspeção era feita manualmente por operadores humanos, o que é demorado, caro e pode levar a erros devido à subjetividade e fadiga humana.
Nos últimos anos, a maior parte dos processos visuais em uma fábrica estão sendo substituídos
por técnicas de visão computacional. Com os avanços das abordagens de aprendizado profundo,
o reconhecimento óptico de caracteres e reconhecimento de objetos são tecnologias que podem
ser utilizadas em diferentes cenários. Neste estudo, desenvolveu-se uma metodologia capaz de
extrair informações textuais e não textuais aplicados a etiquetas de modems. O método proposto
é composto dos seguintes componentes: dois detectores de objetos que fazem a detecção da
etiqueta e detecção simultânea de QR code e barcode, ambos utilizando YOLOv5; um decodificador de conteúdo para QR code e barcode, utilizando Zbar; um sistema de OCR utilizando
PaddleOCR; e um conjunto de regras aplicadas ao pós processamento da informação. Para isso,
foram criados três datasets, o primeiro contendo imagens de etiquetas em modems para treinar
o modelo de detecção de etiquetas, o segundo contendo uma mistura de imagens de etiqueta
e ambientes diversos que contêm QR code e barcode para gerar o modelo de detecção de QR
code e barcode, e uma base de ground-truth contendo as imagens de etiquetas de modem com as
respectivas saídas esperadas do sistema. O sistema proposto foi avaliado com diferentes modelos
de etiqueta, e a execução dela foi feito numa CPU. A leitura das etiquetas alcançou valores
médios de 0,21% de Character Error Rate, 2,16% de Field Error Rate, Acurácia por etiqueta de
76,19% e tempo de execução de 2,79 segundos para o primeiro modelo, e 0,04% de Character
Error Rate, 0,62% de Field Error Rate, Acurácia por etiqueta de 92,50% e tempo de execução de
1,73 segundos. Resultados experimentais mostram que a solução desenvolvida pode ser utilizado
em produção com altas taxas de acerto, e com tempo de execução significativamente melhores
que um operador humano.
Descrição
Palavras-chave
Etiqueta, Deep Learning, Reconhecimento óptico de caracteres, Detecção de objetos, YOLO, PaddleOCR, Indústria 4.0, Sticker, Optical character recognition, Object detection, Industry 4.0