Sistema de inspeção de etiquetas por visão computacional e aprendizado profundo na indústria 4.0

Imagem de Miniatura

Data

2023-04-03

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade do Estado do Amazonas

Resumo

A inspeção de produto é um passo essencial nos processos de fabricação para garantir a qualidade do produto final. Tradicionalmente, essa inspeção era feita manualmente por operadores humanos, o que é demorado, caro e pode levar a erros devido à subjetividade e fadiga humana. Nos últimos anos, a maior parte dos processos visuais em uma fábrica estão sendo substituídos por técnicas de visão computacional. Com os avanços das abordagens de aprendizado profundo, o reconhecimento óptico de caracteres e reconhecimento de objetos são tecnologias que podem ser utilizadas em diferentes cenários. Neste estudo, desenvolveu-se uma metodologia capaz de extrair informações textuais e não textuais aplicados a etiquetas de modems. O método proposto é composto dos seguintes componentes: dois detectores de objetos que fazem a detecção da etiqueta e detecção simultânea de QR code e barcode, ambos utilizando YOLOv5; um decodificador de conteúdo para QR code e barcode, utilizando Zbar; um sistema de OCR utilizando PaddleOCR; e um conjunto de regras aplicadas ao pós processamento da informação. Para isso, foram criados três datasets, o primeiro contendo imagens de etiquetas em modems para treinar o modelo de detecção de etiquetas, o segundo contendo uma mistura de imagens de etiqueta e ambientes diversos que contêm QR code e barcode para gerar o modelo de detecção de QR code e barcode, e uma base de ground-truth contendo as imagens de etiquetas de modem com as respectivas saídas esperadas do sistema. O sistema proposto foi avaliado com diferentes modelos de etiqueta, e a execução dela foi feito numa CPU. A leitura das etiquetas alcançou valores médios de 0,21% de Character Error Rate, 2,16% de Field Error Rate, Acurácia por etiqueta de 76,19% e tempo de execução de 2,79 segundos para o primeiro modelo, e 0,04% de Character Error Rate, 0,62% de Field Error Rate, Acurácia por etiqueta de 92,50% e tempo de execução de 1,73 segundos. Resultados experimentais mostram que a solução desenvolvida pode ser utilizado em produção com altas taxas de acerto, e com tempo de execução significativamente melhores que um operador humano.

Descrição

Palavras-chave

Etiqueta, Deep Learning, Reconhecimento óptico de caracteres, Detecção de objetos, YOLO, PaddleOCR, Indústria 4.0, Sticker, Optical character recognition, Object detection, Industry 4.0

Citação

Avaliação

Revisão

Suplementado Por

Referenciado Por