Coleta de dados do chão de fábrica: um guia 2026 para fábricas brasileiras

A coleta de dados do chão de fábrica é a disciplina de capturar o que está acontecendo na produção em uma forma que outros sistemas conseguem usar. Em uma fábrica em 2026 isso significa uma stack de sensores automáticos, taps em PLC, câmeras de visão e uma camada residual de dados inseridos pelos operadores, tudo alimentando MES, ERP e uma quantidade crescente de analytics em nuvem e modelos de IA.

Este texto é para o gestor de operações ou TI em uma fábrica de porte médio que está reconstruindo a sua camada de dados e quer um framework prático. O padrão brasileiro tem forma parecida mas detalhes próprios em comparação com o americano, e a maioria dos guias publicados online assume implicitamente normas norte-americanas. Abaixo você encontra uma versão que parte do contexto manufatureiro brasileiro, com as referências às diferenças relevantes quando importam.

O que a «coleta de dados do chão de fábrica» realmente cobre

Quatro camadas, da mais bruta à mais refinada.

A camada de sensores captura sinais físicos (temperatura, pressão, vibração, corrente, posição) e os transforma em fluxos time-series. Em uma fábrica brasileira os protocolos dominantes são Profinet e Profibus no parque Siemens, EtherNet/IP em parques Rockwell e Allen-Bradley, Modbus em máquinas mais antigas, com uma migração constante para OPC UA nas máquinas mais novas.

A camada de eventos captura eventos discretos dos PLCs e das câmeras de visão (uma parada, uma peça contada, um defeito detectado, um setup iniciado). A forma do evento é aquela para a qual a maioria dos sistemas MES foi construída para consumir.

A camada de transações captura as ações business-relevantes que exigem rastreabilidade (um lote aberto, um crachá de operador escaneado, um hold de qualidade levantado). É a camada que faz interface com o ERP, e é onde auditores e clientes dedicam mais atenção.

A camada de contexto captura os campos inseridos à mão que nenhum sensor consegue produzir (um código de motivo de parada que o operador precisa escolher, uma observação de qualidade, uma nota de turno, um problema que o líder de manutenção notou e anotou). É a camada menor em volume de dados e frequentemente a mais valiosa para a root cause analysis.

Um programa de coleta de dados do chão de fábrica bem feito cobre todas as quatro camadas. A maioria das fábricas brasileiras de porte médio em 2026 cobre bem as duas primeiras, de forma descontínua a terceira, e mal a quarta.

Por que a coleta de dados do chão de fábrica importa em 2026

A razão de essa disciplina importar mais em 2026 do que cinco anos atrás é que a stack de manufacturing operations acima dela ficou muito mais exigente. Indústria 4.0 era o rótulo de marketing. Smart manufacturing é a versão prática. Em qualquer caso, as ferramentas de analytics, IA e otimização de processo que a fábrica é hoje esperada usar todas assumem que a camada de dados embaixo seja limpa, completa e consistente.

Uma lista curta do que a camada de coleta de dados alimenta em uma fábrica moderna. O MES consome eventos e ordens de trabalho. O ERP consome transações e ordens de produção. O data historian guarda os dados de máquina em alta frequência para a revisão de engenharia. O SCADA guarda a vista operacional da fábrica para a sala de controle. O data warehouse em nuvem guarda os analytics cross-linha e cross-fábrica. O dashboard de OEE traduz isso em um score diário. As ferramentas de reporting de produção traduzem isso em uma revisão semanal para a liderança.

Cada um desses consumidores quer os mesmos dados modelados de forma diferente. A camada de coleta de dados é o substrato compartilhado que permite a todos trabalharem sem precisar reconstruir a captura para cada um. Se o substrato está certo, a conversa sobre eficiência operacional fica séria. Se está errado, cada consumidor reconstrói a própria versão da realidade, os gargalos se escondem dentro do trabalho de reconciliação, e a fábrica perde a narrativa de operational excellence que a liderança está tentando contar.

Padrões brasileiros (e onde diferem do mundo anglo)

Alguns elementos distinguem a coleta de dados do chão de fábrica em plantas brasileiras dos padrões norte-americanos dos guias genéricos.

Siemens e Rockwell convivem no parque instalado brasileiro. Profinet é o default em muitas plantas de automotivo, mineração e siderurgia. EtherNet/IP domina parques Rockwell, especialmente em food and beverage e bens de consumo embalados. Qualquer programa de coleta de dados que não fale fluentemente os dois parte em desvantagem. Beckhoff e Mitsubishi estão em pockets (frequentemente em plantas com matriz alemã ou japonesa).

Restrições regulatórias específicas. Em pharma as boas práticas de fabricação RDC 658/2022 da ANVISA e os requisitos de Data Integrity sobem a régua nas camadas de transações e contexto. Em food o Codex Alimentarius e as RDCs da ANVISA sobre rastreabilidade (RDC 24/2015 e atualizações) empurram no mesmo sentido. A NR-12 de segurança em máquinas e a NR-1 sobre gestão de riscos tocam tanto a captura dos eventos de segurança quanto o período de retenção dos registros.

Custo do trabalho e turnover. Plantas brasileiras tipicamente têm um turnover mais alto que plantas europeias e mais próximo das americanas. A implicação para a coleta de dados é que a camada de inserção manual é mais frágil por default e que o investimento em ergonomia do terminal compensa: uma solução que funciona em uma planta com time estável pode falhar em uma planta com rotatividade alta e treinamento intensivo, se a UX não for óbvia ao primeiro toque.

Cloud-friendliness. A cultura de TI brasileira ficou bem mais cloud-tolerant nos últimos cinco anos. AWS, Azure e Google Cloud têm base instalada significativa. Snowflake e Databricks crescem rápido em times de dados industriais. Em compensação, as obrigações da LGPD sobre o tratamento de dados (inclusive dados de imagem captados por câmera no chão de fábrica) pedem uma definição clara de finalidade e retenção. Isso pesa nas escolhas de software de coleta de dados, principalmente em setores regulados.

As escolhas que de fato importam

Quatro escolhas determinam se um programa de coleta de dados do chão de fábrica funciona ou fica frágil.

O que você automatiza primeiro. A tentação é automatizar tudo de uma vez. O resultado é que nada fica automatizado bem. O padrão que funciona: comece pelos eventos que o operador registra à mão hoje e que pararia de bom grado se o sistema fizesse no lugar dele (contagens, paradas acima de 30 segundos, tempos de ciclo básicos). Deixe os mais difíceis (códigos de motivo, observações de qualidade) para depois que os fáceis estiverem ao vivo e crentes.

Onde os dados aterrissam. A escolha é entre um historian on-premise (PI, Ignition, Wonderware), um data warehouse em nuvem (Snowflake, Redshift, BigQuery) e um híbrido em que o historian é local e dados seletivos vão para a nuvem. Para a maioria das fábricas brasileiras de porte médio em 2026 a resposta certa é o híbrido. O historian para os dados operacionais em alta frequência, a nuvem para analytics e IA, com um contrato claro entre os dois.

Como os operadores interagem com o sistema. O terminal lado linha determina se a camada de inserção manual se enche de fato de dados úteis. A escolha é entre PCs industriais fixos em cada estação, tablets ruggedizados e smartphones pessoais em modo BYOD (menos comum em plantas brasileiras por questões de compliance e política corporativa). A opção do PC fixo segue como default seguro nos setores regulados. O tablet está ganhando fatia em bens de consumo e food.

O modelo de dados. A decisão isolada mais consequente e menos glamourosa. O que é um «evento» no seu modelo de dados? Qual é o identificador canônico do SKU? Os códigos de motivo de parada são flat ou hierárquicos? O scrap rola na linha ou no SKU? Se você acerta na fase de design, os analytics funcionam por uma década. Se você erra, reconstrói a cada dois anos.

Os quatro erros que aparecem em auditoria

Padrões que vi recorrerem em auditorias de dados de plantas brasileiras.

Um: gap de retenção. Os dados são capturados mas mantidos só por 90 dias porque ninguém definiu a política. Quando um cliente ou um regulador pede os batch records do ano passado, os dados não estão mais lá.

Dois: drift dos códigos de motivo. Os motivos de parada definidos no lançamento decaíram em uma lista longa em que 60% das paradas é codificada como «Outro» ou «Problema de processo». Os dados continuam fluindo. Os dados não são mais úteis.

Três: workarounds manuais sem dono. Uma planilha Excel que o líder de QA mantém à parte, um log em papel que é redigitado toda semana, um dispositivo pessoal que coleta leituras porque o sistema oficial é lento demais. Esses workarounds são o canário de um sistema de coleta de dados que não adere ao trabalho.

Quatro: sistemas paralelos com números em conflito. O MES diz 4.200 peças. O ERP diz 4.175. O tracker de paradas diz que a linha rodou por 7 horas e 12 minutos. O dashboard de OEE diz 7 horas e 38 minutos. Ninguém sabe em qual acreditar. O trabalho de reconciliação consome semanas de tempo de analista a cada trimestre e corrói a confiança nos dados.

Os três primeiros são higiene operacional. O quarto é um problema arquitetural que fica mais difícil de consertar quanto mais tempo você deixa.

Um programa de 12 meses para uma fábrica de porte médio

Uma sequência grosseira que vi funcionar, dimensionada em uma fábrica com 5-10 linhas.

Meses 1-3. Inventário da captura existente. Identifique as duas primeiras linhas por output e por parada. Defina o modelo de dados (eventos, códigos de motivo, identificadores SKU e lote). Escolha a stack de plataforma (ferramenta de aquisição, historian ou nuvem, terminais lado usuário).

Meses 4-6. Deploy na primeira linha. Coloque as camadas de sensores e eventos rodando limpas. Rode um sistema de códigos de motivo em paralelo com os operadores por duas semanas antes de desligar o log legado.

Meses 7-9. Deploy na segunda linha. A essa altura a primeira linha tem dados fluindo para o historian e para o data warehouse em nuvem. Construa a primeira camada de analytics (um relatório de OEE diário, um Pareto de paradas semanal, uma visão de scrap-por-SKU mensal).

Meses 10-12. Rollout para as linhas restantes usando o template já provado. Aperte a política de retenção. Configure os controles de acesso ao data warehouse. Documente o modelo de dados para a próxima geração de engenheiros que vai herdar.

É mais rápido que o padrão típico de tentar fazer rollout em todas as linhas ao mesmo tempo e mais lento que a promessa consultiva dos seis meses. O caminho do meio é o que de fato chega à meta.

O que os analytics fazem de fato com os dados

Uma vez que as quatro camadas fluem, a camada de analytics consegue fazer trabalho que era impossível na fase da inserção manual.

A taxa de produção e o output de produção são calculados em tempo real a partir da camada de eventos em vez de serem reportados no fim do turno pelo log do operador. O score de OEE, o número de overall equipment effectiveness que o plant manager cita na revisão semanal, vira um dashboard ao vivo em cima do qual o chão de fábrica pode agir, não um post-mortem de segunda de manhã. O Pareto de paradas vira uma ferramenta de trabalho para o líder de manutenção, não um slide para a revisão trimestral.

A conversa sobre controle de qualidade também muda. Os eventos de defeito vindos das câmeras de visão são casados com as ordens de produção em curso, com os operadores no turno, com o lote de matéria-prima e com as leituras de parâmetro a montante. A root cause analysis que pedia três semanas de trabalho em planilhas Excel acontece em uma tarde. Os sistemas ERP que são donos dos holds de qualidade recebem o sinal certo em tempo quase real.

Os use cases de IA são onde vivem hoje os insights acionáveis de maior alavanca. Um modelo treinado nos dados casados de sensores, eventos e transações pode sinalizar a assinatura precoce de um gargalo em formação antes de a linha parar. Um modelo de visão pode manter a régua de inspeção em um nível que o olho humano perde no terceiro turno. Nada disso funciona se a camada de coleta de dados embaixo for frágil. Tudo funciona se as quatro camadas (sensores, eventos, transações, contexto) estiverem limpas.

As fábricas que acertam isso saem de uma cultura de revisão de eficiência operacional para uma de otimização de processo que se acumula, em que o trabalho de analytics de cada trimestre deixa a fábrica um passo mensurável à frente de onde tinha começado.

FAQ

Qual é a diferença entre coleta de dados do chão de fábrica e MES? O MES é um dos consumidores da camada de coleta de dados. A camada de coleta de dados alimenta também ERP, historian, data warehouse em nuvem, ferramentas de BI e modelos de IA. O MES fica a jusante da camada de coleta de dados em uma stack bem arquitetada.

Preciso de storage em nuvem para os dados do chão de fábrica? Não necessariamente. O historian foi projetado para isso e continua fazendo bem. A razão de a maioria das fábricas mover uma parte dos dados para a nuvem é pelos use cases de analytics e IA, não pela captura primária. Um padrão híbrido com historian on-premise e sincronização seletiva para a nuvem é o padrão brasileiro dominante em 2026.

Dá para usar um smartphone para a coleta de dados do chão de fábrica? Sim, com caveats. Para a inserção de dados lado linha, smartphones funcionam. Para a captura em alta frequência e para ambientes regulados, o hardware dedicado segue a escolha mais segura. O monitoramento por câmera via um smartphone em posição fixa (um padrão Enao Vision com iPhone) é um use case separado e cada vez mais comum.

Por quanto tempo eu preciso reter dados do chão de fábrica? Depende do setor. Pharma sob ANVISA RDC 658/2022 tipicamente pede pelo menos três anos para os batch records, muitas vezes mais por contrato. Food sob as RDCs da ANVISA e o Codex Alimentarius pede pelo menos dois anos para a rastreabilidade. Clientes automotivos frequentemente pedem sete anos para os dados de peças. Configure a política de retenção no deployment, não no terceiro ano.

Comece pelas quatro camadas

A coleta de dados do chão de fábrica não é a compra de um produto único. É a disciplina de capturar o que acontece no chão de fábrica de um jeito que outros sistemas conseguem usar sem perder o significado pelo caminho. Sensores, eventos, transações, contexto. Construa nessa ordem. Escolha as ferramentas adequadas ao seu contexto (fluência em Profinet e EtherNet/IP no parque misto Siemens/Rockwell brasileiro, stack híbrida cloud-friendly com cuidados de LGPD, retenção de setor regulado). Depois faça a auditoria dos quatro erros uma vez por ano para manter o sistema honesto.

Para o guia mais aprofundado das ferramentas, veja software de aquisição de dados de máquina. Para como isso se encaixa no frame mais amplo de visibilidade, veja sistema de monitoramento de produção. Para a disciplina operacional que depende desses dados, veja paradas não planejadas.

Comece de graça

Quer ver o quanto a sua coleta de dados do chão de fábrica pode melhorar em poucas semanas? Crie uma conta gratuita e conecte a sua primeira máquina em minutos.

Entre na comunidade Enao

Compare padrões de coleta de dados do chão de fábrica, modelos de dados e escolhas de stack com outros engenheiros de processos na comunidade Enao.