机器数据采集软件:2026 年该买什么(以及该躲什么)

机器数据采集软件是产线和任何想用产线动作做点什么的系统之间的那一层。它从 PLC、传感器、视觉系统、MES,以及最近从对着机器拍的相机里读信号,把这些信号转成数据库、仪表盘、AI 模型能消费的数据流。
这个品类在五年里从一两家主导玩家扩展到了大约 20 家。一半人在解一些 2020 年还不存在的问题。另一半人在解过去由大 MES 厂商解、现在它们不再愿意碰的问题。这篇文章面向需要把候选工具拉短名单、并希望有一张清晰地图的运营或 IT 负责人。
机器数据采集软件真正在做什么
核心就三件事。接到数据源(PLC、传感器、相机、MES、ERP、手工录入的日志)。把数据规整成带时间戳、带工程单位的一致格式。把数据交给消费它的系统(历史数据库、仪表盘、云数据仓库、AI 模型、工艺工程师的电子表格)。
厂商之间的差异主要集中在第 1 步和第 3 步。中间那一段是大宗化的。厂商比拼的是原生支持多少协议(西门子 S7、Allen-Bradley、Modbus、OPC UA、MQTT、EtherNet/IP、Profinet,以及一长串各家专有协议),以及对接多少种消费端(SQL、时序数据库、Snowflake、BigQuery、Azure Data Explorer、Power BI、Grafana、自定义 REST 端点)。
在中小型工厂里,连接层比消费层重要。在已经有完整分析栈的大型工厂里,情况反过来。
2026 年五类工具
下面五个桶基本能覆盖 2026 年市场的大多数选择。
1. 经典 SCADA 邻接中间件
这类工具从历史数据库和 SCADA 工作流里长出来:AVEVA PI、Inductive Automation Ignition、Wonderware/AVEVA System Platform、GE Proficy。在大体量 PLC 数据上很强,在现代云对接和相机数据上很弱。价格高(按 tag 或按连接计价的许可费会很快堆起来)。可靠性高。在油气、大型化工、大型离散制造里是默认选择。
什么时候选它:你已经运行了多年的 PLC 与历史数据库资产,工厂 IT 团队能放心运维,且短期内不准备引入相机式监控或云端分析。
2. 现代开源栈
Node-RED + InfluxDB + Grafana,常常再加一个用来 MQTT 经纪的 Mosquitto。更有主张的开源捆绑:United Manufacturing Hub。正经的 MQTT 需求用 HiveMQ。总持有成本以工程师时间为主,不是许可费。天花板很高,门槛也很高(需要有人能运维)。
什么时候选它:你有一支熟悉自托管的内部团队,想避开厂商锁定,愿意用工程师时间而不是许可证美元买单。
3. 云原生商业平台
Tulip、Litmus Edge、HighByte、Cognite、Element、Cumulocity、AVEVA Data Hub。它们的销售故事几乎是同一份:比 SCADA 邻接老栈更低的 TCO,更短的首个仪表盘上线时间,原生云部署,给采购部门看的干净 IT 故事。计价方式是按设备或按数据流,堆得比厂商口头说的快。UX 和 AI 集成在不同厂商之间差距很大。
什么时候选它:你想要现代化工具,不想自托管,愿意为按设备的订阅费用列预算,12 个月内有一组明确要接的数据源。
4. 相机·AI 优先的系统
新品类。把相机当作一等数据源,而不是事后挂上去的东西。相机把画面喂给计数零件、分类缺陷、检测工艺异常的视觉模型,产生的事件流和 PLC 数据走同一条管道。Enao Vision 属于这一类。其他玩家包括 Augmentir、MakinaRocks,以及若干面向视觉的专用 MES 插件。
什么时候选它:你的瓶颈是想看清产线到底在做什么(而不是 PLC 以为它在做什么),希望一个工具能把相机数据和 PLC 数据放在同一层级。
5. 自建集成
很多工厂依赖一段调 OPC UA 客户端的 Python 脚本、把 CSV 倒到网络共享、再在上面挂几张 Power BI 报表。这其实不是一类工具,而是没有工具;但在小规模上它确实能跑,值得给它命个名。当脚本凌晨两点崩、又没人会修的时候,它就不能再跑了。
什么时候选它:1 到 2 条产线,一个负责维护脚本的工程师,没有预算。一旦复杂度上来,或者出现第二个需要维护这套系统的人,就立刻切到第 1 到第 4 类里的某一种。
各类工具会在哪里崩
经典 SCADA 邻接中间件在相机数据和云部署上崩。给 PI 服务器接视觉系统感觉像在做 hack。把数据导到云数据仓库里,会额外产生大多数团队都低估的许可与工程成本。
现代开源栈不是被技术压垮,是被人压垮。当那位特定的工程师还在公司时,它跑得很漂亮;那个人一离职,它就跑不起来。第二个工程师学会这一套的成本,几乎总是高于一年的商业许可费。
云原生商业平台在价格透明度上崩。挂牌价很少是真实价格,真实价格会随用量以 PoC 里看不到的方式增长。它们也会在边角案例上崩:厂商还没支持的长尾 PLC 协议,本地 IT 禁止云出网的政策,运行在 1998 年没有以太网口的控制器上的产线。
相机·AI 优先系统会在 PLC 数据本来就够用、相机只是徒增噪声没产生价值的时候崩。产线的照明和安装做错了,它们也会崩(任何视觉系统都一样)。
自建会在那个写脚本的人第一次休假那一周崩。
在你这家工厂怎么挑
按顺序问三个问题。今天必须接的数据源是哪些,18 个月之后还得接哪些?数据要落到什么地方(历史数据库、云数据仓库、BI 工具、AI 模型)?谁负责维护这套系统,他们对自托管复杂度的耐受度有多少?
一家有 20 台连了 PLC 的机器、一套已有 PI 历史数据库、一个小型 IT 团队的工厂,大概率应该扩展现有的东西。有 5 条产线、没有历史数据库、想要云分析、愿意按设备付费的工厂,应该看云原生商业那一类。最大的可视性缺口是 PLC 之外产线到底在发生什么的工厂,应该看相机·AI 优先那一类。只有一个工程师、一条产线的工厂,在他没去休假之前用自建也行。
错误的做法,是不按这三个问题、而按品牌知名度去挑。答案和隔壁工厂一样的情况其实很少。
2026 年的成本
中型工厂(10 到 30 台连了线的机器)各类成本的数量级。
经典 SCADA 邻接:一次性投入 10 万到 40 万欧元,加上每年 15% 到 25% 的维保。
现代开源:许可 0 欧元,加 1 到 2 名全职工程师(全负载成本每年 10 万到 20 万欧元)。
云原生商业:按设备或数据流分档,年订阅 3 万到 15 万欧元。
相机·AI 优先:每条产线年订阅 5,000 到 2 万欧元,加上让相机跑起来需要的硬件,每条产线 1,000 到 5,000 欧元的一次性安装成本。
自建:那一个工程师的时间成本,加上他离开时整套东西塌掉的灾难风险。
这些区间之所以宽,是因为真实数字取决于谈判、量级、季末折扣。当方向参考用,别当报价用。
现场入门:数据采集系统的真实内部
2026 年能跑的数据采集系统不是单一产品,是一摞东西。当你跟厂商对坐、Demo 把一半东西糊掉的时候,能按部件名一个个点出来,会很有用。
在传感器层,输入通常是几种混合:测温的热电偶和 RTD、压力变送器、振动变送器、流量变送器、做电力分析用的电流/电压变送器。每路传感器信号都要先做信号调理(调理通常包含放大、隔离、滤波),再由模数转换器从模拟转成数字。转换后的数据流会带着信号源序列号、时间戳、工程单位,被传给下一级。
做这个转换的 DAQ 硬件大致有三种形态。把读数存到内部存储、之后再下载的独立数据记录仪和录波器(最简单的数据记录工作流,在远端泵、发电机、HVAC 站房里还很常见)。在以太网或 USB 主干上向主机流式上传的模块化 DAQ 硬件(测试实验室和研发台架里的主流形态)。以及把一小段 DAQ 栈和控制逻辑放进同一台设备的可编程逻辑控制器前端(生产线上的主流形态)。
硬件之上是 DAQ 软件。它做的三件事,正好和工厂层面机器数据采集工具做的事有重叠。配置通道(采样率、量程、滤波)。记录并存储过程数据(经常和历史数据库一起跑在同一台 Linux 主机上)。通过实时曲线、仪表盘、报警给操作员展示读数。面向用户那一层用各种编程语言搭建:老栈里用 C 和 C#,现代 Web 仪表盘用 Python 和 JavaScript,以及一长串厂商脚本环境(LabVIEW、Codesys 结构化文本、Beckhoff TwinCAT)。
这段入门对工厂层面买家之所以重要,是因为同一个词在不同尺度上意思不一样。在电池研发实验室里说 "DAQ" 的测试工程师,通常指的是 National Instruments 的 PXI 机箱、一摞模拟输入模块,加上面上的 LabVIEW。在包装工厂里说 "机器数据采集" 的运营负责人,通常指的是从 20 台 PLC 把数据抽出来、送到仪表盘和 AI 模型的一段中间件。两边都对,两边都在用同一组词,而同时卖给这两个细分市场的厂商,会有意把术语说得含糊。销售一上来聊 DAQ,先问他指的是 "传感器·转换器栈" 还是 "PLC·仪表盘层"。这个回答会决定这件工具合不合适。
质量管理团队比任何部门都更积极地在用 DAQ 数据。这些数据是每一次 CAPA、每一次供应商审计、每一个要求可追溯的客户投诉里的证据。用手写日志运行质量管理的工厂,和用数据采集系统运行的工厂,根本不在同一个十年里。从前一种走到后一种的那一步,才是这类软件真正在卖的东西,即使它对外打的招牌是 "生产力" 或 "可视化" 也一样。
FAQ
MQTT 跟机器数据采集工具是同一类东西吗?不是。MQTT 是一种传输协议。机器数据采集工具通常会把 MQTT(或 OPC UA,或某家专有协议)作为它的某一种传输层。工具和协议是两回事。
历史数据库和机器数据采集工具是不是两个都要有?小型工厂不用。有大体量 PLC 数据的大型工厂要。历史数据库为高频时序数据的存与查做了优化。采集工具为把数据送到那里、以及送到其他消费端做了优化。
OPC UA 是什么,需要吗?OPC UA 是一种用于机器间数据交换的现代开放标准。绝大多数采集工具都支持它。如果你的机器支持(大多数新 PLC 都支持),那就需要。对老机器,通常要退回到厂商专有协议。
和 MES、ERP 怎么衔接?采集工具把实时机器数据喂给 MES。MES 把汇总后的生产数据喂给 ERP。采集工具在这两层的最上游。
从可视性缺口开始
选什么工具,取决于缺口在哪。缺口是基于 PLC 数据的仪表盘,就选云原生商业或开源。缺口是大批量机器队列的企业报表,就留在经典栈里继续扩展它。缺口是 "PLC 给出的口径之外、产线到底在发生什么",就从相机·AI 优先这一类入手,其他事情之后再操心。
想更深入看相机式监控带来什么,参考另一篇 "摄像头生产监控"。想看这件事如何嵌入更宽的可视化项目,参考另一篇 "生产监控系统"。