非计划停机:成本是多少、藏在哪里、以及把它砍掉一半的办法

非计划停机是工厂 "能做出来的产能" 和 "实际做出来的产能" 之间的那道差。在大多数工厂,这道差比他们以为的更大。一直如此:早班报表里那个数,通常只是真实数字的一半,因为有意义的停机里有相当一部分根本走不到报表那一步。
这篇文章写给那些怀疑自己工厂正在漏产能、但说不出确切漏在哪里的运营负责人,以及那些需要一套能找到漏点并把缺口补上的实操框架的人。在各个行业里,这套模式是一致的:把能数出来的先数出来,把藏起来的猎出来,然后用一个把这两件事都保持诚实的周会节奏撑住它。
非计划停机折成钱到底是多少
行业研究里报的那些数字("制造业整体每年 500 亿美元" 那一类引用)在工厂层面太聚合了,没法用。能用的版本是按产线、按小时算。
一家每班次产出 3 万欧元的中型汽车零部件厂,跑一台冲压机,每一小时非计划停机大概损失 1,200 欧元。一条每班次 8,000 欧元的快消品包装线,每小时大概损失 350 欧元。一条每班次 3,000 欧元的小型食品饮料线,每小时大概损失 130 欧元。这是直接边际损失,不是标价营收损失。废品、加班、客户违约金这类二次成本没算进去。
一家有 5 条产线、平均非计划停机率 12%(中等水平工厂里很典型)的工厂,一年损失是七位数。大多数领导犯的错,是把一个 "行业平均美元/小时" 数字乘到整个工厂上。正确的做法是按产线分别算实际边际/小时,再加起来。这个数会比行业研究暗示的低,比早班报表暗示的高。
非计划停机藏起来的五个地方
停机里被藏起来的那部分,集中在五类。把这道可见性的缺口补上,往往是 30%~50% 可执行改善睡着的地方。
1. 5 分钟以下的小停机
大多数报告系统会把 5 分钟以下的停机排除,或者优先级压低。这些会堆积。一条每 4 分钟停 30 秒的产线会损失 7% 的产能,但这部分损失在按 5 分钟阈值过滤的日报里从来不出现。这正是 2026 年摄像头式监控真正发挥价值的地方:把 PLC 日志漏掉或低报的微停机数出来。
2. 慢跑
比额定值更慢的节拍时间,是离 "看不见的损失" 最近的那个东西。机器在跑,仪表盘是绿的,产出比目标低 12%。慢跑常常被编码成 "以低速进行的计划生产",于是从停机类别里完全消失了。
3. 质量代账的停机
一条全速跑了 7 小时 30 分钟、最后 30 分钟停下来处理不良品的产线,最后这 30 分钟常常被编码成 "质量" 而不是 "停机"。产线没在跑,产出丢了。把它归到别的类目里不会改变损失本身,改变的只是它的可见性。
4. 超时的换型
如果一次计划 20 分钟的换型常常拖到 45 分钟,这件事会被报告成 "20 分钟换型" 加 "25 分钟的产出缺口"。这个缺口很少作为经常性损失抵达领导层,它被当成背景噪声处理。把整个季度看下来,累计的超时常常比单次最大的设备故障还大。
5. 没人记的软停机
因为班长在开会,因为操作员暂时离岗,因为叉车堵了输送带,产线暂时停下。PLC 看得到这次停顿,但这次停顿不会被编码出原因,因为没有人愿意在自己的绩效报表上挂 "开会码"、"上洗手间码"、"叉车码"。这些停机真实存在、会堆积。在那些没有自动停机捕捉的工厂里,这部分尤其明显。
实际上怎么把它找出来
两种方法并用。
第一步,把捕捉自动化。任何能持续监控产线的工具(PLC 接入、相机、振动传感器)都会把人工日志漏掉的停机捞出来。这笔投入会在一个季度的可见性提升里收回成本。各类工具的具体取舍不同,关于这件事可以参考另一篇 "机器数据采集软件"。
第二步,审计现有日志。选一条产线、选一周,和班次主管、维修主管一起坐下来,把日志上每一次停机按顺序逐条对一遍。把日志显示的停机加起来,再和那一周的额定产能与实际产出的差比一下。差出来的那部分,就是被藏起来的部分有多大。一个月后,在另一条产线上重复一次。
两件事都做的工厂,在季度末会比只挑一件做的工厂拥有一张清晰得多的图。
把非计划停机砍掉一半的 90 天计划
"砍掉一半" 这个标题,对大多数过去三年没跑过结构化停机项目的产线来说是能做到的。提升是真的,路径已经走过很多遍了。
第 1~30 天,把它显出来
在工厂最差的那条产线上装上自动捕捉。把原因码定义清楚。围绕新的码训练操作员。用两周时间建立基线。在每周班次复盘里按原因码公开基线。这一阶段先别尝试修任何东西。第一个月的目标是把问题清晰看见,而不是对它行动。
第 31~60 天,攻打前三
到第 30 天,帕累托图就有了。按小时维度选出前三类。给每一类配一个有名字的责任人(工艺工程师、维修主管、班次主管)。给每个责任人一个结构化的改善项目(5-Why、A3,或者跟你们文化匹配的小型改善)。每个项目限时 4 周。第 2 个月的目标是把前三类每一类各下降 30%。
第 61~90 天,把成果钉在地上
改善只有在标准、培训、稽核都变了之后,才算钉在地上。第 3 个月就是更新换型检查表的月份、重写贴在机器旁那张排故卡的月份、把新行为放进操作员辅导计划的月份。没有这第 3 个月,项目结束后 6 周内成果就会蒸发。
从非计划停机 12% 起步的一条产线,到第 90 天应该到 6%~8%,而且下一个 90 天的活儿应该清清楚楚摆在那里。
不灵的几种打法
几个要避开的模式。
在所有产线上同时启动的全厂大项目。注意力被稀释。挑一条产线,先在那条产线上赢,再往别处搬。
没有内部责任人的咨询主导项目。结构是对的,顾问离开的那一周,后续就死了。
没有同期落地承诺就买的新系统。仪表盘第一个月很漂亮,第三个月没人用。
只读数字、不挑动作的早会。可见性有用。复利效应,只有在每次会议都挑出一件在午饭前要去查的事时,才会发生。
运营负责人该掌握的可靠性词汇
当大家用同一套词,停机这个话题就会变锋利。下面这些定义值得在下一次员工会议前先定下来。
设备停机是设备没在生产的任意时段。它分成计划停机(计划维护、换型、计划清洁)和非计划停机(其余一切)。设备故障是可见性最高的原因,也最好聊,但很少是最大头。把人员错误、软停机、等料加起来,通常会超过设备故障的总时长。
设备可靠性靠成对的两个数字衡量。MTBF(平均故障间隔时间)是机器在两次故障之间平均能跑多久。MTTR(平均修复时间)是故障发生之后平均要修多久。可用率是设备处于可用状态的计划时间比例。MTBF 高、MTTR 低的产线,在产线上保留实时监控的同时,可以追激进的可用率目标。MTBF 低、MTTR 高的产线,无论领导层装多少仪表盘都做不到。
维护策略才是领导真正能动的杠杆。事后维修把机器跑到坏,坏了再修。预防性维护按日历(每 500 小时、每 30 天)排服务。预测性维护用传感器信号在故障真正发生前一点请求维修。大多数工厂跑的是混合策略。2026 年最快的可靠性提升,来自把大约 1/4 的事后维修转成预防性维护,再把大约 1/4 的预防性维护转成预测性维护。按这个顺序。
财务视角也很重要。设备故障的成本不止于修理费。还有出货不出来损失的营收、被停掉的操作员损失的生产力、缺货向下游传导时的供应链扰动、SLA 没守住时的客户满意度损伤,以及偶尔在错误的时间点故障时的安全事故。一次严重设备故障的全成本,通常是直接修理成本的 3~5 倍。让整条产线停下来的系统级停机,全成本很容易到 10 倍。
标准作业、标准作业程序(SOP)、过程稽核,是在可靠性项目稳定之后阻止故障率回弹的那条纪律。没有它,成果会衰减。有了它,精益制造或其它改善框架(六西格玛、TPM、世界级制造)才有可以往上叠的地基。高可靠性工厂里的模式都一样:有一个把 MTBF 和 MTTR 当头条指标拥有的维修团队、一个拥有标准作业的工艺工程团队、以及一个不把两者混淆并分别给两边投钱的领导团队。
库存管理是可靠性里经常被忽视的搭档。仓库里没有合适备件的工厂,会把一次 30 分钟的修理变成一次 6 小时的修理,只因为等件空运过来。工厂监控和库存管理应该放在同一块仪表盘上,这样维修主管一眼就能看到下次可能发生的故障所需要的备件在不在库里。
出现最频繁的根本原因
2026 年中型工厂的停机根本原因分析里浮出水面的模式,可以聚成一份很短的清单。
润滑泄漏(本该按表加油的轴承没被按表加上)。冷却系统结垢(几个月内没人注意、悄悄丢掉产能的热交换器或冷却液回路)。传感器漂移(已经偏离校准、还在向 PLC 持续发送不符合实际的数字的压力传感器或温度探头)。软件死锁(因为某个没打补丁的驱动而挂起的 HMI 或 SCADA)。物料波动(略微偏出规格、让产线表现得不可预测的原料批次)。换型流程不清晰、或缺少可视化辅助工具导致的操作员失误。
这些模式之所以反复出现,是因为它们正好落在 "日常注意阈值" 的下一档。一个会给它们命名、安排检查、每周复盘数据的可靠性项目,会产生复利效应。把每个事件当成一次性事件来处理的工厂,会在好几年里、每六周重复一次同样的事件。
FAQ
非计划停机和计划停机的区别是什么?计划停机是排进时间表的(换型、维护、计划清洁)。非计划停机是其余一切(故障、质量停机、软停机、被当成停机处理的慢跑)。在实际操作里,两者的边界是模糊的:一次超时的换型从 "计划" 开始,从第 21 分钟起就变成了非计划。
OEE 等于非计划停机吗?不等于。OEE 把可用率、性能、质量收成一个数。非计划停机是 "可用率" 这一项的驱动因素之一。一家工厂可以在非计划停机稳定的同时 OEE 在往下走,那就是性能或质量出了问题。
AI 能预测非计划停机吗?要看情况。预测性维护模型在训练数据好的时候,能预测某台特定机器的某种特定故障。软停机和质量停机的那条长尾(可执行损失里的大头),目前还没法预测。预测性维护应该当成结构化周项目的有用补充,而不是替代品。
装一套自动停机捕捉要多少钱?按类目而定。各种工具类型的大致区间可以参考另一篇 "机器数据采集软件"。
产线是工作的单位
非计划停机的改善是按产线发生的。工厂层面的数字是个有用的记分牌,但工作是本地的。挑出最差的那条产线、装上可见性、挑出前三个原因、把它们修掉、把成果钉住,然后再去下一条。在 12 个月内、跨 5 条产线一直跑这个模式,就是 "12% 工厂" 和 "6% 工厂" 的差距。
想看生产可视化的更大框架,参考另一篇 "生产监控系统"。要看先把停机这一层可视化的追踪层,参考另一篇 "停机追踪软件"。