
AI 在 MES 里的作用,不是另起一套流程,而是在已有的工单、报工、质检数据上多做一层判断。先从质量预测和异常预警这两个场景切入,投入可控,也更容易让现场人员接受。
为什么是质量预测先落地
去年我们在一个注塑件工厂做 MES 二期的时候,车间主任提了个很实在的需求:能不能在模具温度开始漂的时候,系统自动给个提醒,别等做出一堆废品了才发现。
这个需求本质上就是"质量预测"——用当前工序的工艺参数,预判这批产品会不会出问题。注塑、冲压、SMT 贴片、热处理这些工序,质量跟温度、压力、速度、时间这些参数强相关,特别适合用 AI 模型来做预测。
更关键的是,MES 本身就在记录这些数据:工单开工时间、每道工序的报工节点、质检员填的不良原因、设备 PLC 回传的温度曲线。很多企业不是没有数据,而是这些数据还停留在“出了问题再查”的阶段。
数据准备:比模型更重要的一步
说实话,做 AI 项目最耗时间的不是训练模型,是把数据整理干净。MES 里的数据有几个常见的坑:
- 质检员填不良原因时,同一个缺陷可能有五六种写法,"划伤""表面划痕""外观划伤"其实是同一回事。
- 设备采集的工艺参数偶尔会有跳变,比如温度传感器瞬间读到 999℃,明显是干扰信号。
- 有些工序的报工时间跟实际加工时间对不上,工人可能做完一批才统一扫码。
所以第一步不是急着上模型,而是把 MES 里至少 3-6 个月的历史数据拉出来,先做清洗和标注。把不良原因统一归类,把明显异常的值过滤掉,把工单、工序、质检记录按时间轴对齐。这一步做好了,后面建模会顺很多;这一步做不好,模型再复杂也只是看起来热闹。
模型怎么选:别一上来就搞深度学习
很多人一提到 AI 就想到神经网络、深度学习,但在工厂场景里,复杂模型不一定最合适。车间主任和质量经理更关心的是"为什么判断这批有风险",而不是只看到一个黑盒分数。
实际项目中,我们更推荐从决策树、随机森林或者 XGBoost 这类模型入手。它们的好处是:
- 训练快,一台普通服务器就能跑。
- 可解释性强,能输出类似"温度超过 185℃ 且压力低于 0.6MPa 时,缺陷概率明显上升"这样的判断依据。
- 对数据量的要求没那么高,几千条记录就能出初步结果。
等这些基础模型跑稳了,如果确实有海量数据,比如每天几十万条工艺曲线,再考虑上 LSTM 或 Transformer 做时序分析也不迟。先把一个工序跑通,比一开始追求模型名词更重要。
异常预警:从事后补救变成事前拦截
质量预测解决的是"这批会不会出问题",异常预警解决的是"现在是不是已经不对劲了"。
举个例子:一条 SMT 产线,回流焊的温区温度应该是阶梯式上升的。如果某个温区的实际温度曲线跟标准曲线偏差超过阈值,系统就应该立刻推一条告警到车间看板和班组长的手机上。
这个场景的实现逻辑其实不复杂:
- 在 MES 里定义每个工序的关键工艺参数和正常范围。
- 通过 PLC 数据采集实时获取设备参数。
- 用滑动窗口算法或简单的统计过程控制(SPC)规则做实时比对。
- 超出阈值时,MES 自动生成异常事件,推送到指定人员。
如果再结合 AI 模型,还可以做到"趋势预警":参数还没超标,但连续几分钟都在往坏的方向漂,系统也能提前报警。这种预警比单纯靠上下限判断更贴近现场,也能给班组留出处理时间。
落地节奏:别想一口吃成胖子
根据我们的经验,AI 质量预测项目建议分三步走:
- 第一步(1-2 周):选一条产线、一个关键工序、一类最常见的缺陷,把 MES 里的历史数据拉出来做清洗和标注。
- 第二步(2-3 周):用 XGBoost 或随机森林训练一个基础模型,在历史数据上验证效果。如果模型能稳定提前识别出主要风险,就值得上线试跑。
- 第三步(持续迭代):把模型部署到 MES 的质检模块里,质检员在实际使用中反馈预测结果准不准,这些反馈再回来优化模型。
关键原则是:先跑通一个点,再扩展到其他工序和缺陷类型。千万别一上来就想覆盖全厂所有产品,那样大概率会烂尾。
跟 MES 现有流程怎么结合
AI 的预测结果不能飘在天上,必须落到 MES 的操作流程里才有价值。具体来说:
- 工单开工时,系统根据历史数据自动标注风险等级,高风险工单提醒质检员加强巡检。
- 工序报工时,如果 AI 判断当前参数组合有异常,报工界面直接弹出预警提示,质检员必须确认后才能流转到下一道工序。
- 质检记录里增加一列"AI 预测结果",方便后续对比分析模型的准确率。
- 车间看板上增加质量趋势图,把 AI 预测的风险工单用红色标记出来。
这些改动都不大,不需要推翻 MES 现有的流程,只是在关键节点上加了一层智能判断。
一个真实的投入产出账
那个注塑件工厂做完一期质量预测之后,车间主任给我们算了一笔账:上线前,每个月因为模具温度异常导致的批量报废大概有 3-4 次,每次损失在 8000-15000 元之间。上线后三个月,这类报废降到了每月 1 次以内,而且每次都能在头几个产品出问题时就拦截住,不会等到整批做完才发现。
项目的投入呢?数据清洗、模型训练再加上 MES 功能改造,总共不到 15 个人天。对这个工厂来说,这笔账是算得过来的。
当然,不是每个场景效果都这么明显。如果企业的工艺本身就很稳定、不良率已经很低,AI 预测的边际收益就有限。所以上 AI 之前,先看看自己的 MES 数据里有没有"值得预测的问题",这个判断比技术选型更重要。
