06-15
2026如果你走进一家正在推进智能化的制造企业,可能会看到一种有趣的分裂:一边是AI专家,他们激情澎湃地讲着大模型、工业人工智能,PPT上画满了炫酷的架构图,可当你问“数据从哪儿来”,他们往往支支吾吾——“还在整理中”;另一边是数据工程师,他们埋头苦干,建数据中台、清洗脏数据、打通信息孤岛,可当你问“这些数据打算怎么用”,他们一脸茫然——“我们只管把数据弄干净,至于模型怎么训练,还在摸索”。这两拨人说的都是“智能化”,走的却是两条平行轨道,谁也不等谁。这就像两个人想跳双人舞,一个只练上半身,一个只练下半身,一上台不是踩脚就是摔倒。

过去十年,很多制造企业尝试过两种思路,结果都走不远。第一种是“先攒数据,再想模型”——觉得只要把设备数据、质量数据、工艺数据都采上来,建个巨大的数据湖,数据多了自然会“长出”智能。这个逻辑在互联网公司确实管用,但工厂里的数据不一样:一条机器振动波形,如果不说明它来自哪道工序、什么材料、什么刀具,那就是一堆毫无意义的波浪线;一批质检合格率数据,如果没有对应的工艺参数,光看数字也不知道问题出在哪。很多企业花大价钱建了数据湖,AI工程师进去一看,能用的特征少得可怜——数据是“干净”了,却也是“死”的。第二种是“先搬模型,再等数据”——大模型火了以后,有人觉得找到了捷径,拿通用模型微调一下,写几个提示词,工厂就能变聪明。现实很快打了脸:让通用模型优化工艺参数,它可能给出违反基本工艺纪律的“馊主意”;让它诊断设备故障,它能说出“轴承可能有问题”,却讲不清是磨损还是缺油;让它做生产排程,它连最基本的物料约束都处理不好。模型虽然“脑容量”大,但没有制造业的“身体记忆”——不懂“淬火”“回火”的区别,不知道“转速”“进给”“切深”之间的内在约束。单靠数据或单靠模型,都像一条腿走路,跑不起来。
正因如此,国家最近出台了一项有意思的政策,叫“模数共振”。顾名思义,就是让模型(模)和数据(数)别再各玩各的,而要像两个配合默契的舞伴,同频共振、相互成就。政策的核心是:用模型来牵引数据治理的方向——模型需要什么数据,你就重点去治理什么数据;用数据来精准喂养模型的训练——数据要有工业语义,模型才能真正读懂。两者形成一个“模型→应用→产生新数据→优化模型”的良性飞轮。这不仅是口号,文件里明确了硬指标:每个行业至少要梳理5个高质量数据集,研发1个行业模型,落地30个高价值场景。地方上还发“模型券”“算力券”,直接补贴企业购买工业AI服务。可以说,国家已经在推着企业把模型和数据这两条腿绑在一起走路了。
那么,模型和数据怎样才能真正“共振”呢?光是统一数据格式、开个API接口是不够的,那叫物理连接,不是化学耦合。真正的共振,需要在语义层面打通——让模型真正理解数据“讲的是什么故事”。这个打通语义的利器叫做“本体”。听起来高深,其实就是一套概念地图,它告诉机器:这个行业里有哪些关键事物?它们之间是什么关系?有什么属性?举个例子,工厂里的“轴承”,设备系统可能叫它“bearing”,维修工单里叫“轴撑”,采购系统里叫“滚动轴承6205”。没有本体,模型看到的是三个不同的东西;有了本体,模型就知道它们指向同一个零件,并且知道轴承属于旋转件、与轴是装配关系、常见失效模式有疲劳剥落和磨损等。有了本体,模型看数据就不再是盲人摸象,而是带着一份“工业地图”去理解每个数字背后的真实含义。同时,数据也能按照本体整理成模型爱吃的“营养餐”。所以说,本体就是模型和数据之间的翻译官与粘合剂,没有它,数据再大也是散的,模型再强也是空的。
对于普通企业来说,实现“模数共振”并不需要一上来就搞全厂大模型。最好的策略是“从小到大”:先选一个高频刚需的小场景,比如工艺参数优化、缺陷检测或设备预测维护,场景小,数据边界清晰,效果也好衡量。在启动项目前,花几天时间把该场景的核心概念、关系和属性梳理出来——比如做刀具寿命预测,就要理清“刀具—工件材料—切削参数—磨损量”之间的关系图,这不复杂但极其关键。更重要的是,不要等数据完美了再上模型,也不要等模型调好了才开始治理数据。让模型在实际应用中暴露问题,反过来指导数据治理;数据治理中发现的新结构,及时更新本体。两者互相促进,越转越快。大多数企业不必什么都自己干,政策也在鼓励建设“模数共振空间”和创新联合体,找一家能提供“数据+模型+场景”一体化服务的合作伙伴,往往比单买模型或单买数据服务更有效。
制造业的智能化走到今天,最大的障碍已经不是技术,而是我们思考问题的方式。我们习惯把复杂问题拆成一个个独立变量——数据归数据,模型归模型,场景归场景,各找各的供应商,各定各的KPI。但工业系统本身就是环环相扣的:工艺参数相互牵制,设备状态影响质量,生产节拍关联能耗……没有一个环节可以单独“变聪明”。“模数共振”想传达的就是这个朴素的道理:模型和数据不是两条赛道,而是一个飞轮的两片桨叶,只有同时划动,船才能往前走。对于正在规划智能化路线的企业,与其争论“先有模型还是先有数据”,不如问问自己:我的业务知识有没有被真正沉淀成机器能懂的“本体”?我的数据有没有被模型真正“理解”?