跳到主内容

方法论框架

双主线 · 6 类结果单位 · 六步方法论

AI 会识别图像,但工厂只接收能负责的结果。 本书用双主线框架重建判断:AI 主线解释能力来源,结果主线组织工业成立条件。

双主线框架

AI 主线是能力来源与边界变化的上位解释框架。AI 技术(深度学习 / 基础模型 / 端到端架构)在以下 6 个位置改变了工业视觉的能力边界,但并未改变工业结果进入正式流程的核心要求。

1

成像增强

低光 / 超分 / 去噪 / 合成数据扩增,改善感知基础

2

任务建模

端到端学习替代手工特征,改变从图像到结果的映射方式

3

数据组织

主动学习 / 弱监督 / 基础模型标注辅助,降低标注成本

4

训练验证

类不平衡处理 / 校准 / OOD 检测,保障模型泛化边界

5

异常托底

重建 / 距离 / 不确定性路线,提供异常识别能力

6

系统闭环

数据回流 + 增量再训练 + MLOps,使系统持续可托付

覆盖口径:全书 65% AI 范式 + 35% 传统方法对照。AI 赋能位置 = 能力改变点;结果成立条件 = 不变量。

结果主线是工业成立条件的下位组织原则。工业视觉任务必须按「结果单位」(而非算法名词)组织——6 类结果单位各有最小结构定义、评估量与接口要求,形成工业成立的下位约束。

核心约束

  • 按结果单位组织(不按模型架构名词)
  • 每类结果单位有最小结构定义(三轴或四元组)
  • 结果必须有接口消费,不能停留在展示层
  • 责任归属清楚:谁的结果、谁的接口、谁的后果
  • 节拍约束 + 稳定性约束 + 漂移容忍带共同决定

组织主线

  • 6 类结果单位(第 4—9 章)
  • 系统结果汇聚 + 仲裁 + 保守回退(第 10 章)
  • 现场采用:APQP 准入 + 部署管控(第 11 章)
  • 长期运行:漂移检测 + PDCA 闭环(第 12 章)
  • 治理 + 评估 + 方法论收束(第 13—15 章)

6 类结果单位

工业视觉系统输出的 6 类正式结果单位。每类结果有独立的最小结构定义、评估量集合与系统接口要求。

状态结果

Ch4

工业对象的正式状态判断(合格 / 不合格 / 待复核 / 分流目标)

最小结构: 对象状态 × 置信度 × 动作指令
核心挑战: 状态结果 ≠ 分类标签;必须进入放行 / 拦截 / 分流等正式工业动作
评估量: PR / ROC / F1 + 校准曲线 + 风险分层
AI 赋能: 基础模型 zero-shot 分类改变采样效率,但不改变校准与责任结构

目标结果

Ch5

工业场景中局部目标的位置、数量与类别形成的可消费对象列表

最小结构: 目标列表 × 位置框 × 类别 × 置信度
核心挑战: "找到对象" ≠ "形成可消费对象列表";NMS / 匹配算法是工程核心
评估量: mAP / AP50 / AP75 + 漏检率 + 误检率
AI 赋能: 端到端检测器(YOLO / DETR)改变建模效率,但列表质量仍需工程保障

区域结果

Ch6

工业对象的几何区域占据:掩膜 / 边界多边形 / 占据图

最小结构: 区域占据 × 边界 × 连通结构
核心挑战: 像素级标注成本高;SAM 等基础模型改变提示方式但不降低语义验证成本
评估量: IoU / Dice / mIoU + 边界偏差 + 连通一致性
AI 赋能: SAM 改变区域标注效率,全景分割改变实例区分能力

几何结果

Ch7

工业量测任务输出的几何量:尺寸 / 角度 / 位姿 / 公差关系

最小结构: 参考系 × 几何量 × 约束关系
核心挑战: 几何结果必须有参考系定义;亚像素精度与相机标定是传统核心
评估量: 重投影误差 / ADD / OKS / 不确定度 + 公差符合率
AI 赋能: 端到端关键点 - 位姿网络改变建模路径,但标定链与精度验证不可省略

信息结果

Ch8

从工业对象图像中读取的正式字段:条码 / 字符 / 仪表值 / 绑定记录

最小结构: 信息单元五元组(内容 / 绑定 / 时间 / 校验 / 置信度)
核心挑战: 信息结果须与正确对象 + 工位 + 时间绑定后才算转化为工业能力
评估量: 字符识别率 / 字段准确率 / 首读率 / 写链成功率
AI 赋能: TrOCR / CRNN 改变识别范围,但绑定时序与写链校验是工程主战场

异常结果

Ch9

偏离正态基准的可疑信号:异常分数 / 分类 / 区域 / 正式告警

最小结构: 异常四元组(类型 / 区域 / 置信度 / 时间戳)+ 衍生量
核心挑战: 保守性判断是首要原则:不确定时倾向触发复核而非放行
评估量: AUROC / AUPRO / PRO + 漏检率 / 误检率 / 复核率
AI 赋能: PatchCore / EfficientAD 改变无监督异常检测能力,但告警责任结构不变

三层链路(全书共用)

所有结果单位共享同一链路骨架:输入图像 → 结果单位空间 → 结果表达空间 → 系统消费空间。第 4—9 章按此链路做下标特化。

𝓘 ──f_θ──▶ 𝓤 ──Γ──▶ 𝓔 ──Λ──▶ 𝓒
│           │          │          │
图像空间    结果单位    结果表达    系统消费
(Image)     (Unit)      (Expr)     (Consume)

特化示例(状态结果):
𝓘 ──f_θ──▶ U_state ──Γ_s──▶ E_state ──Λ_s──▶ C_state(放行 / 拦截 / 待复核)

特化示例(异常结果):
𝓘 ──f_θ──▶ U_anom ──Γ_a──▶ E_anom ──Λ_a──▶ C_anom(异常分数 → 正式告警)
𝓘

输入图像空间

原始采集图像,受成像层约束

𝓤

结果单位空间

f_θ 映射输出,6 类结果单位各自定义

𝓔

结果表达空间

Γ 表达算子输出,标注 / 掩膜 / 字段

𝓒

系统消费空间

Λ 消费算子,接口 / 动作 / 流程

六步方法论(可调用工程模板)

六步形成可复用的工程模板:从对象界定到治理收束,每一步有明确的输入、输出与工业判断标准。

1

对象界定

Ch 1—2

问题定义 → 对象显现 → 后果结构 → 成功标准

2

结果单位

Ch 3—9

按 6 类结果单位组织任务(不按算法名词)

3

系统组织

Ch 10

多类结果汇聚 → 仲裁 → 接口消费 → 保守回退

4

现场采用

Ch 11

APQP 准入 + 部署管控 + 操作员买入

5

长期运行

Ch 12

漂移检测 + 数据回流 + PDCA 闭环

6

治理收束

Ch 13—15

ISO/IEC 42001 四体系协同 + 评估方法论闭环

核心判断(第 1 章 + 第 15 章总判断):AI 改变了结果生成、系统组织、长期演化、治理采信 4 个位置的能力边界,但未改变工业结果必须进入正式流程的核心要求。