方法论框架

双主线 · 6 类结果单位 · 六步方法论

AI 会识别图像，但工厂只接收能负责的结果。本书用双主线框架重建判断：AI 主线解释能力来源，结果主线组织工业成立条件。

双主线框架

AI 主线是能力来源与边界变化的上位解释框架。AI 技术（深度学习 / 基础模型 / 端到端架构）在以下 6 个位置改变了工业视觉的能力边界，但并未改变工业结果进入正式流程的核心要求。

成像增强

低光 / 超分 / 去噪 / 合成数据扩增，改善感知基础

Ch1 Ch2

任务建模

端到端学习替代手工特征，改变从图像到结果的映射方式

Ch3 Ch4 Ch5

数据组织

主动学习 / 弱监督 / 基础模型标注辅助，降低标注成本

Ch3 Ch6

训练验证

类不平衡处理 / 校准 / OOD 检测，保障模型泛化边界

Ch4 Ch5 Ch6 Ch7 Ch8 Ch9

异常托底

重建 / 距离 / 不确定性路线，提供异常识别能力

Ch9 Ch10

系统闭环

数据回流 + 增量再训练 + MLOps，使系统持续可托付

Ch12 Ch14

覆盖口径：全书 65% AI 范式 + 35% 传统方法对照。AI 赋能位置 = 能力改变点；结果成立条件 = 不变量。

结果主线是工业成立条件的下位组织原则。工业视觉任务必须按「结果单位」（而非算法名词）组织——6 类结果单位各有最小结构定义、评估量与接口要求，形成工业成立的下位约束。

核心约束

按结果单位组织（不按模型架构名词）
每类结果单位有最小结构定义（三轴或四元组）
结果必须有接口消费，不能停留在展示层
责任归属清楚：谁的结果、谁的接口、谁的后果
节拍约束 + 稳定性约束 + 漂移容忍带共同决定

组织主线

6 类结果单位（第 4—9 章）
系统结果汇聚 + 仲裁 + 保守回退（第 10 章）
现场采用：APQP 准入 + 部署管控（第 11 章）
长期运行：漂移检测 + PDCA 闭环（第 12 章）
治理 + 评估 + 方法论收束（第 13—15 章）

6 类结果单位

工业视觉系统输出的 6 类正式结果单位。每类结果有独立的最小结构定义、评估量集合与系统接口要求。

状态结果

Ch4

工业对象的正式状态判断（合格 / 不合格 / 待复核 / 分流目标）

最小结构：对象状态 × 置信度 × 动作指令

核心挑战：状态结果 ≠ 分类标签；必须进入放行 / 拦截 / 分流等正式工业动作

评估量： PR / ROC / F1 + 校准曲线 + 风险分层

AI 赋能：基础模型 zero-shot 分类改变采样效率，但不改变校准与责任结构

目标结果

Ch5

工业场景中局部目标的位置、数量与类别形成的可消费对象列表

最小结构：目标列表 × 位置框 × 类别 × 置信度

核心挑战： "找到对象" ≠ "形成可消费对象列表"；NMS / 匹配算法是工程核心

评估量： mAP / AP50 / AP75 + 漏检率 + 误检率

AI 赋能：端到端检测器（YOLO / DETR）改变建模效率，但列表质量仍需工程保障

区域结果

Ch6

工业对象的几何区域占据：掩膜 / 边界多边形 / 占据图

最小结构：区域占据 × 边界 × 连通结构

核心挑战：像素级标注成本高；SAM 等基础模型改变提示方式但不降低语义验证成本

评估量： IoU / Dice / mIoU + 边界偏差 + 连通一致性

AI 赋能： SAM 改变区域标注效率，全景分割改变实例区分能力

几何结果

Ch7

工业量测任务输出的几何量：尺寸 / 角度 / 位姿 / 公差关系

最小结构：参考系 × 几何量 × 约束关系

核心挑战：几何结果必须有参考系定义；亚像素精度与相机标定是传统核心

评估量：重投影误差 / ADD / OKS / 不确定度 + 公差符合率

AI 赋能：端到端关键点 - 位姿网络改变建模路径，但标定链与精度验证不可省略

信息结果

Ch8

从工业对象图像中读取的正式字段：条码 / 字符 / 仪表值 / 绑定记录

最小结构：信息单元五元组（内容 / 绑定 / 时间 / 校验 / 置信度）

核心挑战：信息结果须与正确对象 + 工位 + 时间绑定后才算转化为工业能力

评估量：字符识别率 / 字段准确率 / 首读率 / 写链成功率

AI 赋能： TrOCR / CRNN 改变识别范围，但绑定时序与写链校验是工程主战场

异常结果

Ch9

偏离正态基准的可疑信号：异常分数 / 分类 / 区域 / 正式告警

最小结构：异常四元组（类型 / 区域 / 置信度 / 时间戳）+ 衍生量

核心挑战：保守性判断是首要原则：不确定时倾向触发复核而非放行

评估量： AUROC / AUPRO / PRO + 漏检率 / 误检率 / 复核率

AI 赋能： PatchCore / EfficientAD 改变无监督异常检测能力，但告警责任结构不变

三层链路（全书共用）

所有结果单位共享同一链路骨架：输入图像 → 结果单位空间 → 结果表达空间 → 系统消费空间。第 4—9 章按此链路做下标特化。

𝓘 ──f_θ──▶ 𝓤 ──Γ──▶ 𝓔 ──Λ──▶ 𝓒
│           │          │          │
图像空间    结果单位    结果表达    系统消费
(Image)     (Unit)      (Expr)     (Consume)

特化示例（状态结果）：
𝓘 ──f_θ──▶ U_state ──Γ_s──▶ E_state ──Λ_s──▶ C_state（放行 / 拦截 / 待复核）

特化示例（异常结果）：
𝓘 ──f_θ──▶ U_anom ──Γ_a──▶ E_anom ──Λ_a──▶ C_anom（异常分数 → 正式告警）

𝓘

输入图像空间

原始采集图像，受成像层约束

𝓤

结果单位空间

f_θ 映射输出，6 类结果单位各自定义

𝓔

结果表达空间

Γ 表达算子输出，标注 / 掩膜 / 字段

𝓒

系统消费空间

Λ 消费算子，接口 / 动作 / 流程

六步方法论（可调用工程模板）

六步形成可复用的工程模板：从对象界定到治理收束，每一步有明确的输入、输出与工业判断标准。

对象界定

Ch 1—2

问题定义 → 对象显现 → 后果结构 → 成功标准

结果单位

Ch 3—9

按 6 类结果单位组织任务（不按算法名词）

系统组织

Ch 10

多类结果汇聚 → 仲裁 → 接口消费 → 保守回退

现场采用

Ch 11

APQP 准入 + 部署管控 + 操作员买入

长期运行

Ch 12

漂移检测 + 数据回流 + PDCA 闭环

治理收束

Ch 13—15

ISO/IEC 42001 四体系协同 + 评估方法论闭环

核心判断（第 1 章 + 第 15 章总判断）：AI 改变了结果生成、系统组织、长期演化、治理采信 4 个位置的能力边界，但未改变工业结果必须进入正式流程的核心要求。

查看 15 章学习目标与核心判断