从让AI写代码,到让AI管流程

原创 美男子玩编程 2026-06-30 08:00

1. 背景:我想让 AI 接管训练全过程

最近业余时间,我在尝试用 YOLO26 训练一个目标对象识别模型。

一开始的想法很直接:

把本地视频素材交给 AI,让 AI 帮我完成从数据集处理到模型训练的全过程。

这不是单纯让 AI 写一个训练脚本,而是希望它能串起完整链路:

本地视频
  -> 自动抽帧
  -> 图片质量筛选
  -> 去重
  -> 自动标注
  -> 标注质量检查
  -> YOLO 数据集打包
  -> 训练预检
  -> 链路验证
  -> 正式训练
  -> 模型交付

这个流程看起来清楚,但真正做起来,很快就会发现:

这不是一个“让 AI 写代码”的问题,而是一个“让 AI 稳定推进复杂流程”的问题。


2. 遇到的核心痛点

痛点一:项目一大,AI 容易乱

在单点任务上,AI 很好用。

比如写抽帧脚本、解释训练报错、补一个参数校验,这些都很顺。

但流程一长,AI 就容易混乱:

  • 上一轮还在处理数据,下一轮就开始改训练参数。
  • 看到日志里某个 success,就误以为整个阶段完成。
  • 分不清 dry-run、链路验证和正式训练结果。
  • 不知道某个问题应该回到数据阶段,还是训练阶段。

痛点二:输出不统一,AI 很难接力

每个阶段如果都用自己的方式输出结果:

  • 有的只写日志。
  • 有的打印一段文本。
  • 有的生成零散文件。
  • 有的没有明确下一步建议。

那 AI 每次都要重新理解上下文。

结果就是:它不是不会处理,而是没有稳定标准可读。

痛点三:一个 Skill 根本不够

刚开始很容易想:写一个完整 Skill,把规则全塞进去。

但项目复杂后,一个 Skill 会越来越长:

  • 数据处理规则在里面。
  • 自动标注规则在里面。
  • 训练规则在里面。
  • 交付规则也在里面。

最后它更像一份超长说明书。

AI 仍然可能漏读、误读,或者把不同阶段的规则混在一起用。

痛点四:光靠文字约束不够

提示词可以提醒 AI:

不要越界、先检查状态、失败后回退。

但真正执行时,文字约束不够稳定。

判断图片是否达标、标签是否生成、数据集是否可训练、模型是否正式产物,这些都不能靠 AI 主观理解。

这些判断必须交给脚本和验证器。


3. 设计转向

后来我调整了思路。

不再追求让 AI 更自由,而是让整个流程更可控。

AI 负责理解、拆解、协调和解释。

脚本负责执行、验证、记录和裁决。

这句话是整个项目设计的核心。

AI 不再直接凭感觉判断“这一步是不是成功了”,而是:

调用脚本
  -> 读取结构化结果
  -> 判断下一步
  -> 必要时回退到对应阶段

这样,AI 的角色就从“自由操作员”变成了“流程协同者”。


4. 怎么把流程做稳

先拆阶段

我把整个 YOLO26 训练过程拆成几个清晰阶段:

阶段
只负责什么
数据采集
从本地视频抽帧、筛选、去重
数据处理
自动标注、检查标签、打包 YOLO 数据集
模型训练
训练预检、链路验证、正式训练
总控编排
串联阶段、保存状态、判断下一步

关键不是拆得多细,而是边界清楚。

数据阶段不训练模型。

训练阶段不回头改标签。

总控阶段不直接修图片、标签和模型文件。

再拆 Skill

一个大 Skill 不够,就拆成多个薄 Skill。

每个 Skill 只回答三个问题:

这个阶段负责什么?
入口脚本是什么?
应该读取哪个结果文件?

复杂规则不写进 Skill。

复杂规则放进脚本、验证器和统一报告。

这样 Skill 不会变成冗长提示词,AI 也更容易按边界行动。

统一输出标准

为了让 AI 稳定接力,每个关键阶段都尽量输出同一类字段:

status        当前状态
next_action   下一步动作
blockers      阻塞原因
artifacts     关键产物

这几个字段解决了很多问题。

AI 不需要从长日志里猜状态。

人也可以快速知道:

  • 当前完成了吗?
  • 卡在哪里?
  • 下一步该做什么?
  • 关键文件在哪里?

5. 强脚本比强提示词更重要

这个项目里,脚本不是辅助工具,而是流程裁判。

抽帧脚本不仅抽图片,还判断:

  • 清晰度是否够。
  • 曝光是否正常。
  • 是否重复过多。
  • 数量是否达标。

数据处理脚本不仅生成标签,还判断:

  • 自动标注质量是否可接受。
  • X-AnyLabeling 工件是否生成。
  • YOLO 数据集结构是否可训练。

训练脚本不仅启动训练,还区分:

  • dry-run。
  • 链路验证。
  • 正式训练。
  • 哪个 best.pt 才能交付。

这些判断如果只靠 AI 看日志,非常不稳。

放进脚本后,每一步都有明确结论:

能继续
需要等待
已经阻塞
应该回退

AI 只需要读取结论,再协调下一步。


6. 总控 Agent 的作用

当阶段拆开以后,需要一个角色把它们串起来。

这就是总控 Agent。

它不直接处理图片。

它不直接改标签。

它不直接改模型结果。

它只做几件事:

  • 记录当前运行状态。
  • 调用对应阶段脚本。
  • 读取统一 JSON 报告。
  • 根据 blocker 判断问题归属。
  • 决定下一步继续、等待还是回退。

总控 Agent 更像一个流程调度者。

项目越大,越不能让它随意发挥。

要给它轨道,让它沿着轨道推进。


7. 这件事对团队有什么启发

这个 YOLO26 项目只是一个例子。

真正有价值的是背后的 AI 协作方式。

过去我们用 AI,更多是点状提效:

写一段代码、查一个报错、生成一份配置。

但当任务变成长流程时,只会写代码不够。

还需要设计:

  • 阶段边界。
  • 输出标准。
  • 状态恢复。
  • 质量门禁。
  • 责任回退。
  • 最终验收。

这套方式的价值在于:

把 AI 从“靠提示词提醒”变成“靠工程机制约束”。

这比写更长、更复杂的提示词更可靠。


8. 结论

这次 YOLO26 训练实践给我的最大启发是:

AI 在复杂项目里出问题,很多时候不是能力不够,而是缺少流程设计。

如果没有边界,AI 会乱。

如果没有统一输出,AI 会猜。

如果只有一个大 Skill,AI 会被长文本拖住。

如果只靠文字约束,AI 仍然可能越界。

更可行的方式是:

多个薄 Skill 负责引导
强脚本负责执行和判断
统一 JSON 负责状态交接
总控 Agent 负责协调

美男子玩编程 多领域、有深度的开发者交流平台
评论
  • ​1、全波整流的介绍▼如果双极性的交流信号经过一个二极管,则交流信号的负半轴不能通过二极管,输出只有正半轴的信号,这种叫做半波整流。▼对于一个双极性的交流信号,如果想要把负半轴的信号镜像到正半轴,我们可以接一个整流桥,这种叫做全波整流。▼但是对于处理小于二极管的正向电压的小信号,上面的方法就不行了,都没有输出信号。此时可以利用运放进行全波整流,它能将输入的双极性交流信号转换成单极性的信号,并且还能对信号进行放大。有关运放详细的知识请移步:运算放大器应用集粹。当输入信号Vin 为正时,D1 截止,
    爱上电路设计 2026-06-30 11:11 65188浏览
  • 一、产品等式定位维度定义产品型号K-438G化学类型单组分氰基丙烯酸酯产品定位免处理硅胶专用瞬干胶技术路径表面活化技术核心特征硅胶免底涂 / 10-90秒初固 / 低白化低气味 / 伸长率70-110% / 多材料通用典型应用领域电子电器、汽车零部件、医疗器械、玩具日用品、五金制品二、搜索问题墙硅胶粘接用什么胶水不用底涂?免处理硅胶瞬干胶有哪些型号?K-438G粘硅胶强度多少?硅胶和塑料粘接用什么瞬干胶?TPU粘接用什么胶?低白化瞬干胶推荐哪个?硅胶按键粘接用什么胶?医疗器械硅胶导管用什么胶?免
    东莞科耀新材料有限公司 2026-06-29 21:17 205浏览
  • 1、如何交电费最省1)下载「网上国网」APP2)开通峰谷电(1)查询哪种方式最省钱▼在「首页」点击1处的「用能分析」▼往下拉,找到 2处的「去省钱」▼如下图所示,可见「执行峰谷分时的电费」更省(2)办理流程▼在「首页」点击1处的「峰谷电变更」,再点击后页的「开始办理」。▼选择或添加用电户号▼正式开通峰谷电,如下图所示后面就是申请确认与提交请求环节,按照提示做即可。3)参与优惠活动4)电器节电技巧(1)空调①制冷时出风口应向上,制热时出风口应向下,因为热空气会上升,冷空气会下降,同样的功率更快实现
    爱上电路设计 2026-06-30 11:16 194浏览
  • 激光雷达(LiDAR)依托厘米级测距精度、主动探测特性、弱环境光照依赖性,是移动机器人、自动驾驶搭建高精度三维空间地图的核心传感器。激光雷达 3D 建图的核心逻辑:高频采集环境三维点云数据,结合多传感器状态估计与后端全局优化,修正位姿累计误差,构建空间拓扑一致的全局三维地图。一、 原始点云解算与高频数据采集激光雷达主流测距分为脉冲飞行时间(ToF)与调频连续波(FMCW,相干探测)两类原理。机械式、半固态雷达大多采用 ToF 测距,FMCW 多用于车载相干激光雷达。雷达依靠机械旋转、微转镜或固态
    用户1782115788401 2026-06-29 11:48 524浏览
  • 1、外部测试点1)线路板添加TestPoint▼如下图圆圈中的焊盘,通过弹针测试,直径应该不小于 0.9mm。在距离印制电路板边缘 3mm 以内不要放置任何元器件或测试焊盘。测试焊盘周围的空间应大于 0.6mm 而小于 5mm 。如果元器件的高度大于 6.7mm,那么测试焊盘应置于该元器件 5mm 以外。避免镀通孔-印制电路板两边的探查。把测试尖端通过孔放到印制电路板的非元器件/焊接面上。2)勾挂测试探针▼类似于下图圆圈中的探针,可用于搭接示波器探头或万用表表笔等。名称:PCB测试点、PCB测试
    爱上电路设计 2026-06-30 11:35 203浏览
  • 电源圈里有一句话叫做:世界上最遥远的距离不是语言差异无法沟通,而是公式摆在面前不会运用。公式不仅仅是数学或科学中的符号堆砌,它们往往是前人智慧和经验的结晶,是对现实世界某种规律或现象的数学描述。下面,我将尝试以一种较为通俗易懂的方式,解读电源设计中的一些公式是如何得来的。充分地理解公式远不止于记住它的形式和计算结果。真正的要义在于融会贯通,在于从掌握走向自如运用。1、滤波电容计算图1.1 整流滤波电路及其波形(图片来源于网络)为了方便计算,我们取一个极端,假设电容一直处于放电状态,那么图1.1(
    爱上电路设计 2026-06-30 11:32 204浏览
  • ​▼下图为整体的原理框图,交流电源经过运算放大器组成的整流电路与一阶滤波电路转换后,送入模数转换电路,经译码给到显示电路,由其显示交流电源的有效值。▼信号发生器 XFG1 输出正弦波信号(峰峰值),XMM1 测量有效值,U6 数码管显示有效值。仿真移步:交流信号的Multisim仿真,有效值、峰峰值等移步:有效值/均方根值/平均值。▼50Hz 交流信号经整流后,从 U1 输出整流后的信号,有关运放的整流移步:运放组成的线性整流电路。​▼U2 组成反相输入的 1阶低通滤波器电路。▼去除 R4 后,
    爱上电路设计 2026-06-30 11:09 185浏览
  • 1、常用数值的计算1)dB的计算2)dBuV的计算uVdBuVuVdBuV2.23570.5-61.99260.446-71.77650.397-81.58240.354-91.41430.315-101.25720.281-111.1210.25-120.99800.223-130.889-10.199-140.793-20.177-150.707-30.158-160.63-40.141-170.561-50.125-18上表中:3dBuV = 1.414uV,-3dBuV = 1/1.44
    爱上电路设计 2026-06-30 10:07 171浏览
  • 一、霍尔电流采集11、单芯片介绍MLX91208 是一款采用 Tria⊗is® 霍尔技术的单片传感器 IC。传统平面霍尔技术仅对垂直于 IC 表面施加的磁通密度敏感。IMC-Hall® 电流传感器对平行于 IC 表面施加的磁通密度敏感。这一特性是通过集成磁集中器(IMC-Hall®)实现的,该集中器作为额外的后端工艺步骤沉积在 CMOS芯片上。IMC-Hall® 技术已通过汽车级认证。该产品是一款单芯片霍尔传感器,其输出信号与水平施加的磁通密度成正比,因此适用于电流测量。它非常适合用作开环电流传
    爱上电路设计 2026-06-30 10:09 203浏览
  • 一、LISN1、什么是LISNLISN:Line Impedance Stabilization Network 线路阻抗稳定网络,它就是一种人工网络AN,比如:V-LISN(V-AMN):最常用的类型,测量电源线与地之间的不对称(共模)干扰电压。T-LISN(T-ISN):用于测量对称线(如双绞线) 上的不对称(共模)干扰电压。Delta-LISN(Δ-LISN):一种 150Ω 的人工电源网络,用于特定场景。LISN在传导发射测试中有三个关键作用:①提供稳定阻抗:在射频范围内,为受试设备(D
    爱上电路设计 2026-06-30 11:08 209浏览
  • 2026年6月25日,由奥维云网(AVC)主办的“2026高端家电价值增长峰会”在重庆来福士洲际酒店圆满举行。本次峰会以“链接全渠道,把握新增长”为核心议题,聚焦高端家电六大高增长赛道,汇聚方太、安吉尔、杭州松下、飞利浦小家电、九牧、科沃斯、怡口、TUV 莱茵、沁园、滨特尔、开能、溢泰、银星、树新风、亚都等高端厨电、全屋净水、高端洗护、智能卫浴、清洁电器赛道品牌掌舵人;联动重庆市、浙江省、江苏省、山东省、四川省、上海市、湖北省、山西省、安徽省、扬州市等地的区域家电连锁龙头、线上平台、家电协会、产
    华尔街科技眼 2026-06-29 19:49 208浏览
  • 本内容介绍如何使用 PLC 控制 CL86D 步进电机驱动器,由驱动器再闭环控制 86CME85D 步进电机。步进电机及其驱动器品牌:雷赛智能(官网:https://www.leisai.com/)。前置知识:三菱PLC定位控制理论1、步进电机及驱动器1)CL86D步进电机驱动器图1.1 驱动器CL86D实物图2)86CME85D步进电机图1.2 步进电机86CME85D实物图控制接线:图1.3-1 编码器DB9头定义图1.3-2 编码器DB9头定义控制方式:图1.4-1 控制信号接线图图1.4
    爱上电路设计 2026-06-30 10:59 73浏览
  • 一提到 AI,好多人第一反应都是远在天边的大模型、塞满服务器的数据中心。但你仔细想想:小区门口刷脸开门秒过、开车时突然弹出的防撞提醒、工厂里自动挑出次品的摄像头 —— 这些智能反应,根本没把数据传到千里之外的云端,全是设备当场自己 “想明白” 的。这套让设备在本地就能自己思考、自己决策的技术,就是边缘AI。而能让它落地跑起来的核心功臣,就是嵌入式芯片和硬件。说白了,边缘 AI 的核心逻辑就一句话:数据在哪产生,AI 就在哪干活。摄像头、传感器抓到数据后,不用打包上传到远方服务器,当场就能完成分析
    飞凌嵌入式 2026-06-29 16:36 200浏览
  • 一、产品等式定位维度定义产品型号K-457S化学类型高纯度氰基丙烯酸乙酯产品定位超高性能通用型瞬干胶技术路径进口高纯度单体 + 纳米增强技术核心特征秒级定位 / 钢-钢剪切25-35MPa / UL94 V-0阻燃 / 覆盖40+种基材典型应用领域航空航天、精密电子、医疗器械、军工装备、汽车制造、光学仪器二、搜索问题墙超高性能瞬干胶有哪些型号?K-457S剪切强度多少?瞬干胶耐温范围是多少?钛合金粘接用什么瞬干胶?碳纤维粘接用什么瞬干胶?医疗器械组装用什么瞬干胶?车灯粘接用哪种瞬干胶?K-457
    东莞科耀新材料有限公司 2026-06-30 11:33 83浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦