2026.06.04征图日记29(差点就跑起通了?)

昨天晚上回寝室的时候发现多了一个人,也是到这边实习的,偏光片部门,他们是学校统一安排出来实习的,一个班都在我们公司,河南技师学院的哥们。这个哥们还散烟给我抽,我没接,让他去阳台抽。之后他就去找他同学去了(只有他一个人分配到我们寝室,他同学都在其他楼层),md他说晚上就去他同学那里睡了,但是他晚上11点半回来把我吵醒了,然后一直在那里说话服了。早上7.20就起来了搞得叮叮咚咚的又把我吵醒了,我真服了!

今天上午一边在看标注,一边在搞推理客户端,因为我的笔记本上缺少一些库,我把代码都放在工控机上编译,编译之后放到有库文件的目录下运行报错:加密狗无权限??问Ai也问不出了所以然来,打算下午再说,现在我要学习这个推理客户端的代码了。
下午再向静姐请教一下这个客户端的使用,完了再问问骏哥无权限的问题,看看能不能跑起来,然后再把webai-lite和推理客户端看能不能通信起来~

下午一直在搞webai-lite和webai-device的通信,

  1. 推理客户端心跳收不到
    现象:客户端日志显示发送了心跳,但服务端看不到
    排查:发现 device_manager_enabled 默认 false,TCP 心跳服务没启动
    修复:.env 加 WEBAI_LITE_DEVICE_MANAGER_ENABLED=true
  2. 任务提交后一直卡着
    现象:心跳收到了,但推理任务状态不变
    排查:HTTP jobs 模块和 TCP device_manager 是两套独立系统,需要桥接
    修复:.env 加 WEBAI_LITE_DEVICE_SUBMIT_BRIDGE_ENABLED=true
  3. 缺少 datumaro 依赖
    现象:任务失败,报 No module named ‘datumaro’
    修复:pip install “datumaro>=1.7,<2”
    附带问题:venv 没正确激活、Python 3.14 没有预编译包需要 Rust 编译器 → 安装 Rust 工具链
  4. 缺少 RESOURCE_ROOT 目录
    现象:FileNotFoundError: 训练下发需要 WEBAI_LITE_DEVICE_MANAGER_RESOURCE_ROOT
    原因:训练代码包(code.zip)需要从这个目录取,然后发给推理客户端执行
    待解决:需要指向实际的模型资源目录

因为mac上没有resource目录,所以把lite又放在win电脑上跑,而且最折磨的是需要把文件打包传微信,在从另一台电脑上登陆微信下载、解压。git我又没有权限开一个新仓库,又不能把代码上传到我自己的github上面,真的恼火,把lite解压下来就不想管了。

之后就没再搞这个了,就在搞标注

之后解压完了,把前端(npm管理包)和后端(python虚拟环境)的环境重新配置了一下(mac和win不兼容),然后

打算快下班的时候问一下静姐这个客户端怎么弄,还有我觉得骏哥给我的这个客户端并没有改好,还是webAi2.0那一套。

本来一切都通了,文件也正常上传,但是最后启动推理线程的时候,找不到推理代码,可能是客户端的处理方式没有同步,那就以后再说吧,先把服务端和前端完善一下。把客户端的代码看看之后再去找改客户端代码的同事对齐一下

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
# 文件正常上传
[2026-06-04 16:25:43,913 | DEBUG] shared memory create success, key: qipc_sharedmemory_webaishm8272b13e190ab58e117bc74967d29f6662a11fa9
[2026-06-04 16:25:43,953 | DEBUG] Connected to192.168.25.132:8002
[2026-06-04 16:27:13,953 | DEBUG] Sent heartbeat to192.168.25.132:8002
[2026-06-04 16:27:40,404 | DEBUG] Socket disconnected The remote host closed the connection
[2026-06-04 16:27:50,998 | DEBUG] Connected to192.168.25.132:8002
[2026-06-04 16:28:00,680 | DEBUG] HTTP request: GET /api/device/info HTTP/1.1
[2026-06-04 16:28:01,056 | DEBUG] HTTP request: GET /api/data/exists?type=train&hash=5bb0357035eb8f2553e6a0f9d916e657 HTTP/1.1
[2026-06-04 16:28:02,262 | DEBUG] folder create success:D:/webai_data/training/92bc1978-8321-4751-93de-3fcc5d651758
[2026-06-04 16:28:03,203 | DEBUG] success to open file for writing: D:/webai_data/training/92bc1978-8321-4751-93de-3fcc5d651758/code.zip
[2026-06-04 16:28:04,403 | DEBUG] success to open file for writing: D:/webai_data/training/92bc1978-8321-4751-93de-3fcc5d651758/config.zip
[2026-06-04 16:28:05,404 | DEBUG] success to open file for writing: D:/webai_data/training/92bc1978-8321-4751-93de-3fcc5d651758/sample_export.zip
[2026-06-04 16:28:15,472 | DEBUG] Failed to connect to192.168.25.132:8005
[2026-06-04 16:28:15,515 | DEBUG] unzip: D:/webai_data/training/92bc1978-8321-4751-93de-3fcc5d651758/code.zip success
[2026-06-04 16:28:15,520 | DEBUG] unzip: D:/webai_data/training/92bc1978-8321-4751-93de-3fcc5d651758/sample_export.zip success
[2026-06-04 16:28:15,520 | DEBUG] unzip: D:/webai_data/training/92bc1978-8321-4751-93de-3fcc5d651758/config.zip success
[2026-06-04 16:28:25,530 | DEBUG] Failed to connect to192.168.25.132:8005
[2026-06-04 16:28:25,582 | DEBUG] training process start success
[2026-06-04 16:28:37,171 | DEBUG] Failed to connect to192.168.25.132:8005
[2026-06-04 16:28:47,275 | DEBUG] Failed to connect to192.168.25.132:8005
[2026-06-04 16:28:47,310 | DEBUG] Last clean time: 周四 6月 5 17:03:47 2025
[2026-06-04 16:28:47,310 | DEBUG] Now time: 周四 6月 4 16:28:47 2026
[2026-06-04 16:28:47,310 | DEBUG] Diff day: 364
[2026-06-04 16:28:47,310 | DEBUG] Diff sec: 31447500
[2026-06-04 16:28:47,409 | DEBUG] train data outdate size: 1
[2026-06-04 16:28:47,442 | DEBUG] infer data outdate size: 1
[2026-06-04 16:28:53,967 | DEBUG] Sent heartbeat to192.168.25.132:8002

# 这里是客户端找不到对应的训练代码,但其实已经传上去了,只是路径不一样
[2026-06-04 16:28:27,135 | INFO] process error output:D:\FS-AIVision_v2.0.0\webaiclient\python_venv\python.exe: can't open file 'D:/webai_data/training/92bc1978-8321-4751-93de-3fcc5d651758//code/main.pyc: [Errno 2] No such file or directory


[2026-06-04 16:25:43,750 | ERROR] Failed to open config file./ini.json
[2026-06-04 16:28:00,688 | ERROR] Failed to open config file./ini.json
[2026-06-04 16:28:15,472 | ERROR] Failed to connect to message server
[2026-06-04 16:28:25,530 | ERROR] Failed to connect to message server
[2026-06-04 16:28:27,164 | ERROR] Script failed with exit code:2and error message:Failed to open error.json file
[2026-06-04 16:28:27,164 | ERROR]
[2026-06-04 16:28:27,164 | ERROR] Failed to open error.json file
[2026-06-04 16:28:37,171 | ERROR] Failed to connect to message server
[2026-06-04 16:28:37,172 | ERROR] Failed to open error.json file
[2026-06-04 16:28:37,263 | ERROR] 92bc1978-8321-4751-93de-3fcc5d651758training fail! # 最终推理失败
[2026-06-04 16:28:47,275 | ERROR] Failed to connect to message server

不是也没人告诉我需要最新的客户端啊。给我的代码是最新的,编译出来的exe也是最新的,但是那些dll不是最新的,导致有些接口没有对齐。我套了,明天再说吧~


今日工作内容

  1. 定位并修复 Windows 局域网访问时笔刷/多边形/矩形工具不可用的 bug。根因:crypto.randomUUID() 仅安全上下文可用,非 localhost 访问时 maskObjectManager.createNew() 抛 TypeError
  2. 将推理客户端在工控机上跑起来,并成功发送心跳包到webai-lite
  3. 样本标注6张,样本清洗360张

下阶段计划

  1. 继续标注
  2. 下载推理客户端最新安装包
  3. 熟悉推理客户端代码,优化webai-lite