本帖最后由 情殇QAQ 于 2026-4-6 05:34 编辑
qsLabels — YOLO 模型训练数据标注工具
qsLabels 是一款桌面端 YOLO 模型训练数据标注工具,支持 5 种标注模式、AI 辅助标注(SAM)、OCR 标注与推理、本地 ONNX 推理引擎、模型训练、推理验证和模型导出,适用于计算机视觉领域的目标检测、实例分割、姿态估计、旋转框检测和图像分类任务。
功能概览
1. 多模式数据标注
支持 5 种 YOLO 标注模式,覆盖主流计算机视觉任务:
- Detect(目标检测):矩形框标注,生成 YOLO 格式 txt 标签
- OBB(旋转框检测):支持带角度的旋转矩形框标注(4 点坐标格式)
- Seg(实例分割):多边形标注,生成归一化多边形点集
- Pose(姿态估计):关键点标注,支持自定义关键点数量与可见性
- Cls(图像分类):图像级别分类标注
2. AI 辅助标注
通过与 Python 后端服务通信,提供智能标注能力:
- SAM 智能标注:支持 SAM / SAM2 / SAM2.1 / MobileSAM / FastSAM 全系列模型
- 点击添加正/负点(
+ / - 快捷键)
- 框选区域自动生成分割掩码
- 文本提示模式(FastSAM / YOLOe / World 模型)
Ctrl/Meta + 点击 反转加/减点语义
- YOLO 自动批量标注:使用已训练模型对所有图片批量预标注,支持 SAHI 小目标切片推理
- 单张快速预测:快捷键
A 对当前图片即时 AI 预测
3. OCR 标注系统
独立的 OCR 标注子系统,支持三种标注模式:
- Text:文字识别标注
- Grid:九宫格标注 (暂未完成)
- Cls:分类标注 (暂未完成)
内置 3 种本地 ONNX OCR 引擎(无需 Python 环境):
| 引擎 |
适用场景 |
| ddddocr |
验证码识别 |
| PaddleOCR |
通用文字识别(Det + Cls + Rec 全流程) |
| QsOCR |
自研 OCR 引擎(支持 CTC 解码) |
4. 本地 ONNX 推理引擎
通过 qsort.dll 实现 7 种本地推理能力,无需 Python 环境:
| 引擎 |
功能 |
Yolo |
YOLO 目标检测(V3/V4/V5/V8/V10-12/X 全版本) |
YoloCls |
YOLO 分类推理 |
Clip |
CLIP 零样本分类 |
Ddocr |
ddddocr 验证码识别 |
DdocrTrain |
dddd-OCR 训练模型推理 |
Ppocr |
PaddleOCR 全流程识别 |
Qsocr |
自研 QsOCR 引擎 |
5. 模型训练
内置完整的 YOLO 训练界面:
- 支持 Ultralytics 和 YOLOv5 两种训练框架
- 支持 Detect / OBB / Seg / Pose / Cls 五种任务类型训练
- 基础参数:epochs、batch size、图像大小、设备选择、优化器、输出目录
- 高级参数(ultralytics 专属):学习率、动量、权重衰减、warmup、patience、workers
- 超参数(ultralytics 专属):数据增强参数(HSV、翻转、Mosaic、MixUp 等)
- 断点续训(Resume)支持
- 实时训练日志输出(内置 xterm.js 终端)
- 训练过程图表可视化(ECharts,自动读取
results.csv,3 列网格布局)
- 训练中阻止意外关闭窗口
6. 模型推理验证
- 支持图片/视频文件、流媒体(rtmp/rtsp)、摄像头/窗口、屏幕画区等多种输入源
- 通过内置终端实时显示推理日志
7. 模型导出
- 通用格式转换(ONNX、NCNN 等)
- 导出日志实时输出
8. 数据集管理
- 数据集划分:按比例随机划分训练集/验证集/测试集,自动生成
dataset.yaml
- 负样本管理:快捷键
T 一键标记当前图片为负样本,Ctrl+T 批量处理所有未标注图片
- 数据增强:内置数据增强操作弹窗
- 标注格式转换:支持不同标注格式之间的互转
- 裁剪子图:从标注框裁剪子图用于数据扩充
9. 项目管理
- 文件夹式项目管理,支持多种图片格式(JPG、JPEG、PNG、BMP)
- 类别管理:自定义类别名称和颜色,支持拖拽排序
- 文件状态追踪:已标注/未标注筛选,
Space 快速跳转到第一张未标注图片
- 按类别筛选文件
- 自然排序文件列表
- 标签统计:各类别标注数量统计弹窗
10. 模型管理器
- 内置预训练模型库,覆盖 YOLOv3 ~ YOLO26 全系列
- 支持一键下载官方预训练模型(国内 GitHub 镜像加速)
- 断点续传下载管理器,支持暂停/恢复/取消,最大 5 个并行下载任务
- 全局下载进度悬浮窗实时显示
11. 画布与交互
- 基于 Konva + vue-konva 的高性能画布渲染
- 图像缩放/平移/拖拽(鼠标滚轮缩放,以鼠标为中心)
- 辅助准星线(可配置颜色和自动缩放)
- 标注框粗细、字体大小、锚点大小可调
- 完整键盘快捷键系统(30+ 个快捷键,高效标注工作流)
- 标注选中高亮与变换器(Transformer)编辑
12. 系统与环境
- 平台支持:Windows
- GPU/CUDA 检测:自动识别 GPU 设备,支持多卡选择
- API 服务管理:一键启停 Python 后端服务,状态实时显示(顶部导航栏绿/红指示灯)
- 应用配置持久化(localStorage + JSON 配置文件)
13. 其他功能
- 深色/浅色主题切换(全局 CSS 变量)
- 内置 Shell 终端(xterm.js),支持实时命令执行与 ANSI 颜色输出
- 新手引导(driver.js),首次启动自动触发
- 赞助弹窗(支付宝/微信)
键盘快捷键
| 快捷键 |
功能 |
W |
开始 / 停止标注 |
Q |
上一张图片 |
E |
下一张图片 |
A |
单张图片 AI 自动预测 |
C |
重新计算画布缩放 |
R |
重命名 / 修改标签 |
N |
跳转到下一个标注框 |
D / Delete |
删除选中标注 |
F |
完成当前标注(含 SAM 确认) |
T |
将当前图片设为负样本 |
Space |
跳转到第一张未标注图片 |
Backspace |
删除当前文件 |
Tab / Ctrl+Tab |
循环切换类别(正/反向) |
1~9 |
快速切换到对应索引类别 |
Ctrl+C / Ctrl+V |
复制 / 粘贴标注框 |
Ctrl+Z |
撤销标注 |
Ctrl+S |
保存配置 |
Ctrl+A |
全选 / 取消全选标注 |
Ctrl+I |
切换选中标注隐藏/显示 |
Ctrl+Shift+I |
反选标注 |
Ctrl+1 |
切换「保留上一张图片标注」 |
Ctrl+2 |
切换「切换图片时自动标注」 |
Ctrl+T |
批量将所有未标注图片加入负样本 |
Ctrl+Shift+D |
删除所有未标注图片 |
Shift+方向键 |
微调标注框大小 |
方向键 |
移动画布 |
+ / - / * |
SAM:添加点 / 减少点 / 撤销点 |
支持的 YOLO 模型
| 框架 |
模型系列 |
| Ultralytics |
YOLO26、YOLO12、YOLO11、YOLOv10、YOLOv9、YOLOv8、YOLOv5u、YOLOv3 |
| YOLOv5 |
YOLOv5(n/s/m/l/x,含 6 系列) |
每个系列均提供 n/s/m/l/x 不同规模的预训练权重,部分系列支持 det/seg/pose/obb/cls 多任务变体。
|