本帖最后由 情殇QAQ 于 2026-1-13 03:42 编辑
易语言模块全类型支持GPU调用,群内优先更新版本 118127644
[更新日志] qsTrainer 使用手册
最新版本更新 (v26-01-12)
- 新增:支持 “单分类” 模型训练,适用于简单的图像归类或状态判断。
- 新增:支持 “孪生网络” 训练,适用于图像相似度比对、点选验证码等场景。
- 优化:训练流程进一步简化,提升推理兼容性。
如何使用 qsTrainer 训练专属验证码识别模型
1. 软件简介:这是什么工具?
你是否遇到过需要自动识别验证码的场景,却被复杂的编程代码劝退?
qsTrainer 是一款可视化的深度学习训练工具。简单来说,你只需要把收集好的验证码图片交给它,通过简单的鼠标点击设置,它就能训练出一个能自动识别验证码的“大脑”(模型)。
你不需要懂 Python,也不需要写一行代码,就能完成从数据加载到模型导出的全过程。
根据模型和配置文件,Windows下使用DLL进行推理调用,支持32位 64位程序并且可使用GPU预测。
未来规划:后续将推出HTTP服务端搭建、NCNN预测、预训练模型、数据增强及更多类型支持。
当前支持训练类型:
- 不定长验证码(OCR文本识别)
- 单分类(图像归类/属性判断)
- 孪生网络(图像相似度匹配)
2. 界面功能全解析(看图说话)
根据软件界面,我们将功能分为四个核心区域,请对照软件窗口查看:
2.1 模型配置区
这是机器人的“大脑结构”设定,请根据你的验证码类型选择:
- 模型类型:
- 不定长文本:最常用的选项(如截图所示)。适用于识别字母、数字、汉字组合,且字符数量不固定的情况(比如有时是4位,有时是6位)。
- 单分类 (新增):适用于“做选择题”。
- 场景举例:判断图片是“正向”还是“倒置”;判断图片里是“猫”还是“狗”;判断滑块的缺口形状类别。
- 孪生网络 (新增):适用于“找同款”或“比差异”。
- 场景举例:点选验证码(从一堆图标中找出和目标一样的图标);计算两个滑块缺口的匹配度。
- 卷积网络 / 循环网络:
- 卷积网络:机器的“眼睛”,负责提取图片特征。
- 循环网络:机器的“逻辑记忆”,负责把特征串连成文字(主要用于不定长文本)。
- 神经元数量 (64):相当于大脑容量,通常保持默认即可。太大了电脑跑不动,太小了记不住特征。
2.2 图像与标签配置
这一步非常关键,必须根据你实际收集的图片来填写!
- 宽度 / 高度:必须与你收集的验证码图片尺寸完全一致。
- 小技巧:如果长宽不固定,宽度可填
-1,软件将根据高度自动按比例缩放设置。
- 固定通道数:
- 3:代表彩色图片(RGB)。
- 1:代表灰度图片(黑白)。
- 标签分隔符:
- 软件是通过文件名来学习的。例如图片内容是
ABcd,文件名可能是 ABcd_83729.jpg。
- 如果你的文件名中有下划线
_ 分隔真实值和随机码,这里就要填 _。
2.3 训练配置
这里决定了机器人学习的效率。
- 批大小 (Batch Size):机器一次“一口气”读多少张图。
- 电脑显卡显存大可以设大点(如 64, 128);配置低就设小点(如 16, 32)。
- 训练轮数 (Epochs):机器要把所有教材反复复习多少遍。通常 100-200 轮就能达到不错的效果。
- 学习率 (Learning Rate):
- 默认
0.01。建议保持默认。数值太大容易“走火入魔”(不收敛),数值太小学习速度极慢。
- 目标准确率:设为
0.99 (99%),意味着当机器考试能考99分时,自动停止训练。
2.4 数据集配置
- 添加目录:点击这里,选择你存放验证码图片的文件夹。
- 提取/验证:软件会检查一下图片标签是否合理,并存储标签内容。
3. 傻瓜式操作流程
想要训练一个模型,请按以下步骤操作:
- 准备数据:
- 收集几百到几千张图片。
- 重命名:确保文件名前半部分是真实含义(分类类别或文本内容)。例如:
a1b2_xxx.jpg 或 cat_01.jpg。
- 加载数据:
- 点击【添加目录】,选中图片文件夹。
- 点击【提取/验证】:存储标签内容。
- 参数设置:
- 输入图片的宽、高。
- 关键步骤:根据需求选择【模型类型】(不定长文本 / 单分类 / 孪生)。
- 【标签分隔符】填
_ (如果你的文件名是用下划线分隔的)。
- 开始训练:
- 点击左下角的 【开始训练】 蓝色按钮。
- 你会看到进度条和日志滚动,等待损失值(Loss)下降,准确率(Acc)上升。
- 导出模型:
- 当准确率满意后,点击 【停止训练】。
- 点击 【导出ONNX】 或 【导出NCNN】。
- 注:ONNX 是通用格式,绝大多数编程语言都可以调用这个文件来识别验证码。
4. 常见问题与专家建议
- Q: 为什么训练一开始准确率就是0?
- A: 别急,机器刚开始是瞎猜的。让它跑个几十轮,如果还是0,检查一下“标签分隔符”是不是填错了,导致机器没读对文件名。
- Q: 需要多少张图片?
- A: 简单的数字验证码,500-1000张通常够了。复杂的扭曲汉字或孪生网络匹配,可能需要上万张数据才能达到高精度。
- Q: 什么时候用“孪生网络”?
- A: 当你的验证码任务不是“读出字”,而是“判断两张图是不是一样”或者“从一堆图中找出目标图”时,请务必选择孪生网络。
https://www.123865.com/s/4YjeVv-oF9Dv?pwd=uVLf#
|