本帖最后由 情殇QAQ 于 2025-12-24 21:57 编辑
q群优先更新版本 118127644
识别模块调用跳转 [更新] qsort|qsncnn飞桨PPOCR-YOLO-ddddocr_精易论坛
如何使用 qsTrainer 训练专属验证码识别模型
1. 软件简介:这是什么工具?
你是否遇到过需要自动识别验证码的场景,却被复杂的编程代码劝退?
qsTrainer 是一款可视化的深度学习训练工具。简单来说,你只需要把收集好的验证码图片交给它,通过简单的鼠标点击设置,它就能训练出一个能自动识别验证码的“大脑”(模型)。
你不需要懂 Python,也不需要写一行代码,就能完成从数据加载到模型导出的全过程。
根据模型和配置文件,Windows下使用DLL进行推理调用,支持32位 64位程序并且可使用GPU预测。后续功能推出http服务端搭建,NCNN预测,预训练模型,数据增强,其他类型开放等等
目前仅开放训练类型不定长验证码
2. 界面功能全解析(看图说话)
根据软件界面,我们将功能分为四个核心区域,请对照软件窗口查看:
2.1 模型配置区
- 模型类型:
- 不定长文本:这是最常用的选项(如截图中所示)。适用于验证码字符数量不固定的情况(比如有时是4位,有时是6位)。
- 其他选项(单分类、滑块、旋转等):针对不同类型的验证码(如拖动滑块或点击图标)。暂未开放
- 卷积网络 / 循环网络:
- 你可以把卷积网络理解为机器的“眼睛”,负责提取图片特征。
- 把循环网络理解为机器的“逻辑记忆”,负责把特征串连成文字。
- 神经元数量 (64):相当于大脑容量,通常保持默认即可,太大了电脑跑不动,太小了记不住。
2.2 图像与标签配置
这一步非常关键,必须根据你实际收集的图片来填写!
- 宽度 / 高度:根据你收集的验证码图片尺寸完全一致。如果长宽不固定,可使用宽度可使用-1将根据高自动设置
- 固定通道数:
- 标签分隔符:
- 软件是通过文件名来学习的。例如图片内容是
ABcd,文件名可能是 ABcd_83729.jpg。
- 如果你的文件名中有下划线
_ 分隔真实值和随机码,这里就要填 _。
2.3 训练配置
这里决定了机器人学习的效率。
- 批大小 (Batch Size):机器一次“一口气”读多少张图。
- 电脑显卡好可以设大点(如64, 128);配置低就设小点(如16, 32)。
- 训练轮数 (Epochs):机器要把所有教材反复复习多少遍。通常 100-200 轮就能达到不错的效果。
- 学习率 (Learning Rate):
- 默认
0.01。如果数值太大,机器学得快但容易“走火入魔”(不收敛);数值太小,学习速度极慢。建议保持默认。
- 目标准确率:设为
0.99 (99%),意味着当机器考试能考99分时,自动停止训练。
2.4 数据集配置
- 添加目录:点击这里,选择你存放验证码图片的文件夹。
- 提取/验证:软件会检查一下图片标签是否合理,并存储标签内容。
3. 傻瓜式操作流程
想要训练一个模型,请按以下步骤操作:
- 准备数据:
- 收集几百到几千张验证码图片。
- 重命名:确保文件名前半部分是验证码的真实内容。例如:
a1b2_xxx.jpg。
- 加载数据:
- 点击【添加目录】,选中图片文件夹。
- 点击【提取/验证】:存储标签内容。
- 参数设置:
- 输入图片的宽、高。
- 选择【模型类型】(一般选“不定长文本”)。
- 【标签分隔符】填
_ (如果你的文件名是用下划线分隔的)。
- 开始训练:
- 点击左下角的 【开始训练】 蓝色按钮。
- 你会看到进度条和日志滚动,等待损失值(Loss)下降,准确率(Acc)上升。
- 导出模型:
- 当准确率满意后,点击 【停止训练】。
- 点击 【导出ONNX】 或 【导出NCNN】。
- 注:ONNX 是通用格式,绝大多数编程语言都可以调用这个文件来识别验证码。
4. 常见问题与专家建议
- Q: 为什么训练一开始准确率就是0?
- A: 别急,机器刚开始是瞎猜的。让它跑个几十轮,如果还是0,检查一下“标签分隔符”是不是填错了,导致机器没读对文件名。
- Q: 需要多少张图片?
- A: 简单的数字验证码,500-1000张通常够了。复杂的扭曲汉字,可能需要上万张。
|