本帖最后由 莫小乐 于 2026-6-5 09:15 编辑

博乐OCR接口开发文档-停更!
一、产品简介
纯本地离线OCR组件,全程无联网、不上传图片、无广告无后门
采用「内存映射传图+本地127.0.0.1:15330 TCP通信」,图片不走网络传输,识别高效安全;自带独立OCR.exe内核,实例化自动拉起服务。
二、生命周期(自动执行)
- _初始化()|类实例化自动运行
- ① 启动同级目录
OCR.exe
- ② 缓存目录:
我的文档\OCR,每次初始化自动清空目录、重建文件夹
- _销毁()|类销毁触发预留
配合关闭()方法,可控停止OCR进程
三、启停接口【公开】
1. 开启() → 逻辑型
- 作用:创建通信窗口、连接本地OCR服务
- 返回:连接成功=真,失败=假;必须开启后才可调用识别
2. 关闭(可选:是否关闭ocr_exe 逻辑型) → 逻辑型
- 参数空/假:仅断开TCP,保留OCR后台进程
- 参数真:发送关闭指令,终止
OCR.exe程序
四、全局配置【公开】
设置(参_线程数量,参_白边,参_最长边缩放,参_文字框置信度,参_文本框置信度,参_文字框倍率)→逻辑型
参数可空,留空自动使用默认配置,全局一次性生效
| 参数名 |
类型 |
默认值 |
说明 |
| 参_线程数量 |
整数型 |
4 |
建议CPU核心×2,提升批量识别速度 |
| 参_白边 |
整数型 |
60 |
图片四边补白,文字贴边识别不全加大数值 |
| 参_最长边缩放 |
整数型 |
1024 |
长边超限自动压缩,0=不缩放 |
| 参_文字框置信度 |
小数型 |
0.5 |
单字识别阈值,漏识别适当调低 |
| 参_文本框置信度 |
小数型 |
0.3 |
文本区域筛选,过滤噪点无效区域 |
| 参_文字框倍率 |
小数型 |
1.5 |
文字边框放大系数,大图可调高 |
五、识别接口【全部公开】
入参统一:图片数据(字节集)+中文解码(逻辑型)
底层采用内存映射传输图像,不通过TCP发送大图;阻塞等待识别结果,异常统一返回:失败
- 单行(图片数据,中文解码)→文本型
单行短图识别,返回纯文本,中文解码=真修复中文乱码
- 多行(图片数据,中文解码)→文本型
整段多行识别,按原图换行返回普通文本
- 多行_JSON原始(图片数据,中文解码)→文本型
返回原生JSON,含坐标、置信、行列原始数据,未做字符转义
- 多行_JSON转义(图片数据,中文解码)→文本型
标准转义JSON,可直接代码解析序列化
- 找字(图片数据,中文解码,查找文字)→文本型
指定关键词检索,返回文字对应坐标+内容
六、部署说明
- 依赖:
OCR.exe必须与主程序放在同一目录
- 临时目录:
我的文档\OCR,程序启动自动清理,无需手动维护
- 通信端口:本地
15330,离线闭环运行,无需密钥、不用联网
七、授权须知
个人自用永久免费;商业使用参照商用定价规则。
八、核心独有优化(区别市面普通OCR-这是旧版只是改了最稳定方法、优化最终的)
本组件内置独家二次数据矫正逻辑,解决原生OCR坐标不准、可信度混乱、字段难读等痛点,无需开发者二次处理数据:
- 智能整行平均可信度计算
市面OCR仅返回「单字可信度」,本行整体精度无法参考;本程序自动遍历当前行所有单字可信度,求和取平均值,更新为整行可信度,识别精度判断更科学、更贴合实际图片效果。
- 自动修正矩形坐标(精准框选)
原生顶点坐标杂乱无规则,无法直接用于贴图、框选、比对;内置算法根据「文字框四点顶点」自动换算标准 X、Y、宽、高 矩形坐标,适配所有截图框选、UI定位场景。
- 全量JSON字段汉化
自动将原生英文字段批量转为中文键名:score→可信度、text→文字、boxes→文字框顶点、rect→矩形位置、SingleTexts→单字列表,开发者阅读、解析、对接更直观。
- 内置文本自动解码、分行格式化
原生UTF8编码自动转GBK中文不乱码,自带整行文本提取算法,自动过滤空行、智能分行,支持自定义分隔符输出。
- 找字结果格式统一优化
自动规整坐标格式,符号统一替换,输出结果干净规范,适配自动化识图、多点找色、精准定位场景。
|