开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 123|回复: 1
收起左侧

[易语言] 调用google浏览器的PDFium.dll,将pdf转文本,只能识别第一行字

[复制链接]
结帖率:0% (0/2)
发表于 2025-9-5 18:28:32 | 显示全部楼层 |阅读模式   山东省烟台市
5精币
论坛上的pdf转文本模块,在读取有密码的pdf文件时会崩溃。偶尔测试到论坛里有个使用PDFium的模块可以正常打开pdf文件 https://bbs.ijingyi.com/forum.ph ... mp;highlight=PDFium ,但是这个模块只有转换图片的功能,测试做了一下转换文本,但是只能转换一页,求助能转换全部内容!

  
子程序名返回值类型公开备 注
提取PDF文本文本型 
参数名类 型参考可空数组备 注
文件路径文本型
变量名类 型静态数组备 注
文档句柄整数型 
页数整数型 
页面句柄整数型 
文本页句柄整数型 
字符数整数型 
结果文本文本型 
i整数型 
PDF_初始化库 ()
文档句柄 = PDF_打开文档 (文件路径, “”)
如果真 (文档句柄 = 0)
返回 (“”)

页数 = PDF_获取页数 (文档句柄)
结果文本 = “”
计次循环首 (页数, i)
页面句柄 = PDF_加载页面 (文档句柄, i - 1)
如果真 (页面句柄 = 0)
到循环尾 ()

文本页句柄 = PDF_创建文本页 (页面句柄)
字符数 = PDF_获取字符数 (文本页句柄)
如果真 (字符数 > 0)
结果文本 = 结果文本 + 取空白文本 (字符数 × 2)
PDF_获取文本 (文本页句柄, 0, 字符数, 结果文本)

PDF_关闭页面 (页面句柄)
计次循环尾 ()
PDF_关闭文档 (文档句柄)
PDF_销毁库 ()
结果文本 = 编码_usc2到ansi (结果文本)
返回 (结果文本)

PDF.rar

4.05 MB, 下载次数: 1


回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值
结帖率:0% (0/2)
 楼主| 发表于 2025-9-5 20:32:28 | 显示全部楼层   山东省烟台市
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

关闭

精易论坛 - 有你更精彩上一条 /2 下一条

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报QQ: 793400750,邮箱:wp@125.la
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备2025452707号) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表