开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 211|回复: 5
收起左侧

[易语言] 这种文本怎么取

[复制链接]
结帖率:88% (14/16)
发表于 2025-10-31 12:18:45 | 显示全部楼层 |阅读模式   湖南省邵阳市
9精币
4.3 入围业绩要求:</span><span    style=\"font-family:宋体; background-color:#ffffff\">□不要求类似工程业绩 ☑要求类似工程业绩 </span></p><p      style=\"margin-top:0pt; margin-bottom:0pt; text-indent:21pt; text-align:left; line-height:1.5; widows:2; orphans:2\"><span      style=\"font-family:宋体; background-color:#ffffff\">

我只需要“□不要求类似工程业绩 ☑要求类似工程业绩 ”中带勾框后面的:“要求类似工程业绩”。有时候是前面那个带勾,如“☑不要求类似工程业绩 □要求类似工程业绩 ”,所以需要自动辨识然后获取


回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值
结帖率:100% (1/1)

签到天数: 9 天

发表于 2025-10-31 12:30:00 | 显示全部楼层   江西省南昌市
又是一个跟上次差不多的问题,建议用精易助手,或 等等就好,一堆大神用正则帮你写
回复

使用道具 举报

结帖率:100% (1/1)
发表于 2025-10-31 12:53:45 | 显示全部楼层   浙江省温州市
这段文字中有非中文编码的符号, 所以你不能直接 到文本 来处理.
如果它本身是 UTF-8 编码, 那么可以把它转成UTF-16, 然后以宽文本的方式来处理:
  
窗口程序集名保 留  保 留备 注
窗口程序集_启动窗口   
子程序名返回值类型公开备 注
__启动窗口_创建完毕  
变量名类 型静态数组备 注
宽文本字节集 
正则正则表达式DEELX 
搜索结果搜索结果DEELX0
表达式字节集 
整数型 
结果字节集 
宽文本 = 编码转换 (读入文件 (“0.txt”), #编码_UTF_8, #编码_UTF_16LE, )
表达式 = { 62, 0, 40, 0, 40, 0, 161, 37, 124, 0, 17, 38, 41, 0, 91, 0, 94, 0, 60, 0, 93, 0, 43, 0, 41, 0 }
调试输出 (UTF16到文本 (表达式))
正则.创建W (表达式, )
搜索结果 = 正则.搜索全部W (宽文本, )
计次循环首 (取数组成员数 (搜索结果), 数)
调试输出 (搜索结果 [].取子匹配文本 (1))
结果 = 结果 + 搜索结果 [].取子匹配文本W (1){ 13, 0, 10, 0 }
计次循环尾 ()
如果真 (写到文件 (“结果.txt”, 结果))
执行 ( #打开文件, “结果.txt”, , , )


i支持库列表   支持库注释   
DeelxRegEx(未知支持库)
iconv编码转换支持库
spec特殊功能支持库
shell操作系统界面功能支持库

效果:
0.png
完整例子.zip (1.86 KB, 下载次数: 0)
回复

使用道具 举报

结帖率:88% (14/16)

签到天数: 5 天

 楼主| 发表于 2025-10-31 14:24:23 | 显示全部楼层   湖南省邵阳市
zainex 发表于 2025-10-31 12:53
这段文字中有非中文编码的符号, 所以你不能直接 到文本 来处理.
如果它本身是 UTF-8 编码, 那么可以把它转 ...

我只要打勾了的后面的选项,看你的演示是都取了
回复

使用道具 举报

结帖率:33% (1/3)

签到天数: 6 天

发表于 2025-10-31 14:43:23 | 显示全部楼层   广东省深圳市
关键看你是下载下来的数据还是网页中的数据,如果下载下来的数据,用正则。如果是网页数据,那么就简单了,有队长模块,完全可以判断两个复选框是否哪个被选中,然后提取数据。
回复

使用道具 举报

结帖率:100% (1/1)
发表于 2025-10-31 15:09:28 | 显示全部楼层   浙江省温州市
把表达式改成:
>[^<]*?☑([^<]+)
得到的就是☑后面的内容:
  
窗口程序集名保 留  保 留备 注
窗口程序集_启动窗口   
子程序名返回值类型公开备 注
__启动窗口_创建完毕  
变量名类 型静态数组备 注
宽文本字节集 
正则正则表达式DEELX 
搜索结果搜索结果DEELX0
表达式字节集 
整数型 
结果字节集 
宽文本 = 编码转换 (读入文件 (“0.txt”), #编码_UTF_8, #编码_UTF_16LE, )
表达式 = { 62, 0, 91, 0, 94, 0, 60, 0, 93, 0, 42, 0, 63, 0, 17, 38, 40, 0, 91, 0, 94, 0, 60, 0, 93, 0, 43, 0, 41, 0 }
调试输出 (UTF16到文本 (表达式))
正则.创建W (表达式, )
搜索结果 = 正则.搜索全部W (宽文本, )
计次循环首 (取数组成员数 (搜索结果), 数)
调试输出 (搜索结果 [].取子匹配文本 (1))
结果 = 结果 + 搜索结果 [].取子匹配文本W (1){ 13, 0, 10, 0 }
计次循环尾 ()
如果真 (写到文件 (“结果.txt”, 结果))
执行 ( #打开文件, “结果.txt”, , , )


i支持库列表   支持库注释   
DeelxRegEx(未知支持库)
iconv编码转换支持库
spec特殊功能支持库
shell操作系统界面功能支持库

开始运行被调试程序
* “>[^<]*??([^<]+)”
* “要求类似工程业绩 ”
被调试易程序运行完毕
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

关闭

精易论坛 - 有你更精彩上一条 /2 下一条

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报QQ: 793400750,邮箱:wp@125.la
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备2025452707号) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表