开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 255|回复: 8
收起左侧

[已解决] 求教一个正则的写法

 关闭 [复制链接]
结帖率:79% (11/14)
发表于 6 天前 | 显示全部楼层 |阅读模式   江苏省泰州市
50精币
求教了,一个正则表达式,试了若干次,源文件在文档里面,主要取图片里的
用 <a href="([\s\S]*?)"[\s\S]*?">([\s\S]*?)</a>[\s\S]*?<a href="https://www.cqtieba.com/space-uid-[\s\S]*?.html" c="1">([\s\S]*?)</a>[\s\S]*?<em>[\s\S]*?</em>能取出除了最后一句的所有4个,再加最后一句的,就取出来只有3个,求教了


补充内容 (2025-8-4 16:44):
https://www.cqtieba.com/forum-2-1.html这个网站里面的,需要的是帖子网址,帖子名称,作者和回复者,谢谢大佬们
1754285461345.jpg

最佳答案

查看完整内容

读取全部帖子的信息, 每个成员后面都加了注释来说明, 想要哪些信息, 自己选择即可: [e=1].版本 2 .支持库 RegEx .支持库 internet .支持库 spec .程序集 窗口程序集_启动窗口 .子程序 __启动窗口_创建完毕 .局部变量 地址, 文本型 .局部变量 文本, 文本型 .局部变量 正则, 正则表达式 .局部变量 搜索结果, 搜索结果, , "0" .局部变量 数, 整数型 .局部变量 成员, 文本型, , "8" 地址 = “https:/” + “/www.cqti” + “eba. ...

回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳

结帖率:100% (1/1)
发表于 6 天前 | 显示全部楼层   浙江省温州市
读取全部帖子的信息, 每个成员后面都加了注释来说明, 想要哪些信息, 自己选择即可:
  
窗口程序集名保 留  保 留备 注
窗口程序集_启动窗口   
子程序名返回值类型公开备 注
__启动窗口_创建完毕  
变量名类 型静态数组备 注
地址文本型 
文本文本型 
正则正则表达式 
搜索结果搜索结果0
整数型 
成员文本型8
地址 = “https:/”“/www.cqti”“eba.com/forum-2-1.html”
文本 = UTF8到文本 (HTTP读文件 (地址))
调试输出 (取文本长度 (文本))
正则.创建 (“tbody id=.[^>]+>.+?th class=[^>]+>.+?/a>.+? .a href=.(.+?). .+?t.>(.+?)./a.+?e>.+?f=.(.+?). .+?>(.+?)./a>./c.+?>([^>]+)./s.+?e>.+?f=.(.+?). .+?>(.+?)./a>./c.+?>([^>]+)./[sa]”, )
搜索结果 = 正则.搜索全部 (文本)
调试输出 (取数组成员数 (搜索结果))
计次循环首 (取数组成员数 (搜索结果), 数)
成员 [1] = 搜索结果 [].取子匹配文本 (文本, 1, )  ' 地址
成员 [2] = 搜索结果 [].取子匹配文本 (文本, 2, )  ' 标题
成员 [3] = 搜索结果 [].取子匹配文本 (文本, 3, )  ' 楼主主页
成员 [4] = 搜索结果 [].取子匹配文本 (文本, 4, )  ' 楼主
成员 [5] = 搜索结果 [].取子匹配文本 (文本, 5, )  ' 楼主发帖时间
成员 [5]子文本替换 (成员 [5], “&”“nbsp;”, “ ”, , , )
成员 [6] = 搜索结果 [].取子匹配文本 (文本, 6, )  ' 网友主页
成员 [7] = 搜索结果 [].取子匹配文本 (文本, 7, )  ' 网友
成员 [8] = 搜索结果 [].取子匹配文本 (文本, 8, )  ' 网友发帖时间
成员 [8]子文本替换 (成员 [8], “&”“nbsp;”, “ ”, , , )
' 调试输出 (成员)
调试输出 (“------”)
调试输出 (成员 [1], 成员 [2], 成员 [5], 成员 [8])
调试输出 (成员 [4], 成员 [3], 成员 [7], 成员 [6])
计次循环尾 ()


i支持库列表   支持库注释   
RegEx正则表达式支持库
internet互联网支持库
spec特殊功能支持库

只取用户帖, 将上面正则表达式开头的:
tbody id=.[^>]+>

改成:
tbody id=.n[^>]+>

只取置顶帖, 将表达式开头改为:
tbody id=.st[^>]+>

也就是插入 n 或是 st

评分

参与人数 1荣誉 +1 收起 理由
笨潴 + 1 热心帮助他人,荣誉+1,希望继续努力(*^__^*) 嘻嘻!

查看全部评分

回复

使用道具 举报

结帖率:100% (12/12)

签到天数: 9 天

发表于 6 天前 | 显示全部楼层   江苏省盐城市
可以发TXT文件么

评分

参与人数 1好评 +1 精币 +3 收起 理由
企鹅号525150138 + 1 + 3 YYDS~!

查看全部评分

回复

使用道具 举报

结帖率:98% (58/59)

签到天数: 10 天

发表于 6 天前 | 显示全部楼层   伊朗
文本不发怎么测试?
回复

使用道具 举报

结帖率:100% (1/1)
发表于 6 天前 | 显示全部楼层   浙江省温州市
  
窗口程序集名保 留  保 留备 注
窗口程序集_启动窗口   
子程序名返回值类型公开备 注
__启动窗口_创建完毕  
变量名类 型静态数组备 注
文本文本型 
正则正则表达式 
搜索结果搜索结果0
整数型 
成员文本型4
文本 = #常量1
正则.创建 (“^\s*.a href=.(.+?). [^\n]+?t.>(.+?)./a>.+?>([^\n]+?)./a>./c.+?n>([^\n]+?)./s”, )
搜索结果 = 正则.搜索全部 (文本)
计次循环首 (取数组成员数 (搜索结果), 数)
成员 [1] = 搜索结果 [].取子匹配文本 (文本, 1, )
成员 [2] = 搜索结果 [].取子匹配文本 (文本, 2, )
成员 [3] = 搜索结果 [].取子匹配文本 (文本, 3, )
成员 [4] = 搜索结果 [].取子匹配文本 (文本, 4, )
调试输出 (成员)
计次循环尾 ()


i支持库列表   支持库注释   
RegEx正则表达式支持库
spec特殊功能支持库

0.png
例子.zip (1.7 KB, 下载次数: 2)
回复

使用道具 举报

结帖率:100% (1/1)
发表于 6 天前 | 显示全部楼层   浙江省温州市
  
窗口程序集名保 留  保 留备 注
窗口程序集_启动窗口   
子程序名返回值类型公开备 注
__启动窗口_创建完毕  
变量名类 型静态数组备 注
地址文本型 
文本文本型 
正则正则表达式 
搜索结果搜索结果0
整数型 
成员文本型4
地址 = “https:/”“/www.cqti”“eba.com/forum-2-1.html”
文本 = UTF8到文本 (HTTP读文件 (地址))
正则.创建 (“tbody id=[^\n]+>.+?w.>.+?/a>.+?=.([^\n]+?). [^\n]+?>([^\n]+?)./a>.+?>([^\n]+?)./a>./c.+?>([^>]+?)./s”, )
搜索结果 = 正则.搜索全部 (文本)
调试输出 (取数组成员数 (搜索结果))
计次循环首 (取数组成员数 (搜索结果), 数)
成员 [1] = 搜索结果 [].取子匹配文本 (文本, 1, )
成员 [2] = 搜索结果 [].取子匹配文本 (文本, 2, )
成员 [3] = 搜索结果 [].取子匹配文本 (文本, 3, )
成员 [4] = 搜索结果 [].取子匹配文本 (文本, 4, )
成员 [4]子文本替换 (成员 [4], “&”“nbsp;”, “ ”, , , )
调试输出 (成员)
计次循环尾 ()


i支持库列表   支持库注释   
RegEx正则表达式支持库
internet互联网支持库
spec特殊功能支持库

1.png
回复

使用道具 举报

结帖率:79% (11/14)

签到天数: 2 天

 楼主| 发表于 6 天前 | 显示全部楼层   江苏省泰州市
Ruang 发表于 2025-8-4 13:39
可以发TXT文件么

不好意思,文本挂了
回复

使用道具 举报

结帖率:79% (11/14)

签到天数: 2 天

 楼主| 发表于 6 天前 | 显示全部楼层   江苏省泰州市
zainex 发表于 2025-8-4 15:09
[e=1].版本 2
.支持库 RegEx
.支持库 internet

大佬,用你的怎么调试不了,尴尬了
你能将成员4改成<a  c="1">9929658</a></cite>这个里面的9929658吗,写个例子,好吗,大佬
回复

使用道具 举报

签到天数: 4 天

发表于 6 天前 | 显示全部楼层   重庆市重庆市
通过看评论,都能学到好多知识
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报QQ: 793400750,邮箱:wp@125.la
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备2025452707号) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表