开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 261|回复: 7
收起左侧

[已解决] 问个文本分割思路

 关闭 [复制链接]
结帖率:100% (79/79)
发表于 3 天前 | 显示全部楼层 |阅读模式   浙江省台州市
20精币
想把一本txt小说按章节分割,但是它规律不一样(章节标题前不一定就是空行,中间内容有时也有空行,章节有的是中文,有的是数字,到后面又加上了第几部,然后又变成了第几节),怎么做到一次分割完成,如:

第一章 裟婆世界

内容内容内容内容...

内容内容内容内容内容内容内容...
第二章 譬如火宅

内容内容内容...
内容内容内容内容内容内容内容...

内容内容内容内容....

第3章 修罗场
内容...
内容内容内容内容....
内容内容内容内容内容....

第四章 地狱变相
内容内容...
内容内容内容...
第二部第十七章 孤军奋战2

内容内容...内容内容...
内容内容...
第二部第十八节 孤军奋战3

内容...内容内容...内容
内容...内容内容...内容内容...内容

最佳答案

查看完整内容

先前提交的内容是贴的代码,还没有放出来。再次提交,.e文件试试。 思路: 1、正则匹配到章节名; 2、用子文本替换来替换小说文本内容,在章节名前面加分隔符,如:#----分隔符----# ; 3、文本分割分隔符:#----分隔符----#,得到章节内容;

回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值

签到天数: 1 天

发表于 3 天前 | 显示全部楼层   四川省泸州市
先前提交的内容是贴的代码,还没有放出来。再次提交,.e文件试试。

思路:
1、正则匹配到章节名;
2、用子文本替换来替换小说文本内容,在章节名前面加分隔符,如:#----分隔符----# ;
3、文本分割分隔符:#----分隔符----#,得到章节内容;




小说分割.e

958.5 KB, 下载次数: 4

自行引用精易模块

点评

改下小说路径,txt文件需要是UTF8编码的,其他编码的,需要你自己处理下。   四川省泸州市  发表于 前天 00:40

评分

参与人数 1精币 +3 收起 理由
kingtt + 3 虽然正则语法不对,已自己解决,感谢提供思路和你的热心

查看全部评分

回复

使用道具 举报

结帖率:100% (16/16)
发表于 3 天前 | 显示全部楼层   广东省广州市
试试正则吧 但是内容如果有相似的 还是有几率多分割一次的
回复

使用道具 举报

结帖率:70% (7/10)
发表于 3 天前 | 显示全部楼层   广西壮族自治区梧州市
你这么一说,我就想到我朋友之前被骗了,一个人说看小说自动赚米,然后卡号需要收费,朋友傻乎乎的就买了几个 然后挂起来是易语言的自动看小说,我当时人嘛了,这 这 也行?果然学多知识 逻辑 分析 是好的 !!!!!!
回复

使用道具 举报

结帖率:100% (79/79)
 楼主| 发表于 3 天前 | 显示全部楼层   浙江省台州市
白宝宝 发表于 2025-9-28 18:50
你这么一说,我就想到我朋友之前被骗了,一个人说看小说自动赚米,然后卡号需要收费,朋友傻乎乎的就买了几 ...

我不是,我是下载了txt小说,分割后转成语音自己听
回复

使用道具 举报

签到天数: 1 天

发表于 3 天前 | 显示全部楼层   四川省泸州市
分割思路:
  • 先正则匹配到章节名,得到章节名数组;
  • 然后 子文本替换 章节名,在章节名前面加一个容易识别的分隔符,比如“--------”;
  • 通过上一步分隔符,分割文本,得到章节内容 的数组。

  
子程序名返回值类型公开备 注
_按钮1_被单击  
变量名类 型静态数组备 注
正则正则表达式 
小说文本文本型 
章节名数组文本型0
i整数型 
新小说内容文本型 
章节内容数组文本型0
小说文本 = UTF8到文本 (读入文件 (“小说.txt”))  ' 小说.txt是UTF8编码,如果是其他编码,自行处理
正则_匹配批量 (小说文本, 章节名数组)
新小说内容 = 小说文本
计次循环首 (取数组成员数 (章节名数组), i)
如果真 (i > 1)
新小说内容 = 子文本替换 (新小说内容, 章节名数组 [i], “--------” + 章节名数组 [i], , 1, )

计次循环尾 ()
章节内容数组 = 分割文本 (新小说内容, “--------”, )
调试输出 (章节内容数组)
子程序名返回值类型公开备 注
正则_匹配批量整数型 本子程序采用【精易编程助手】生成。成功返回匹配的数量,失败返回0。
参数名类 型参考可空数组备 注
源文本文本型欲被匹配的文本
返回数组文本型
变量名类 型静态数组备 注
局_正则正则表达式类此类为精易模块里面的正则类,精易模块下载地址:http://ec.125.la/
局_匹配数整数型 
局_计次整数型 
局_子匹配数整数型 
如果真 (局_正则.创建 (“^第[一二三四五六七八九十0-9]+[章部][\s\S]+?$”, 源文本, 假, 真, 真, ))
信息框 (“正则创建失败,请检查正则表达式语句是否有误!”, #错误图标, , )
返回 (0)
局_匹配数 = 局_正则.取匹配数量 ()
如果真 (局_匹配数 = 0)
信息框 (“匹配失败,请检检查正则语句是否有误,数量:0”, #错误图标, , )
返回 (0)
局_子匹配数 = 局_正则.取子匹配数量 ()
计次循环首 (局_匹配数, 局_计次)
加入成员 (返回数组, 局_正则.取匹配文本 (局_计次, ))
计次循环尾 ()
返回 (局_匹配数)


i支持库列表   支持库注释   
RegEx正则表达式支持库
spec特殊功能支持库

回复

使用道具 举报

结帖率:100% (79/79)
 楼主| 发表于 前天 08:02 | 显示全部楼层   浙江省台州市
许七分 发表于 2025-9-29 00:37
先前提交的内容是贴的代码,还没有放出来。再次提交,.e文件试试。

思路:

麻烦请改一下正则,匹配失败
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

关闭

精易论坛 - 有你更精彩上一条 /1 下一条

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报QQ: 793400750,邮箱:wp@125.la
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备2025452707号) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表