开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 1113|回复: 8
收起左侧

[已解决] 求一个正侧方式 来分割,不规则的文本

 关闭 [复制链接]
结帖率:98% (152/155)
发表于 2023-5-4 09:23:26 | 显示全部楼层 |阅读模式   重庆市重庆市
14精币
文本内容如下:
黄书楷+JBIBMC+何仁利+2K-4K
孙霞MFWYXY+刘燕+2k-4k
陈登峰+MXXFTM陈开+4K-9K
盛凯+BLDKKG+陈开+5Q~1W
陈玉萍+JFLNKM+张浩+2K-4
艾才军+XHNTOU+曾勤2K~4K
王利军+CJCBDS+王秀英+2k——5k
刘明强+OZWCKB+段玉容2k至4k
蒋昌碧+XKRLHX+曾勤+3K~1万
殷仁江+BNAAJF+曾勤+2K~4K

---------------------------------------
以上内容,正常规则应该是:姓名+注册码+姓名+几K+几K(w)
但是很多用户,他写的时候,就乱写,不规则,导致我不好分割,每行的内容,有没有正侧方式,可以准确的分割,每一行的内容


回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值
结帖率:100% (7/7)

签到天数: 24 天

发表于 2023-5-4 09:23:27 | 显示全部楼层   河北省沧州市

法师3.e

936.64 KB, 下载次数: 7

评分

参与人数 1荣誉 +1 收起 理由
项目部004 + 1 热心帮助他人,荣誉+1,希望继续努力(*^__^*) 嘻嘻!

查看全部评分

回复

使用道具 举报

结帖率:92% (49/53)
发表于 2023-5-4 09:31:21 | 显示全部楼层   吉林省长春市
可以使用正则表达式来识别并分割每一行的内容。以下是一个可以匹配该文本内容的正则表达式:

([\u4E00-\u9FA5]+)\+([A-Z]+)\+([\u4E00-\u9FA5]+)(\d+[kK][-~至]?\d+[kKwW万]?)

该正则表达式使用了中文字符的 Unicode 范围来匹配姓名(即 [\u4E00-\u9FA5]),使用了大写字母的范围来匹配注册码(即 [A-Z]),使用了数字和 k/K 来匹配工资数额,其中可能有连字符、波浪线或万字。

你可以在代码中使用这个正则表达式来进行字符串匹配和分割,以得到每一行的内容。


(AI)
回复

使用道具 举报

结帖率:98% (152/155)

签到天数: 14 天

 楼主| 发表于 2023-5-4 09:48:11 | 显示全部楼层   重庆市重庆市
空竹 发表于 2023-5-4 09:31
可以使用正则表达式来识别并分割每一行的内容。以下是一个可以匹配该文本内容的正则表达式:

([%u4E00-%u9 ...

略有缺陷,每行内容,不一定都是写的+号来分割
回复

使用道具 举报

结帖率:100% (7/7)

签到天数: 24 天

发表于 2023-5-4 10:02:24 | 显示全部楼层   河北省沧州市
([\u4E00-\u9FA5]+).([A-Z]+).([\u4E00-\u9FA5]+).+(\d+[kKQq][-~至—]+\d+[万kKwW]?)
回复

使用道具 举报

结帖率:100% (7/7)

签到天数: 24 天

发表于 2023-5-4 10:09:32 | 显示全部楼层   河北省沧州市


补充内容 (2023-5-4 10:18):
([\u4E00-\u9FA5]+).([A-Z]+)[^\u4E00-\u9FA5]([\u4E00-\u9FA5]+)[^\u4E00-\u9FA5]?(\d+[Qq万kKwW][-~至—]+\d+[Qq万kKwW]?)

法师3.e

936.6 KB, 下载次数: 0

回复

使用道具 举报

结帖率:98% (58/59)

签到天数: 2 天

发表于 2023-5-4 10:43:51 | 显示全部楼层   福建省宁德市
这个就只是最后一个不规则嘛
回复

使用道具 举报

结帖率:88% (44/50)

签到天数: 1 天

发表于 2023-5-4 10:47:05 | 显示全部楼层   广东省揭阳市
以下表达式只针对你这个源文本 如有变动还需自行修改一下
正则表达式: ([\u4e00-\u9fa5]+)(?:[^+]|\+)([A-Z]+)(?:[^+]|\+)([\u4e00-\u9fa5]+)(?:[^+]|\+)(\d).*?(\d) 1112.png

回复

使用道具 举报

结帖率:98% (152/155)

签到天数: 14 天

 楼主| 发表于 2023-5-4 11:24:32 | 显示全部楼层   重庆市重庆市

有点小确缺陷,稍微改动下格式,就取不到了,会 直接被跳过。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

关闭

精易论坛 - 有你更精彩上一条 /2 下一条

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报QQ: 793400750,邮箱:wp@125.la
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备2025452707号) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表