开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 174|回复: 5
打印 上一主题 下一主题
收起左侧

[精币悬赏] 正则匹配日期时间

[复制链接]
结帖率:88% (56/64)
跳转到指定楼层
楼主
发表于 昨天 10:03 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式   山西省长治市
20精币
怎么能把以下情况的日期和情况都匹配出来呢,分很多种情况

我用的这个OCR 匹配出来的有日期时间有很多种情况比如

1.今天52609:50-11:48
2.今天5310:50-12:48
3.今天050310:50-12:48
4.今天05月03日10:50-12:48
5.后天0503日10:5012:48
6.今天05月0310:5012:48
7.今天11310:50-12:48
8.明天112310:50-12:48




结帖率:86% (30/35)

签到天数: 11 天

沙发
发表于 昨天 10:24 | 只看该作者   内蒙古自治区通辽市
取出什么?年月日+时间?
回复

使用道具 举报

结帖率:100% (9/9)

签到天数: 25 天

板凳
发表于 昨天 10:24 | 只看该作者   安徽省六安市
正则只能处理有规则的文本  你这只能交给AI处理了
回复

使用道具 举报

结帖率:36% (4/11)

签到天数: 11 天

地板
发表于 昨天 10:28 | 只看该作者   四川省成都市
这种 OCR 文本不要直接用一个正则硬拆,先按“时间冒号”反推
原理:
先找第一个时间冒号 :
冒号前最后 2 位 = 开始小时
冒号后 2 位 = 开始分钟
开始时间前面的数字 = 日期
后面再匹配结束时间
比如:
今天5310:50-12:48
冒号前 = 5310
开始小时 = 10
日期数字 = 53
结果 = 5月3日 10:50-12:48
表达式:^(今天|明天|后天)?(?:(\d{1,2})月)?(\d{1,2})日?(\d{1,2}):(\d{2})[--~到至]?(\d{1,2}):?(\d{2})$

建议先归一化再解析

1. 去掉空格
2. 把 “-、—、到、至、~” 统一成 “-”
3. 去掉 “月、日”
4. 提取开头的 今天/明天/后天
5. 找第一个冒号
6. 冒号前最后 2 位是开始小时
7. 冒号前剩下的是日期数字
8. 冒号后 2 位是开始分钟
9. 后面提取结束时间,支持 12:48 和 1248

如果你的 OCR 来源里月份一般是当前月附近,最好结合当前日期判断。比如当前是 2026年5月26日,那 113 更可能不是近期日期,需要按你的业务场景决定
回复

使用道具 举报

签到天数: 25 天

地下
发表于 昨天 11:12 | 只看该作者   安徽省安庆市

(?:今天|明天|后天)(1[0-2]|0?[1-9])[\s|月]*?(0?[1-9]|[12][0-9]|3[01])[\s|日]*?(\d{2}:\d{2})-?(\d{2}:\d{2})
回复

使用道具 举报

结帖率:100% (11/11)

签到天数: 19 天

6
发表于 昨天 14:24 | 只看该作者   湖北省武汉市
你这就是个伪命题,正则就写不好,111我怎么知道是1月11日 还是 11月1日
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报QQ: 793400750,邮箱:wp@125.la
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备2025452707号) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表