开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 138|回复: 5
收起左侧

[完成] 求助:用正则从拼音中提取所有带声调字母

 关闭 [复制链接]
结帖率:82% (9/11)
发表于 7 天前 | 显示全部楼层 |阅读模式   河北省保定市
5精币
用正则从拼音中提取所有带声调字母
例如: 从以下文本中,提取所有带声调字母ǒ ǔ ù à ó
wǒ de zǔ fù jiào hú guó huá , hú jiā zǔ shàng shì shí lǐ bā xiāng yǒu míng de dà dì zhǔ , zuì huī huáng de shí qī zài chéng lǐ mǎi le sān tiáo hú tòng xiāng lián de sì shí duō jiān zhái zǐ , qí jiān yě céng chū guò yī xiē dāng guān de hé jīng shāng de , juān guò qián qīng de liáng tái 、 cáo yùn de bāng bàn 。

最佳答案

查看完整内容

汉字声调符号在现行国标中的编号是 A8A1 ~ A8B8 , 并且是按规律排序的. 所以用正则取出来后, 直接取模, 就能得出是第几声: [e=1].版本 2 .支持库 RegEx .支持库 spec .支持库 eAPI .程序集 窗口程序集_启动窗口 .子程序 __启动窗口_创建完毕 .局部变量 文本, 文本型 .局部变量 正则, 正则表达式 .局部变量 数组, 文本型, , "0" .局部变量 数, 整数型 .局部变量 编码, 字节集 .局部变量 声调, 整数型 文本 = “ǒ ǔ ù à ó” ...

结帖率:100% (1/1)
发表于 7 天前 | 显示全部楼层   浙江省温州市
汉字声调符号在现行国标中的编号是 A8A1 ~ A8B8 , 并且是按规律排序的.
所以用正则取出来后, 直接取模, 就能得出是第几声:
  
窗口程序集名保 留  保 留备 注
窗口程序集_启动窗口   
子程序名返回值类型公开备 注
__启动窗口_创建完毕  
变量名类 型静态数组备 注
文本文本型 
正则正则表达式 
数组文本型0
整数型 
编码字节集 
声调整数型 
文本 = “ǒ ǔ ù à ó”
正则.创建 (“\xA8[\xA1-\xB8]”, )
数组 = 分割文本 (正则.替换 (文本, “$0\r\n”, 1, , 假, ), #换行符, )
计次循环首 (取数组成员数 (数组), 数)
编码 = 到字节集 (数组 [])
声调 (编码 [2]十六进制 (“A1”)) % 4 + 1
调试输出 (格式化文本 (“%s是第%s声”, 数组 [], 数值到大写 (声调, )))
计次循环尾 ()


i支持库列表   支持库注释   
RegEx正则表达式支持库
spec特殊功能支持库
eAPI应用接口支持库

开始运行被调试程序
* “ǒ是第三声”
* “ǔ是第三声”
* “ù是第四声”
* “à是第四声”
* “ó是第二声”
被调试易程序运行完毕

评分

参与人数 1荣誉 +1 收起 理由
笨潴 + 1 热心帮助他人,荣誉+1,希望继续努力(*^__^*) 嘻嘻!

查看全部评分

回复

使用道具 举报

结帖率:100% (2/2)

签到天数: 28 天

发表于 7 天前 | 显示全部楼层   福建省泉州市
[^\w,,。、 ]+                   可以考虑
回复

使用道具 举报

结帖率:100% (1/1)
发表于 7 天前 | 显示全部楼层   浙江省温州市
如果你要准确区分所有情况, 基本都得查:
国家标准|GB 18030-2022
参考第12页(双字节1区):
0.png
这里做了个区分, 因为 A8BB(ɑ) 头上没有别的东西:
  
窗口程序集名保 留  保 留备 注
窗口程序集_启动窗口   
子程序名返回值类型公开备 注
__启动窗口_创建完毕  
变量名类 型静态数组备 注
文本文本型 
正则正则表达式 
数组文本型0
文本 = #常量1
正则.创建 (“\xA8([\xA1-\xBA]|[\xBC-\xBF])”, )
数组 = 分割文本 (正则.替换 (文本, “$0\r\n”, 1, , 假, ), #换行符, )
调试输出 (数组)


i支持库列表   支持库注释   
RegEx正则表达式支持库
spec特殊功能支持库

开始运行被调试程序
* 数组:65{“ǒ”,“ǔ”,“ù”,“à”,“ú”,“ó”,“á”,“ú”,“ā”,“ǔ”,“à”,“ì”,“í”,“ǐ”,“ā”,“ā”,“ǒ”,“í”,“à”,“ì”,“ǔ”,“ì”,“ī”,“á”,“í”,“ī”,“à”,“é”,“ǐ”,“ǎ”,“ā”,“á”,“ú”,“ò”,“ā”,“á”,“ì”,“í”,“ō”,“ā”,“á”,“ǐ”,“í”,“ā”,“ě”,“é”,“ū”,“ò”,“ī”,“ē”,“ā”,“ā”,“é”,“ī”,“ā”,“ā”,“ò”,“á”,“ī”,“á”,“á”,“á”,“ù”,“ā”,“à”}
被调试易程序运行完毕
回复

使用道具 举报

结帖率:82% (9/11)

签到天数: 5 天

 楼主| 发表于 6 天前 | 显示全部楼层   河北省保定市
zainex 发表于 2025-9-21 14:28
如果你要准确区分所有情况, 基本都得查:
国家标准|GB 18030-2022
参考第12页(双字节1区):

请教 如何判断 一个汉字的声调是四声中的第几声
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报QQ: 793400750,邮箱:wp@125.la
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备2025452707号) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表