开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 1549|回复: 9
收起左侧

[已解决] 求助,在易语言中如何用正则匹配出文本里的Unicode编码

 关闭 [复制链接]
结帖率:100% (3/3)
发表于 2021-5-6 17:08:12 | 显示全部楼层 |阅读模式   广东省揭阳市
20精币
如题,在易语言中如何用正则匹配出文本里的Unicode编码?
我想直接导入一段文本,可是在文本中有多个unicode编码的存在,一次性全部转换会转换出错,如何将unicode编码单独匹配出来,只对那一部分进行转码?

最佳答案

查看完整内容

这些不是 Unicode,是多字节编码,用正则分词,之后进行有选择的替换就可以了。 [e=1].版本 2 .支持库 RegEx .支持库 EDataStructure .程序集 窗口程序集_启动窗口 .子程序 _按钮1_被单击 .局部变量 正则, 正则表达式 .局部变量 搜索结果, 搜索结果, , "0" .局部变量 文本, 文本型 .局部变量 临时, 文本型 .局部变量 项目, 文本型 .局部变量 数, 整数型 .局部变量 结果, 文本型 .局部变量 节点, 节点 .局部变量 被替换, 文本型, ...

回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值
结帖率:100% (3/3)
 楼主| 发表于 2021-5-6 18:12:16 | 显示全部楼层   广东省揭阳市
大佬们,这是我的相关源码。
麻烦大佬们能否帮我瞅瞅

解码.e

915.54 KB, 下载次数: 13

回复

使用道具 举报

结帖率:100% (1/1)
发表于 2021-5-6 17:08:13 | 显示全部楼层   云南省曲靖市
这些不是 Unicode,是多字节编码,用正则分词,之后进行有选择的替换就可以了。
  
窗口程序集名保 留  保 留备 注
窗口程序集_启动窗口   
子程序名返回值类型公开备 注
_按钮1_被单击  
变量名类 型静态数组备 注
正则正则表达式 
搜索结果搜索结果0
文本文本型 
临时文本型 
项目文本型 
整数型 
结果文本型 
节点节点 
被替换文本型0
替换成文本型0
被替换 = { “ζ”, “δ”, “β”, “Щ”, “η”, “Φ”, “ε”, “μ”, “ξ”, “ж” }
替换成 = { “1”, “2”, “3”, “4”, “5”, “6”, “7”, “8”, “9”, “0” }
如果真 (取数组成员数 (被替换)取数组成员数 (替换成))
返回 ()
计次循环首 (取数组成员数 (被替换), 数)
节点.加入属性 (被替换 [], 替换成 [])
计次循环尾 ()
文本 = 编辑框1.内容
正则.创建 (“[\x80-\xff]{2}|.”, )
搜索结果 = 正则.搜索全部 (文本)
计次循环首 (取数组成员数 (搜索结果), 数)
项目 = 搜索结果 [].取匹配文本 (文本, )
如果 (节点.取文本值 (项目, 临时))
结果 = 结果 + 临时
结果 = 结果 + 项目

计次循环尾 ()
编辑框2.内容 = 结果


i支持库列表   支持库注释   
RegEx正则表达式支持库
EDataStructure数据结构支持库

评分

参与人数 2好评 +1 精币 +2 荣誉 +1 收起 理由
1234543 + 1 + 2 感谢分享,很给力!~
笨潴 + 1 热心帮助他人,荣誉+1,希望继续努力(*^__^*) 嘻嘻!

查看全部评分

回复

使用道具 举报

结帖率:81% (76/94)

签到天数: 1 天

发表于 2021-5-6 17:14:01 | 显示全部楼层   贵州省遵义市
【更新】易语言Unicode控件支持库,支持基本命令,支持正则Unicode
https://bbs.125.la/forum.php?mod=viewthread&tid=14310585
(出处: 精易论坛)
用里面的  正则表达式W
回复

使用道具 举报

结帖率:100% (3/3)
 楼主| 发表于 2021-5-6 17:16:12 | 显示全部楼层   广东省揭阳市
emodiyu 发表于 2021-5-6 17:14
【更新】易语言Unicode控件支持库,支持基本命令,支持正则Unicode
https://bbs.125.la/forum.php?mod=view ...

大佬,正则该如何写,wo不会正则
回复

使用道具 举报

结帖率:33% (1/3)
发表于 2021-5-6 17:26:54 | 显示全部楼层   福建省厦门市
用邓学彬(泪闯天涯)写的正则,可以用字节集匹配,你先用精易编程助手 的文本型弄成字节集就OK了啊
回复

使用道具 举报

签到天数: 2 天

发表于 2021-5-6 17:39:47 | 显示全部楼层   广东省广州市

编码_Unicode到usc2 后用 (?:\\u\w{4})+ 正则匹配出来即可~
回复

使用道具 举报

结帖率:100% (3/3)
 楼主| 发表于 2021-5-6 17:46:33 | 显示全部楼层   广东省揭阳市
大司命 发表于 2021-5-6 17:39
编码_Unicode到usc2 后用 (?:\%u\w{4})+ 正则匹配出来即可~

大佬,这样做是得先转换成字节集吗?
回复

使用道具 举报

结帖率:100% (3/3)
 楼主| 发表于 2021-5-6 17:55:17 | 显示全部楼层   广东省揭阳市
大司命 发表于 2021-5-6 17:39
编码_Unicode到usc2 后用 (?:\%u\w{4})+ 正则匹配出来即可~

大佬,我能否发给你帮我看看
回复

使用道具 举报

签到天数: 6 天

发表于 2021-5-6 17:58:56 | 显示全部楼层   广西壮族自治区柳州市
    调用格式: 〈逻辑型〉 对象.创建W (字节集 正则表达式文本,[整数型 匹配模式]) - 正则表达式支持库(Deelx版)->正则表达式DEELX
    英文名称:CreateW
    根据正则表达式语法,对正则表达式文本进行编译。本命令为高级对象成员命令。
    参数<1>的名称为“正则表达式文本”,类型为“字节集(bin)”。Unicode格式的正则表达式文本,比如“易语言5\.0(模块|支持库)?”。
    参数<2>的名称为“匹配模式”,类型为“整数型(int)”,可以被省略。支持的匹配模式有:单行模式、多行模式、全局模式、忽略大小写、从右向左、扩展模式 这 6 种模式以及它们的组合。
可以用如下常量(#正则常量.单行模式;#正则常量.多行模式;#正则常量.全局模式;#正则常量.忽略大小写;#正则常量.从右向左;#正则常量.扩展模式)可以查看支持库常量说明。

    操作系统需求: Windows
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

关闭

精易论坛 - 有你更精彩上一条 /1 下一条

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报QQ: 793400750,邮箱:wp@125.la
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备2025452707号) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表