|
|
本帖最后由 火威网络 于 2022-8-20 09:40 编辑
   
UTF8 一个汉字则是需要3个字节来存放
根据UTF8 的汉字存储规则 1110xxxx 10xxxxxx 10xxxxxx
假如(集)字为例他的的UTF8 易语言字节集:{233,155,134} -> 转到二进制:11101001 10011011 10000110
(集)Unicode编码值:38598 的二进制值:1001 0110 1100 0110
(集)UTF8二进制:11101001 10011011 10000110
找到第一个字节二进制:1110xxxx 这里的xxxx必须>0
找到之后字节二进制:10xxxxxx
找到之后字节二进制:10xxxxxx
满足以上条件则为UTF-8
多年对编码UTF8困惑的终于理解了。。哈哈哈。实现过程我就懒得写了。留个作业。
Unicode字符编码值范围:- 汉字:[0x4e00,0x9fa5](或十进制[19968,40869])
- 数字:[0x30,0x39](或十进制[48, 57])
- 小写字母:[0x61,0x7a](或十进制[97, 122])
- 大写字母:[0x41,0x5a](或十进制[65, 90])
币也拿给了。技术也分享了,你是不是留个赞。
|
评分
-
查看全部评分
|