开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 422|回复: 6
收起左侧

[已解决] 两段文本比较差异,返回一个相似度数值

 关闭 [复制链接]
结帖率:100% (4/4)
发表于 2025-12-1 09:52:48 | 显示全部楼层 |阅读模式   河南省郑州市
200精币
比如:
文字A:      青青河边草
文字B:    青青何边草

相似度   0.8



再比如:
文字A:      青青河边草
文字B:    青青何边早

相似度   0.6




求老师们 给个解决方案。。  感谢

最佳答案

查看完整内容

https://bbs.ijingyi.com/forum.php?mod=viewthread&tid=14811494&highlight=%E7%9B%B8%E4%BC%BC%E5%BA%A6

回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值
结帖率:99% (82/83)

签到天数: 2 天

发表于 2025-12-1 09:52:49 | 显示全部楼层   河北省廊坊市

评分

参与人数 1荣誉 +1 收起 理由
笨潴 + 1 热心帮助他人,荣誉+1,希望继续努力(*^__^*) 嘻嘻!

查看全部评分

回复

使用道具 举报

发表于 2025-12-1 10:10:01 | 显示全部楼层   广东省广州市
  
窗口程序集名保 留  保 留备 注
程序集1   
子程序名返回值类型公开备 注
_启动子程序整数型 本子程序在程序启动后最先执行
变量名类 型静态数组备 注
a文本型 
b文本型 
c文本型 
aa文本型0
bb文本型0
cc文本型0
la整数型 
lb整数型 
lc整数型 
fit整数型 
i整数型 
fit2整数型 
a = “青青河边草”
b = “青青何边草”
c = “青青何边早”
la = 文本_逐字分割_汇编 (a, aa)
lb = 文本_逐字分割_汇编 (b, bb)
lc = 文本_逐字分割_汇编 (c, cc)
fit = 0
计次循环首 (la, i)
如果真 (lb ≥ i)
如果真 (aa [i] = bb [i])
fit = fit + 1


计次循环尾 ()
调试输出 (“相似度:”, fit ÷ la)
fit2 = 0
计次循环首 (la, i)
如果真 (lc ≥ i)
如果真 (aa [i] = cc [i])
fit2 = fit2 + 1


计次循环尾 ()
调试输出 (“相似度:”, fit2 ÷ la)
返回 (0)  ' 可以根据您的需要返回任意数值



i支持库列表   支持库注释   
spec特殊功能支持库



补充内容 (2025-12-1 10:10):
[10:09:45] * “相似度:” | 0.800000
[10:09:45] * “相似度:” | 0.600000
回复

使用道具 举报

签到天数: 2 天

发表于 2025-12-1 10:20:50 | 显示全部楼层   广西壮族自治区柳州市
  
调试输出 (子程序文字相似度 (“青青河边草”, “青青何边早”))
子程序名返回值类型公开备 注
子程序文字相似度小数型 
参数名类 型参考可空数组备 注
文字A文本型
文字b文本型
变量名类 型静态数组备 注
A字节集 
B字节集 
i1整数型 
i2整数型 
ACD整数型 
BCD整数型 
A = 到字节集 (文字A)
B = 到字节集 (文字b)
ACD = 取字节集长度 (A)
BCD = 取字节集长度 (B)
判断 (ACD > BCD)
B = B + 取空白字节集 (ACD - BCD)
判断 (BCD > ACD)
A = A + 取空白字节集 (BCD - ACD)



计次循环首 (取字节集长度 (A), i1)
如果真 (A [i1] = B [i1])
i2 = i2 + 1

计次循环尾 ()
返回 (i2 ÷ 取字节集长度 (A))


i支持库列表   支持库注释   
spec特殊功能支持库



补充内容 (2025-12-1 10:32):
改了一下bug在楼下https://bbs.ijingyi.com/forum.ph ... 21&pid=30603623
回复

使用道具 举报

签到天数: 2 天

发表于 2025-12-1 10:32:42 | 显示全部楼层   广西壮族自治区柳州市
  
子程序名返回值类型公开备 注
子程序文字相似度小数型 
参数名类 型参考可空数组备 注
文字A文本型
文字b文本型
变量名类 型静态数组备 注
A字节集 
B字节集 
i1整数型 
i2整数型 
ACD整数型 
BCD整数型 
A = 到字节集 (文字A)
B = 到字节集 (文字b)
ACD = 取字节集长度 (A)
BCD = 取字节集长度 (B)
判断 (ACD > BCD)
B = B + 取空白字节集 (ACD - BCD)
BCD = ACD
判断 (BCD > ACD)
A = A + 取空白字节集 (BCD - ACD)
ACD = BCD



计次循环首 (ACD, i1)
如果真 (A [i1] = B [i1])
i2 = i2 + 1

计次循环尾 ()
返回 (i2 ÷ ACD)

回复

使用道具 举报

结帖率:100% (18/18)

签到天数: 2 天

发表于 2025-12-1 10:37:39 | 显示全部楼层   福建省泉州市
青青河边草
河边草
这样的两段文字的话,按照你想要的相似度的话又该是什么结果呢、。?
长度不一致的可能性,也影响相似度计算方式的
回复

使用道具 举报

结帖率:100% (4/4)
 楼主| 发表于 2025-12-1 10:43:53 | 显示全部楼层   河南省郑州市
感谢楼上几位老师回复
是我没说清  有些是不按顺序的,,,
比如
青青河边草
河边草
这种相似度  也得算0.6。。。

文本相似度比较.e

891.31 KB, 下载次数: 2

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报QQ: 793400750,邮箱:wp@125.la
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备2025452707号) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表