开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

12
返回列表 发新帖
楼主: BruceJoysky1987
收起左侧

[已解决] 网络图片对比问题

 关闭 [复制链接]

结帖率:87% (20/23)
发表于 2025-8-18 00:32:58 | 显示全部楼层   广东省东莞市
这种直接对比 哈希,最经典算法就是 先 灰度   8位处理,然后,缩放成64*64  然后统计 像素 进行对比,相同的话,对比值就越多
回复

使用道具 举报

结帖率:100% (47/47)

签到天数: 7 天

 楼主| 发表于 2025-8-18 00:42:32 | 显示全部楼层   福建省泉州市
汉族 发表于 2025-8-18 00:32
这种直接对比 哈希,最经典算法就是 先 灰度   8位处理,然后,缩放成64*64  然后统计 像素 进行对比,相同 ...

好复杂!
回复

使用道具 举报

结帖率:100% (5/5)

签到天数: 5 天

发表于 2025-8-18 02:04:30 | 显示全部楼层   浙江省温州市
相当于图片相似度去重吧,先下载全部图片计算相似度的哈希,然后对哈希批量计算相似度处理哈,最终排列相似度url
回复

使用道具 举报

结帖率:98% (120/122)

签到天数: 4 天

发表于 2025-8-18 08:02:18 | 显示全部楼层   海南省海口市
图片数据转到哈希,加入数组,数组去重复,这个思路可行
回复

使用道具 举报

结帖率:100% (47/47)

签到天数: 7 天

 楼主| 发表于 2025-8-18 08:14:47 | 显示全部楼层   福建省泉州市
cherryy 发表于 2025-8-18 08:02
图片数据转到哈希,加入数组,数组去重复,这个思路可行

那么怎么确认是那条url呢!
回复

使用道具 举报

结帖率:98% (120/122)

签到天数: 4 天

发表于 2025-8-18 10:19:21 | 显示全部楼层   海南省海口市
BruceJoysky1987 发表于 2025-8-18 08:14
那么怎么确认是那条url呢!

去重复后取前面一条url

补充内容 (2025-8-18 10:22):
是不是只要有一条rul就可以了?取前面后面的有没有关系?
回复

使用道具 举报

结帖率:100% (47/47)

签到天数: 7 天

 楼主| 发表于 2025-8-18 13:27:19 | 显示全部楼层   福建省泉州市
cherryy 发表于 2025-8-18 10:19
去重复后取前面一条url

补充内容 (2025-8-18 10:22):

很多url,进行哈希对比,去除所有同样的哈希值,并将不相同哈希的url加到新数组里
回复

使用道具 举报

结帖率:100% (109/109)

签到天数: 2 天

发表于 2025-8-18 15:53:42 | 显示全部楼层   浙江省温州市
我看了你上一个提问帖子 :我的思路 是  进行数组 cha询对比 哈希  cha询得到在数组里 就加到 对应那个数组值的后面,不在数组里就加到数组 结尾,以此类推

{链接1[标志1],链接2[标志2],链接3[标志3]}   加入链接4[标志1]
如果发现有链接1[标志1]
{链接1[标志1],链接4[标志1],链接2[标志2],链接3[标志3]}

{链接1[标志1],链接4[标志1],链接2[标志2],链接3[标志3]}  加入链接5[标志4]
如果发现有无[标志4]
{链接1[标志1],链接4[标志1],链接2[标志2],链接3[标志3],加入链接5[标志4]}

点评

json 也一样   浙江省温州市  发表于 2025-8-18 15:53
回复

使用道具 举报

结帖率:100% (47/47)

签到天数: 7 天

 楼主| 发表于 2025-8-18 22:35:56 | 显示全部楼层   福建省泉州市
cherryy 发表于 2025-8-18 13:39
收集完你要对比的URL  和 哈希值,以文本方式去除重复,再挑选不重复的URL,你试试这个方法是否可行
...

就给你了吧,以后想到在搞
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

关闭

精易论坛 - 有你更精彩上一条 /2 下一条

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报QQ: 793400750,邮箱:wp@125.la
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备2025452707号) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表