开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 6168|回复: 17
收起左侧

[求助] 七牛上传文件hash算法

[复制链接]
结帖率:89% (66/74)
发表于 2015-10-24 19:40:59 | 显示全部楼层 |阅读模式   上海市上海市
我上传文件返回hash,但是不知道怎么在上传前计算出来hash,因为我要验证文件的完整性,下面是官方公布的计算方法,谁能帮忙写成易语言
  1. qetag 是一个计算文件在七牛云存储上的 hash 值(也是文件下载时的 etag 值)的实用程序。

  2. 七牛的 hash/etag 算法是公开的。算法大体如下:

  3.     如果你能够确认文件 <= 4M,那么 hash = UrlsafeBase64([0x16, sha1(FileContent)])。也就是,文件的内容的sha1值(20个字节),前面加一个byte(值为0x16),构成 21 字节的二进制数据,然后对这 21 字节的数据做 urlsafe 的 base64 编码。
  4.     如果文件 > 4M,则 hash = UrlsafeBase64([0x96, sha1([sha1(Block1), sha1(Block2), ...])]),其中 Block 是把文件内容切分为 4M 为单位的一个个块,也就是 BlockI = FileContent[I*4M:(I+1)*4M]。

  5. 为何需要公开 hash/etag 算法?这个和 “消重” 问题有关,详细见:

  6.     http://kb.qiniu.com/53tubk96
  7.     http://segmentfault.com/q/1010000000315810

  8. 为何在 sha1 值前面加一个byte的标记位(0x16或0x96)?

  9.     0x16 = 22,而 2^22 = 4M。所以前面的 0x16 其实是文件按 4M 分块的意思。
  10.     0x96 = 0x80 | 0x16。其中的 0x80 表示这个文件是大文件(有多个分块),hash 值也经过了2重的 sha1 计算。
复制代码





补充内容 (2015-10-24 19:41):
我上传的文件都是小于4M的
结帖率:100% (3/3)
发表于 2015-10-24 19:55:01 | 显示全部楼层   浙江省杭州市
qetag 是一个计算文件在七牛云存储上的 hash 值(也是文件下载时的 etag 值)的实用程序。

七牛的 hash/etag 算法是公开的。算法大体如下:

    如果你能够确认文件 <= 4M,那么 hash = UrlsafeBase64([0x16, sha1(FileContent)])。也就是,文件的内容的sha1值(20个字节),前面加一个byte(值为0x16),构成 21 字节的二进制数据,然后对这 21 字节的数据做 urlsafe 的 base64 编码。
    如果文件 > 4M,则 hash = UrlsafeBase64([0x96, sha1([sha1(Block1), sha1(Block2), ...])]),其中 Block 是把文件内容切分为 4M 为单位的一个个块,也就是 BlockI = FileContent[I*4M:(I+1)*4M]。

为何需要公开 hash/etag 算法?这个和 “消重” 问题有关,详细见:

    http://kb.qiniu.com/53tubk96
    http://segmentfault.com/q/1010000000315810

为何在 sha1 值前面加一个byte的标记位(0x16或0x96)?

    0x16 = 22,而 2^22 = 4M。所以前面的 0x16 其实是文件按 4M 分块的意思。
    0x96 = 0x80 | 0x16。其中的 0x80 表示这个文件是大文件(有多个分块),hash 值也经过了2重的 sha1 计算。
回复 支持 反对

使用道具 举报

结帖率:89% (66/74)

签到天数: 12 天

 楼主| 发表于 2015-10-24 20:07:44 | 显示全部楼层   上海市上海市
易语言12345 发表于 2015-10-24 19:55
qetag 是一个计算文件在七牛云存储上的 hash 值(也是文件下载时的 etag 值)的实用程序。

七牛的 hash/ ...

感谢顶帖
回复 支持 反对

使用道具 举报

结帖率:89% (66/74)

签到天数: 12 天

 楼主| 发表于 2015-10-24 20:12:21 | 显示全部楼层   上海市上海市
就是把这句话翻译成易语言            
hash = UrlsafeBase64([0x16, sha1(FileContent)])
回复 支持 反对

使用道具 举报

头像被屏蔽
结帖率:96% (46/48)
发表于 2015-10-24 20:16:50 | 显示全部楼层   河南省洛阳市
我有例子。。但不方便发出来,是扫e源码自动上传。。。。
适合干坏事!!!!!!!!!
回复 支持 反对

使用道具 举报

结帖率:89% (66/74)

签到天数: 12 天

 楼主| 发表于 2015-10-24 20:24:25 | 显示全部楼层   上海市上海市
时光老人 发表于 2015-10-24 20:16
我有例子。。但不方便发出来,是扫e源码自动上传。。。。
适合干坏事!!!!!!!! ...

时光,别小气了,贡献出来吧
回复 支持 反对

使用道具 举报

头像被屏蔽
结帖率:96% (46/48)
发表于 2015-10-24 20:26:18 | 显示全部楼层   河南省洛阳市
你肯定要干坏事。
回复 支持 反对

使用道具 举报

结帖率:89% (66/74)

签到天数: 12 天

 楼主| 发表于 2015-10-24 20:27:59 | 显示全部楼层   上海市上海市

小点声,别让别人知道了
回复 支持 反对

使用道具 举报

结帖率:33% (1/3)
发表于 2015-10-24 20:28:31 | 显示全部楼层   浙江省绍兴市
一点都看不懂。。。
回复 支持 反对

使用道具 举报

发表于 2015-10-24 20:38:57 | 显示全部楼层   江苏省常州市
  
hash = BASE64编码 (到字节集 (22)sha1 (文件字节集))
hash = 子文本替换 (hash, “+”, “-”, , , )
hash = 子文本替换 (hash, “/”, “_”, , , )
hash = 子文本替换 (hash, “=”, “ ”, , , )



补充内容 (2015-10-24 20:41):
更正:最后一步替换是替换为空字符,不是空格
回复 支持 反对

使用道具 举报

  高级模式
B Color Image Link Quote Code Smilies |上传

本版积分规则 致发广告者

关闭

精易论坛 - 有你更精彩上一条 /2 下一条

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报QQ: 793400750,邮箱:wp@125.la
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备2025452707号) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表