为什么要把资源做成压缩包

为什么要去加密压缩,而且很多还做分卷压缩,这要从网盘的屏蔽机制说起。

1673779916-32d7d6f95fd68b6要知道压缩一个大文件,是非常耗时间的事情,可能比你下载下来的时间多得多。如果不是情非得已,没人愿意主动去给自己找麻烦。

早期上传资源的时候,都是不压缩的,但后来百度网盘由于众所周知的原因,限制得越来越严格,导致源文件轻易就被识别和屏蔽了。后来又出来什么在线播放、在线解压这些功能,让百度网盘更能轻易“穿过表象看本质”,识别压缩包里面到底是什么内容。

 

它的原理是这样的:

要屏蔽某个资源,除了能做识别文件名这个最基础的判断外,更重要的依据是文件的哈希值(Hash)。它像指纹一样,不同文件的哈希值不一样,相同哈希值的就是同一个文件。也就是说,如果一个文件被判定违规,即使你把文件名改了,或者把扩展名(也叫后缀)改了,都没用,因为文件本身的哈希值没变。哈希值是根据文件的内容算出来的,跟它叫什么名字无关。就好像一个人,无论叫什么名字、穿什么衣服、留什么发型,外在的东西再怎么变,他的本体还是那个生物体,不会变。

1673778965-b2cec8e171d88b9而如果此时把它压缩了,套了一层外壳,那它就是新文件了,哈希值变了,所以网盘暂时“不认识”它,因为数据库里没有它。而一旦有人用网盘在线解压缩,输入密码进到压缩文件里面去时,百度瞬间就发现了里面的“玄机”,又会将此压缩包的哈希值添加到数据库进行标识、屏蔽。

而分卷压缩包不能在线解压,所以被“认出来”的可能性大大降低,但是依然有一定的概率会被屏蔽(不能在线解压,不代表网盘系统没能力解压,它只是没那么主动而已)。而且文件下载到本地后肯定会被下载者解压,百度网盘软件只要后台扫描一下你的本地文件,建立一下对应的关系,也不难。它的算法也是一直在成长的,就像人们反屏蔽的手法一直在变化一样。

对于一个压缩包而言,哪怕它里面有几万个文件,只要其中一个文件曾经被网盘屏蔽过,而此时程序又认出了这个被屏蔽过的文件,那这整个压缩包就会被屏蔽掉。

1673778970-8000b641440e925仔细的话,你可以看到网站有些视频资源,只有迅雷云盘链接,没有百度网盘链接,那很可能是因为这些资源太热门被下载太多次或者一些人的不良操作,导致无论怎么压缩、怎么加密、怎么分卷,都被封了很多次,没人愿意再折腾了,所以不再用百度网盘去存储它。而迅雷云盘不一样,它的体量跟百度网盘没法比,还处于抢用户的阶段,自然会睁一只眼闭一只眼,不会管那么严。类似的还有115网盘和阿里云盘。

所以,做压缩、做分卷、上传,是资源主们特别讨厌干的事情,特别无聊枯燥、浪费时间,但也是没办法的办法,毕竟东西得能传播出去,才产生价值。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注