多快好省?解读Arweave 3月上线的2.6版本如何降低能源消耗和提升存储激励
2月11日,存储网络Arweave 宣布2.6版本已经开发完成,创始人Sam Williams表示将会在3月6日激活网络硬分叉。
本次更新将会集中在两个方面,一是降低Arweave存储数据的能源消耗,以提高存储市场的效率;二是激励矿工存储更多数据,尤其是稀有数据备份和音视频等重度空间需求的数据类型。
具体而言,主要会包括以下四个具体措施:
- 通过鼓励矿工使用更便宜的硬盘来存储数据,而不是继续提升传输速度,从而降低AR存储的平均成本;
- 通过激励矿工备份更多Arweave主网数据的完整副本,从而建立更快地索引信息,以实现更“分布式”的数据备份网络;
- 允许将更多的挖矿算力投放至真正有用的数据类型来减少网络中的能源浪费,避免过度的垃圾信息换取AR代币;
- 允许在Arweave网络中以动态价格对存储成本进行估算,从而引导矿工转向更高价值的数据类型存储上,提高网络容错率。
量大从优:空间扩容的第一性原理
在Arweave 2.6之前,矿工主要是通过竞争更快的提交验证速度来竞争AR代币,但是在Arweave 2.6更新中,将会引入哈希速度限制,矿工在单位时间内可以合并的交易量将会下降。
从而会将Arweave从计算密集型转向资源密集型机制,更多的硬盘将带来更多的AR激励,从而引导网络上的Gas Fee消耗转向存储更多的完整数据集。
在数据集的完整性上,将会继续沿用SPoRA(随机访问的简介证明)机制,从而鼓励矿工存储更多Arweave主网的完整数据集,而非通过存储单个数据集的多个副本来作弊。
SPoRA的特点在于会通过对矿工提交的验证结果进行历史性回溯,主网会随机对新提交的区块进行随机检查,以确认是否存在旧的区块信息,在确认存在后,新的区块才能被纳入主网之中,矿工进而得到AR奖励。
通过对整个网络的区块确认机制的修改,Arweave将会成为空间性最优的新存储网络,以实现减少单位能源消耗的同时,提升整个Arweave网络的数据完整性和存储容量。
新式“编织”:挖矿机制将导向增强冗余
Arweave 2.6意在改变单纯的矿工提交速度,这是出于存储和公链不同的特性而采取的优化措施,比特币等公链竞争的是提交速度,以维护网络的正常结算能力和保证主网确认结果的唯一性,但是存储在考虑确认速度的同时,还需要考虑数据的完整性,以防止单一节点作弊导致数据丢失。
为此,Arweave 2.6会改变自己的数据组织方式,具体而言,会添加一个新的数据分区(Partitions),以适应新的挖矿机制。
Arweave中Weave(块)为最小单一单位,均匀地分布在Arweave网络之上,负责标识存储数据的位置,可以类比为“砖头”;而紧随其后的是chunk(组块),通常是连续的块数据,长度为固定的256KB,矿工所竞争的就是针对组块的SPoRA提交证明,可以理解为一面墙。
而本次Arweave 2.6更新后会新加Partitions(分区),会以3.6TB的方式组织一个分区的规模,可以理解为一个房间的雏形,以提高数据利用的规模效应。
在更改后的挖矿竞争模型中,为了避免矿工通过存储部分数据集的多个副本来占据空间,每个数据的副本对于每个矿工而言都是唯一的地址,以更好辨识副本位置,并且减少无关数据的存储,从而将空间分配给真正需要的数据。
对于矿工而言,存储完整数据集的多个副本更容易得到主网承认,从而减少存储部分数据的多份副本对主网容量的消耗。
固态VS机械:抹除硬盘速度优越性
在设计Arweave之初就考虑到对NFT等大型文件的存储,尤其是在和Meta达成合作后,Arweave将承担Instagram上NFT的永久存储职责,而更多音、视频等数据的涌入,将会导致整个网络的负载和备份能力。
在Arweave 2.6之前的版本中,主要采用的是价格非常昂贵的SSD(固态硬盘),矿工为增加提交成功率,会刻意减少打包此类内容,进而节省宝贵的硬盘空间容量。
在Arweave 2.6中,主网上的合并数据块是连续的内存块,因此可以提升HDD(机械硬盘)的读取性能,基本可以做到SSD(固态硬盘)相同的读取速度,但得益于远低于SSD的价格,矿工可以更大规模组建HDD阵列。
并且,为了避免“大力出奇迹”的局面,Arweave 2.6中会尽可能平衡挖矿机制,以避免矿工通过增加SSD来超越使用HDD组网的收入水平。
部分矿工仍然可以选择SSD来小幅领先同行,但是结合新的单一、稀有数据存储激励措施,存储空间的浪费也会导致矿工的损失。
只要当SSD(固态硬盘)组网的收入无法覆盖购买SSD的花费,那么矿工转向HDD就会成为最优解,而网络中的SSD存量也会起到保障网络速度的效果。
更新模型:动态定价确保数据完整
Arweave的目标是“一次存储,永久保存”,用户无需为保证数据完整性而续费,只需要在存储数据时一次性付费,随后Arweave会通过缓慢的释放机制分发AR,来奖励矿工为保存数据而进行的工作。
这里面的关键在于,存储价格需要综合考虑用户的承受能力,矿工的积极性,以及网络的可持续性。
在Arweave 2.5中,引入了基于难度的动态定价机制,试图在硬盘价格、存储容量和故障率之间求取艰难的平衡,但是难以计算矿工使用的硬盘速度,因为竞争机制下只能估计主网的平均速度,而很难去评估单个矿工的硬件型号。
而在Arweave 2.6版本中,协议将会规定最高硬盘驱动速度,从而让硬盘价格的计算有章可循,在这种机制下,矿工使用超越规定速度的硬盘无法获得额外奖励,因此为动态定价机制确定了一个坚实的基础。
根据测算,Arweave主网至少可保障200年的存储失效,而按照目前的硬盘平均故障时间间隔(MTBF),每份数据至少需要15个副本,更具长期保存能力的HDD也有利于数据的“永久化”存储。
结语
本次Arweave更新,用创始人Sam Williams的话来说是“自2.4版本发布的SPoRA(简洁证明机制)发布以来的最重要更新。”从更新内容中可以发现,Arweave在重新回归存储的初心,即如何永久化的存储更多不同数据。