以太坊合并,到底要“合并“什么?
作者:吉时通信
原文标题及链接:
摘要
在以太坊的发展路线图中,考虑到降低网络对能源/算力的消耗并降低参与门槛,增强网络扩展性以及对分片链的支持等因素,由PoW过渡到PoS是必经的一步。本次合并对区块结构的影响是怎样的?对那些离出块最近的堆栈/组件如MEV又能催生哪些新机会?本文对这些有趣的问题进行剖析。
PoW似乎看起来很完美,但最容易被人诟病和批评的就是为了保证网络安全性所必需的能源消耗。随着全网算力的增加,能耗亦快速增长。在以太坊的发展规划路线图上,PoW机制将逐渐退出历史舞台,以太坊将过渡至PoS(权益证明)而逐步淘汰PoW的挖矿机制。需要强调的是,PoW消耗的能源和算力铸就了网络的安全壁垒——51%攻击原则决定了想要攻击一个拥有强大算力的系统(类似比特币、以太坊这样的系统还承载了相当体量的财富),一定是在成本上不合算的。因此,网络财富值、网络算力和网络安全性之间能够在经济学上达成一种约束。但相应的代价是对能源的消耗(这在绿色节能的社会共识下会有压力)以及参与挖矿的门槛等。
合并(Merge)早就在以太坊的发展规划中,为了平滑过渡,先在PoW上引入信标链。然而面对成熟的PoW矿工和发达的矿机产业来说,合并绝非易事,其面临的利益分歧和技术障碍也是显而易见的。为了能够使得既定的PoS路线能够顺利进行,尽可能低平滑过渡,当下(合并前夕)最新的发展状态是以太坊2.0,通过引入信标链(Beaconchain,即ETH2.0),基于PoW底层区块运行,并在信标链上推进分片(sharding)的开发。这一切工作为当前精神领袖Vitalik力推PoW切换PoS做足了基础准备——因为当前的架构下切换共识机制只引入“最小破坏”影响。
此次合并以“最小破坏”原则进行,这使得原来运行的应用客户端可以无感地切换到PoS。由于PoW不复存在,信标链区块将包含执行层(ExecutionPayloads),执行层是当前工作量证明链上区块的合并后等价物。对于最终用户和应用程序开发人员来说,执行层是其与以太坊进行交互的地方。该层上的应用程序仍将由执行层客户端(如常用的Besu、Erigon、Geth、Nethermind等)处理。因此,由于执行层的稳定性,合并只引入了最小的破坏性更改。
合并后的区块数据结构保持不变,无用字段设置为0或者等效值。合并后,之前包含在工作量证明块头中的几个字段不再有用,但为了最大限度地减少对工具和基础设施的破坏,这些字段从数据结构中完全删除,而是设置为 0或者相应的等效值。这样,对于应用程序执行和开发者来说,此次合并带来的影响程度降到了最低。
一些区块层面的细微变化还是存在的,影响有待观察。类似MEV、闪电贷等组件应用,深入到区块数据结构的堆栈,使得合并的影响还需要在日后实践中观察。例如,随着danksharding、更大区块等新的研发推进下,我们认为,PoS机制下,闪电贷有可能出现新的形态,甚至在特殊的套利需求推动下,闪电贷和MEV相结合的应用也是可以期待的:另外对mempool的安排也值得跟踪和观察。毕竟,以太坊未来的技术路线还存在很多不确定性和想象空间。
风险提示:区块链商业模式落地不及预期;监管政策的不确定性。
1.核心观点
在以太坊的发展路线图中,考虑到降低网络对能源/算力的消耗并降低参与门槛,增强网络扩展性以及对分片链的支持等因素,由PoW过渡到PoS是必经的一步。为了合并的顺利进行,社区通过引入信标链作为过渡共识层,基于此,推进分片等新构架的研发。
合并即是将PoW相关层去除,以信标链作为最终共识层。因此,区块结构和挖矿逻辑都会发生一定的变化。本文对合并后的区块结构和基于挖矿的MEV等应用进行了探讨。此次合并本着“最小破坏”原则进行,在理论上对应用层几乎没有影响,对涉及出块的中间组件如MEV、闪电贷等应用的影响还是要随着以太坊的发展而观察。
2.PoW和PoS的基本原理和以太坊挖矿的“黑暗森林”
在以太坊的发展路线图中,考虑到降低网络对能源/算力的消耗并降低参与门槛,增强网络扩展性,以及对分片链的支持等隐私,由PoW共识机制过渡到PoS共识机制是必经的一步。共识机制变化最主要影响的就是挖矿和矿工的世界。
本节介绍PoW和PoS的基本原理,以及探讨在挖矿世界最典型的应用——MEV,是如何游走于共识层。
2.1.挖矿的规则变更:PoW和PoS基本原理
以太坊是在计算机网络上区块链系统,可确保数据和智能合约程序在网络上的所有计算机上复制和处理,而无需一个中心化的协调器,即去中心化。其愿景是创建一个不可阻挡的抗审查、自我维持的去中心化世界计算机,或者说是一个基于互联网的分布式计算机。以太坊扩展了比特币区块链数据结构,比特币在世界各地的许多计算机上验证、存储和复制交易数据也因此称为“分布式账本”。而以太坊则更进一步,能够在世界各地的许多硬件上运行计算机代码,即所谓的“图灵完备”。
以太坊区块链本质上也是一个基于交易的状态机。在计算机科学中,状态机是指将读取一系列输入并基于这些输入转换到新状态的东西。以太坊区块内容状态主要就是交易和账户余额。所以以太坊是不断保持全网账户交易/余额的最新状态的网络。
共识机制是区块链网络最核心的机制。以太坊账户之间会产生交易转账行为,这些交易被打包分组到不同的区块里存证。一个区块可包含多笔交易,每个区块都与上一个区块按照逻辑顺序链接在一起(而不必存储在一起,即可以分布式存储),这样就形成了一个去中心化网络。用户账户状态的变更需要全网所有计算机一致认可,这种一致认可就是区块链的核心——共识(机制)。最新的区块决定了全网账户的最新状态,但最新区块总要有一台计算机节点先产生,然后同步给全网其他计算机获得共识。因此最新区块该由哪台计算机节点(矿工)先产生——即记账权争夺——是极其关键的。所谓共识机制,就是决定记账权争夺规则的机制。在矿工的术语里,也称之为挖矿。
任何加入网络中的计算机节点(矿工)都可以努力尝试创建和验证区块。类似于比特币,以太坊网络从创建之初直到现在仍然在使用PoW(工作量证明)机制来确保以太坊网络中的节点就链上记录的所有信息状态达成共识,确保网络安全、可信。PoW工作量证明协议要求矿工经过激烈的试错竞赛(一种数学计算),直到某个矿工最先找到一个区块的随机数。
PoW似乎看起来很完美,但最容易被人诟病和批评的就是为了保证网络安全性所必需的能源消耗。随着全网算力的增加,能耗亦快速增长。在以太坊的发展规划路线图上,PoW机制将逐渐退出历史舞台,以太坊将过渡至PoS(权益证明)而逐步淘汰PoW的挖矿机制。需要强调的是,PoW消耗的能源和算力铸就了网络的安全壁垒——51%攻击原则决定了想要攻击一个拥有强大算力的系统(类似比特币、以太坊这样的系统还承载了相当体量的财富),一定是在成本上不合算的。因此,网络财富值、网络算力和网络安全性之间能够在经济学上达成一种约束。但相应的代价是对能源的消耗、以及参与挖矿的门槛等。
PoS权益证明机制下,矿工节点通过质押ETH代币参与其中。系统将随机选择一位验证者来创建新区块,且它将得到相应的区块奖励。相较于需要用大量计算资源来完成此过程的PoW机制,PoS机制只需要简单的地将ETH质押到网络。PoS机制中的验证者和PoW机制中的矿工承担着完全相同的职责即负责将交易排序和创建新的区块保证所有节点就当前网络状态达成一致。PoS相较于PoW有一定的优势,例如:更加节约能源;对硬件的要求大大降低;以及因为硬件门槛的降低而得到的更强的去中心化等。
PoS节点矿工需要质押至少32个ETH 来获得作为验证者的资格。验证者将被随机选中,其打包的区块将成为网络最新区块。一个用户的权益也被用于激励良好的验证者行为的一种方式。例如,验证者可能会因为离线(验证失败)而损失一部分权益,或因更严重的问题而损失他们的全部权益。与PoW不同的是,验证者不需要使用大量的实际算力资源,因为它们是随机选中的,也不需要挖掘区块,只需要在被选中的时候创建区块并且在没有被选中的时候验证他人提交的区块。验证者因创建新区块和证明他们已经看到的区块而获得奖励。
2.2. 挖矿的“黑暗森林”: MEV
随着套利(Arbitrage)、智能合约开发和乐观转账(Optimistic Transfer)的发展,创造了一个全新的工具组合和市场,这是区块链账本系统特有的市场——其中的典型是MEV。这是在公链创新之上又诞生的创新,两项创新相互融合,创造了一个真正强大而独特的获利机制。离以太坊网络出块最近的套利行为是交易抢先打包,典型代表是Flashbots组织,这是催生MEV市场的主力。
MEV的全名是“Miner Extractable Value”,也就是矿工可提取价值。随着DeFi的高速发展而重要性愈加凸显,也被人们称之为“以太坊黑暗森林”。这个概念用于描述以太坊网络上的抢先交易活动——本质上这也是一种套利行为。而矿工实际上在这片“黑暗森林”中属于是绝对强者的存在,因为他们既是选手又是裁判。因为矿工可以利用自己的特权,重新排列交易顺序,插入某些交易或优先进行某些交易来使自己或某些人从中获利。
由于链上的一个区块只能容纳一定数量的交易,其余交易则进入内存池(Mempool)排队,实际上矿工在选择处理内存池中的待处理的交易时拥有完全的自主权(只要最后产生的区块符合标准即可,其余可由矿工自行决定),内存池是矿工用来存储待上链确认交易的一个“容器”。为了获取尽可能多的收益,矿工通常以选取最高的gas价格即交易费的标准来处理交易,但实际上ETH网络并没有要求任何人这么做。也正是因此,矿工可以利用他们的权利对交易进行重新排序并从使用者那里获得额外的利润,这其中所创造出来的价值就被称为矿工可提取价值。
大多数情况下,矿工处理待上链交易时的最重要考量并非根据用户提交的时间,而是用户愿意付出的交易费用多少而定。因此,MEV这个术语已经变得越来越常见,但我们目前能够看到的大部分各种形式的MEV实际上是来自一些第三方的机器人或服务而并非矿工本身。例如某些机器人程序可能会监控mempool如果他们发现一些潜在的套利机会,会以更高的GAS费执行同样的交易抢跑从而“窃取”利润。MEV交易中的一小部分收益通过 Gas 费的形式由矿工获取。以Flashbots为例:由Flashbots推出的针对gas费和拥堵等问题所提出的节点解决方案MEV-Geth已获得ETH网络相当大一部分算力的支持。而Flashbots本身的愿景其实是消除信息不对称并将可能存在的套利机会公之于众以便让所有人共享。
Flashbots引入了“寻找者”、“交易捆绑包”和“区块模板”三个概念:
首先,矿工可以委托第三方的“寻找者”去发现交易并进行排序。“寻找者”之间本身就存在竞争以找出利润最大化的交易顺序,并用标准的“交易捆绑包”将其放入下一个区块。其次,这些“交易捆绑包”会在矿工主持的暗标拍卖中估价。最后,生成带有交易序列信息的“区块模板”上链。
这样做好处在于矿工可以得到部分MEV的价值,以此来降低高Gas费的交易对其的吸引力。一旦用户发现他们无法单单通过提高Gas费来吸引矿工优先处理自己的交易,就会降低自己的频率,从而缓解了拥堵又进一步降低了Gas费。
简单来说,虽然MEV是以“牺牲”普通用户为代价的,但MEV也是一定程度上不可避免甚至必须的。只要网络中存在相对公平且公认的排序协议,利用这些协议进行套利的MEV也必然存在。MEV实际上也是一种激励措施,以促使用户主动参与市场的自我平衡和调节。例如在链上不同DEX中若存在差价,则MEV有助于进行尽可能快的套利并使得价格达到平衡从而保证不同的DEX都能够反映市场的真实行情。最常见的MEV形式是在多个去中心化交易所(DEX)之间进行套利的第三方机器人,以及链上的DEX交易所和链下的CEX交易所之间也会出现很多的套利机会。
3.以太坊区块到底“合并”了什么?
3.1.以太坊“合并”了哪些数据结构?
合并(merge)早就在以太坊的发展规划中,然而面对成熟的PoW矿工和发达的矿机产业来说,合并绝非易事,其面临的利益分歧和技术障碍也是显而易见的。为了能够使得既定的PoS路线能够顺利进行,尽可能平滑过渡,当下(合并前夕)最新的发展状态是以太坊2.0,通过引入信标链(Beaconchain,即ETH2),基于PoW底层区块运行,并在信标链上推进分片(sharding)的开发。这一切工作为当前精神领袖Vitalik力推PoW切换PoS做足了基础准备——因为当前的架构下切换共识机制只引入“最小破坏”影响。否则,很难想象以太坊这样运行了8年的庞大生态进行如此大的转换。
以太坊此次合并本质上是将ETH2.0状态下的PoW主链(ETH1)去除,代之以按照PoS共识机制运行的信标链来作为共识层——或者说是将工作量证明的主链和信标链“合并”。简单来说,之前引入的信标链这一层有点像过渡时期的隔离墙,时机成熟直接“喧宾夺主”,作为最终的共识层,PoW底层被直接剥离。合并后,主链将从PoW 切换到PoS共识机制。除此之外,大多数客户端的功能(如EVM)、状态以及其如何执行事务,都将保持不变。合并后,当前的 ETH1 和 ETH2 客户端分别成为以太坊的执行层和共识层(或引擎)。这意味着 ETH1 或信标链客户端的节点运营商将需要运行全部堆栈的“另一半”以成为完全验证的节点。
此次合并以“最小破坏”原则进行,这使得原来运行的应用客户端可以无感地切换到PoS。由于PoW不复存在,信标链区块将包含执行层(ExecutionPayloads),执行层是当前工作量证明链上区块的合并后等价物。对于最终用户和应用程序开发人员来说,执行层是其与以太坊进行交互的地方。该层上的应用程序仍将由执行层客户端(如常用的Besu、Erigon、Geth、Nethermind等)处理。因此,由于执行层的稳定性,合并只引入了最小的破坏性更改。这一点,在以太坊2.0设计之初就被考虑到了,信标链先是作为PoW之上的中间层存在,类似第二层共识网络,待到“合并”,将这一层直接作为共识层,并将PoW层内的执行相关组件组合到新的共识层。
合并后的区块数据结构保持不变,无用字段设置为0或者等效值。合并后,之前包含在工作量证明块头中的几个字段不再有用,但为了最大限度地减少对工具和基础设施的破坏,这些字段从数据结构中完全删除,而是设置为 0或者相应的等效值。这样,对于应用程序执行和开发者来说,此次合并带来的影响程度降到了最低。
3.2 “合并”的影响到底是怎样的?
通过上面的对比我们可以看出,合并实际上是以“最小破坏性”的原则推进,对应用层来说几乎是无感的,而区块底层和应用层之间的各类组件,理论上并不会受到太多影响并会继续存在下去。
值得注意的是合并完成后,交易排序的流程并没有产生太大变化。同样我们也有理由相信MEV仍然会继续存在。不同之处在于,决定交易顺序的人由矿工变成了验证者,验证者将被随机选中参与到信标链的执行。这也意味着我们前文提到的以Flashbots为代表的MEV分配机制也会继续存在。
MEV是非常难以衡量的,但即便如此,在合并之后验证者也可以选择将他们手中的资源集中在一个共同验证者池中来抵消选中概率和 REV 分布的差异(一定程度上类似矿池)。虽然以太坊 PoS 的机制使得验证者能够通过有效证明获得几乎恒定的奖励(而并非像 PoW 那样只集中在产生一个区块时获得)。但在验证者奖励中继续引入 MEV 机制同样是一种集中力量抱团取暖的体现并迫使更多独立验证者加入一个共同验证者池以获取更低的不可预测性和更快速的流动性,这与PoW时代的矿池具有类似的吸引力。
由此可见,一些区块层面的细微变化还是存在的,后续影响有待观察。类似MEV、闪电贷等组件应用,深入到区块数据结构的堆栈,使得合并的影响还需要在日后实践中观察。例如,随着danksharding、更大区块等新的研发推进下,我们认为,PoS机制下,闪电贷有可能出现新的形态,甚至在特殊的套利需求推动下,闪电贷和MEV相结合的应用也是可以期待的:另外对mempool的安排也值得跟踪和观察。毕竟,以太坊未来的技术路线还存在很多不确定性和想象空间。
4. 投资建议:关注公链生态及流动性质押服务商
以太坊自诞生以来已经历过两轮行业周期的检验,仍是公链生态的标杆、区块链创新的源泉,目前在各类底层技术突破,包括ZKrollup、分片、Danksharding等方面都做了诸多尝试。此前的POW挖矿为系统的安全、稳定做出了贡献,转POS之后,公链生态的竞争将进入2.0阶段,是Solana的另起炉灶还是Polygon的借力打力?公链在底层、应用、资本等方面的全方位竞争值得期待。
同时,随着以太坊合并日期的逐渐迫近,质押风险的降低、赛道生态的日渐繁荣,我们认为合并前后将迎来以太坊质押比例的陡增。而且质押渠道的边际增长将更多来源于除以太坊官方、交易所之外的流动性质押服务商来源。官方奖励比例的降低,也将促使用户选择具有更多DeFi增值的服务商平台(如Lido),来获得更高的年化收益。
与此同时,以太坊的升级目的将是更多地支持链上生态发展,底层各类服务商均以此为目标。在过去几年中,我们看到以太坊引领了DeFi、NFT等创新趋势,包括矿工在内的生态玩家也都因此受益。合并POS后,质押者受益仍与链上应用的繁荣程度息息相关,元宇宙、Web3.0的到来为将来的ETH提供了更广阔的的空间,毕竟这一新兴赛道推崇原创,以太坊生态仍最具看点。