为何zkSync总是“宕机”?一文探讨zkSync Workflow
撰文:
看有朋友吐槽zkSync总是宕机,其实称“宕机”略微言过其辞了,准确说是“出块不稳定”。 本质上是,Sequencer提交的交易,最终Verified的时间不稳定,但用户在交互端感知并不明显,因为zkSync的Verify设计就存在确认滞后性。 未来去中心化阶段不稳定性会得到缓解。我画了个workflow和大家探讨下。
之所以有用户感知“宕机”,可能是某些DApp和链底层兼容性导致的交易失败问题,毕竟在zkSync上开发DApp本身挑战就很大。 我从官方浏览器观察Commit到Verified的Status改变大致需要30min-1小时左右,而用户端交互DApp几乎不受此影响。 此文重点在科普zkSync的技术底层逻辑,带大家清晰地认识zkSync。
如workflow所示,zkSync运行分以下步骤:
1)User通过relay转发向Sequencer排序器发送批量交易;
2)Sequencer负责对交易进行排序、聚合打包batch成Merkle树;
3)zkPorter将Merkle树生成zk-SNARK证明;
4)zk-SNARK证明分别relay给L2的Validators和L1 主链生成 Commit Hash
5)Validator负责验证zk-SNARK证明的正确性,无误后提交给L1智能合约生成Verify Hash; 6)L1上的zkSync智能合约校验Commit Hash 和Verify Hash的匹配性; 7)成功匹配后生成Verified Transaction交易最终上链; 8)若匹配失败,原来的Commit Hash作废,由Sequencer重新提交batch再走一遍流程。
这里需要强调下,zkSync采用了“二阶段提交(2PC)”,通过前后Commit Hash 和Verify Hash两个阶段的Hash校验最终确定合法交易批次。 这样做一方面可以确保系统运转流程中的数据一致性安全,我个人理解,也是一种让Sequencer和Validator两个系统组件互相约束的去中心化思想显现,值得点赞。
zkSync的Workflow主要有Relay、Sequencer、zkPorter、Validator四大角色,协调工作中会存在诸多“不稳定因素”。 可概括为节点职能稳定性,节点协作稳定性,及算法和底层协议复杂性等。任一环节出现差错,都可能导致出块延迟。常见的 Arbitrum Sequencer技术故障就是典型,zkSync面临的挑战只会更多。
至于算法复杂性,这是zkSync链的天命所归,需要生态开发者们铆足劲去克服。而节点智能和协作的稳定性,我觉得未来去中心化阶段到来后,会得到有效改善。逻辑也简单:
1)多分布式节点,可避免单点故障带来的网络不稳定,系统鲁棒性使然;
2)分布式通证激励机制可给开发者维护节点稳定提供源动力。
换个角度思考,Verifing时间长在生态初期并非问题,可以有效提升链的安全性,避免系统中若干节点作恶。 总之,若厘清zkSync的整个运营流程,进一步了解下layer 2的技术复杂性和其中为安全性所设计的“特殊”机制,能巩固对L2技术赛道的信心。 欢迎大家转发分享,随时DM我,一起深入交流学习zkSync。