Vitalik：The Surge阶段以太坊协议应该怎么发展

Bitget App

交易“智”变

Bitget

资讯中心

币界网2024/10/17 04:30

作者:币界网

以太坊以Rollup为中心的路线图，怎么实现Surge阶段的关键目标

按：本文为以太坊创始人Vitalik近期发表的“以太坊协议的未来发展”系列文章的第二部分“Possible futures for the Ethereum protocol, part 2: The Surge”，第一部分见此前报道“以太坊PoS还有哪些可以改进”。由邓通编译，以下为第二部分全文：

一开始，以太坊的路线图中有两种扩展策略。

其中之一是“分片（sharding）”：每个节点只需要验证和存储一小部分交易，而不是验证和存储链中的所有交易。这也是任何其他点对点网络（例如 BitTorrent）的工作原理，因此我们当然可以使区块链以同样的方式工作。

另一个是 2 层协议：网络将位于以太坊之上，使它们能够充分受益于其安全性，同时使大多数数据和计算远离主链。 “2 层协议”指的是 2015 年的状态通道、2017 年的 Plasma，以及 2019 年的 Rollups。Rollup 比状态通道或 Plasma 更强大，但它们需要大量的链上数据带宽。

幸运的是，到 2019 年，分片研究已经解决了大规模验证“数据可用性”的问题。结果，两条路径融合了，我们得到了以Rollup为中心的路线图，这仍然是以太坊今天的扩展策略。

The Surge，2023 年路线图版。

以Rollup为中心的路线图提出了一个简单的分工：以太坊 L1 专注于成为一个强大且去中心化的基础层，而 L2 则承担帮助生态系统扩展的任务。这是社会各处反复出现的模式：法院系统（L1）并不是为了超快速和高效，而是为了保护合同和财产权，而企业家（L2）则需要在此基础上进行构建坚固的基础层并将人类带到（隐喻和字面上的）火星。

今年，以Rollup为中心的路线图取得了重要成功：以太坊 L1 数据带宽通过 EIP-4844 blob 大幅增加，并且多个 EVM Rollup现在处于第一阶段。分片的非常异构和多元化的实现，其中每个 L2 充当具有自己的内部规则和逻辑的“碎片”现在已成为现实。但正如我们所看到的，走这条路有其自身的一些独特的挑战。因此，现在我们的任务是完成以 Rollup 为中心的路线图，并解决这些问题，同时保留使以太坊 L1 与众不同的稳健性和去中心化性。

Surge：关键目标

L1+L2 上 100,000+ TPS

保持 L1 的去中心化和稳健性

至少一些 L2 完全继承了以太坊的核心属性（去信任、开放、抗审查）

L2 之间的最大互操作性。以太坊应该感觉像是一个生态系统，而不是 34 个不同的区块链。

可扩展性的三难困境

可扩展性不可能三角是 2017 年提出的一个想法，它认为区块链的三个属性之间存在紧张关系：去中心化（更具体地说：运行节点的低成本）、可扩展性（更具体地说：处理大量交易）和安全性（更具体地说：攻击者需要破坏整个网络中的大部分节点才能使单个交易失败）。

值得注意的是，三难困境不是定理，介绍三难困境的帖子没有附带数学证明。它给出了一个启发式的数学论证：如果一个去中心化友好的节点（例如消费者笔记本电脑）每秒可以验证 N 个交易，并且您有一个每秒处理 k*N 个交易的链，那么（i）每个交易只能被看到1/k 的节点，这意味着攻击者只需破坏几个节点即可推动不良交易，或者 (ii) 您的节点将变得强大并且您的链不是去中心化的。这篇文章的目的从来不是为了表明打破三难困境是不可能的；相反，它是为了表明打破三难困境是困难的——它需要以某种方式跳出论证所暗示的框框进行思考。

多年来，一些高性能链经常声称他们解决了三难困境，而没有在基础架构层面采取任何巧妙的措施，通常是通过使用软件工程技巧来优化节点。这总是具有误导性，并且在此类链中运行节点总是比在以太坊中困难得多。这篇文章探讨了为什么会出现这种情况的许多微妙之处（以及为什么 L1 客户端软件工程无法单独扩展以太坊本身）。

然而，数据可用性采样（DAS）和 SNARK 的结合确实解决了三难困境：它允许客户端验证一定数量的数据是否可用，以及是否正确执行了一定数量的计算步骤，同时仅下载该数据的一小部分并且运行的计算量要小得多。 SNARK 是不可信的。数据可用性采样具有微妙的少数 N 信任模型，但它保留了不可扩展链所具有的基本属性，即使 51% 攻击也无法迫使网络接受坏块。

解决三难困境的另一种方法是 Plasma 架构，它使用巧妙的技术以激励兼容的方式将监视数据可用性的责任推给用户。早在 2017-2019 年，当我们扩展计算所需的只是欺诈证明时，Plasma 的安全功能非常有限，但 SNARK 的主流化使得 Plasma 架构比以前更适用于更广泛的用例。

DAS的进一步进展

我们要解决什么问题？

截至 2024 年 3 月 13 日，当 Dencun 升级上线时，以太坊区块链每 12 秒时段有 3 个约 125 kB 的“blob”，或者每个时段约 375 kB 的数据可用带宽。假设交易数据直接发布到链上，ERC20传输约为180字节，因此以太坊上rollups的最大TPS为：

375000 / 12 / 180 = 173.6 TPS

如果我们添加以太坊的 calldata（理论最大值：每个插槽 3000 万个 Gas / 每字节 16 个 Gas = 每个插槽 1,875,000 字节），这将变为 607 TPS。对于 PeerDAS，计划将 blob 计数目标增加到 8-16，这将为我们提供 463-926 TPS 的 calldata。

这相对于以太坊 L1 来说是一个重大的提升，但这还不够。我们想要更多的可扩展性。我们的中期目标是每个插槽 16 MB，如果与汇数据压缩的改进相结合，将为我们提供约 58,000 TPS。

PeerDAS是什么以及它是如何工作的？

PeerDAS 是“一维采样”的相对简单的实现。以太坊中的每个 blob 都是 253 位素数域上的 4096 次多项式。我们广播多项式的“份额”，其中每个份额由从总共 8192 个坐标集中获取的相邻 16 个坐标处的 16 个评估组成。 8192 次评估中的任意 4096 次（使用当前建议的参数：128 个可能样本中的任意 64 个）都可以恢复该 blob。

PeerDAS 的工作原理是让每个客户端侦听少量子网，其中第 i 个子网广播任何 Blob 的第 i 个样本，并另外通过询问全球 p2p 网络中的对等方来请求其他子网上所需的 Blob （谁会监听不同的子网）。更保守的版本 SubnetDAS 仅使用子网机制，没有额外的请求对等层。当前的建议是参与权益证明的节点使用 SubnetDAS，其他节点（即“客户端”）使用 PeerDAS。

理论上，我们可以将 1D 采样扩展得相当远：如果我们将 blob 计数最大值增加到 256（因此，目标为 128），那么我们将达到 16 MB 目标，而数据可用性采样只需每个节点花费 16 个样本 * 128 blobs * 每个 blob 每个样本 512 字节 = 每个槽 1 MB 的数据带宽。这刚好在我们的容忍范围之内：它是可行的，但这意味着带宽受限的客户端无法采样。我们可以通过减少 blob 数量和增加 blob 大小来对此进行优化，但这会使重建更加昂贵。

因此最终我们想要更进一步，进行 2D 采样，它不仅通过在blob内进行随机采样，而且还在blob之间进行随机采样。 KZG 承诺的线性属性用于通过对相同信息进行冗余编码的新“虚拟 blob”列表来“扩展”区块中的 blob 集。

2D sampling.来源：a16z

至关重要的是，计算承诺的扩展不需要 blob，因此该方案从根本上对分布式块构建是友好的。实际构建区块的节点只需要有 Blob KZG 承诺，并且自己可以依赖 DAS 来验证 Blob 的可用性。 1D DAS 本质上对分布式区块构建也很友好。

与现有研究有哪些联系？

介绍数据可用性的原始文章（2018）：https://github.com/ethereum/research/wiki/A-note-on-data-availability-and-erasure-coding

后续论文：https://arxiv.org/abs/1809.09044

DAS 的解释者帖子，范式：https://www.paradigm.xyz/2022/08/das

KZG 承诺的 2D 可用性：https://ethresear.ch/t/2d-data-availability-with-kate-commitments/8081

ethresear.ch 上的 PeerDAS： https://ethresear.ch/t/peerdas-a-simpler-das-approach-using-battle-tested-p2p-components/16541 和论文：https://eprint.iacr.org/2024/1362

EIP-7594：https://eips.ethereum.org/EIPS/eip-7594

ethresear.ch 上的 SubnetDAS：https://ethresear.ch/t/subnetdas-an-intermediate-das-approach/17169

2D 采样中可恢复性的细微差别：https://ethresear.ch/t/nuances-of-data-recoverability-in-data-availability-sampling/16256

还需要做什么，需要权衡什么？

下一步是完成 PeerDAS 的实施和推出。从那时起，不断增加 PeerDAS 上的 blob 计数是一项渐进的工作，同时仔细观察网络并改进软件以确保安全。与此同时，我们希望开展更多关于 PeerDAS 和其他版本的 DAS 形式化及其与分叉选择规则安全性等问题的交互方面的学术工作。

展望未来，我们需要做更多的工作来找出 2D DAS 的理想版本并证明其安全特性。我们还希望最终从 KZG 迁移到抗量子、无需可信设置的替代方案。目前，我们不知道有哪些候选者对分布式区块构建友好。即使使用递归 STARK 来生成重建行和列的有效性证明的昂贵“强力”技术也不够，因为从技术上讲，STARK 的哈希值大小为 O(log(n) * log(log(n)) (与 STIR），实际上 STARK 几乎和整个斑点一样大。

从长远来看，我认为现实的路径是：

理想的 2D DAS 工具；
坚持使用 1D DAS，为了简单性和robustness而牺牲采样带宽效率并接受较低的数据上限；
（硬枢轴）放弃 DA，并完全拥抱 Plasma 作为我们关注的主要第 2 层架构。

我们可以通过权衡范围来看待这些：

请注意，即使我们决定直接在 L1 上扩展执行，这种选择仍然存在。这是因为如果 L1 要处理大量 TPS，L1 块将变得非常大，客户将需要一种有效的方法来验证它们是否正确，因此我们必须使用支持Rollup的相同技术（ZK-EVM 和DAS）和 L1。

它如何与路线图的其他部分交互？

如果实施数据压缩（见下文），对 2D DAS 的需求会有所减少，或者至少会延迟，如果 Plasma 得到广泛使用，则对 2D DAS 的需求会进一步减少。 DAS 也对分布式区块构建协议和机制提出了挑战：虽然 DAS 理论上对分布式重构很友好，但在实践中需要与包含列表提案及其周围的分叉选择机制相结合。