加密与AI整合的范式升级:开创代理互联网新纪元
撰文:Davide Crapis
编译:深潮TechFlow
在最近几个月,"加密×AI(加密与人工智能的交集)"或“加密+AI”(通过人工智能增强的加密货币基础设施)的主题一直备受关注。区块链社区中的许多人对此感到兴奋,有些人持怀疑态度或尚未被说服,还有一些人正在建设它。处于区块链和人工智能交汇处的实时项目已经进行了改进,许多新项目正在涌现。
在过去的一年里,我一直在这个领域进行研究,特别是关于运行在区块链基础设施上的人工智能代理。我们在以太坊基金会、Flashbots和DeepMind等机构的一些同事一起组成了一个研究小组。我们正在继续推动应用研究的边界,以了解和测试哪种类型的人工智能代理应用程序最适合区块链,以及我们需要哪些新的基础设施来支持它们。
在这篇文章中,我将论证整合区块链基础设施和人工智能代理是可取的,并且将产生一个代理互联网:这是对当前互联互通范式的升级,加强了激励和现代密码学,这将使我们能够获得由具有前所未有的安全性、效率和合作潜力的人工智能代理驱动的经济的好处。
然后,我将讨论实现这一目标的路径。我将重点介绍短期用例和应用,其中一些已经在设计和开发中。我将讨论它们的局限性和潜在的改进,以及人工智能和区块链在中期解锁新用例所需的研究。
区块链作为代理互联网的后端
让我首先说,这个论点的风格将是投机性的但又是实用的。区块链和人工智能是过去十年中进展最迅速的两种技术。两者对互联网的结构和人类社会产生了深远的影响。因此,要描绘这些技术将如何发展和相互作用的有意义的愿景,需要一些投机。然而,尽管扩展规律清楚地指出了快速改进的方向,但我会避免对AGI的长期投机。 (尽管最近炒作很大,但我认为我们离自主自我改进的AGI相对较远,尚不清楚它们将采取什么形式。)
我将专注于短期到中期未来,其中人工智能采用人类助手和代理的形式。在这种形式中,人工智能是一种服务于人类的工具,通过促进人类活动的执行或执行新的服务于人类的活动。
图1.左侧:随着性能增加的人工智能演变的概念时间线。右侧:人类活动和不同形式人工智能的活动的块图。
多年来,助手以各种形式存在,而最近对LLMs的进展表明,新一代人工智能代理将比以前更有能力并且进展迅速。以下是我对AI代理的工作定义:
与世界互动的计算机程序。它通过传感器(输入数据)感知其环境,自主处理数据(预测和规划),并采取行动以实现目标(行动)。
代理可以受到约束,也可以从环境中学习。今天,代理通常专门针对特定类型的输入和特定类型的动作。例如,聊天机器人(如ChatGPT)以文本提示作为输入,可能使用一些工具生成答案,并以文本输出回应。另一方面,交易机器人以过去的市场状态作为输入,预测未来的市场状态和最优动作,并执行交易。代理可以是不同类型的(例如,聊天机器人是LLM,而交易机器人是小型RL代理),它们也可以组合以执行任务。在未来,我们可能会发现一个通用架构,可以训练以处理大多数用例。
区块链具有独特和可取的特征
公共区块链具有一组独特的特征,使它们非常适合于人工智能代理的通信和交互。稍后我们将论证它们构成了支持代理AI的最佳后端之一。
- 去中心化:设计良好的区块链协议是去中心化的。此外,去中心化是最初构建和升级它们的社区的精神的一部分。它被构建到协议中,并通过治理得到保护。
- 激励:设计良好的区块链具有健全的激励机制,通过原生资产(例如,以太坊中的ETH)推动经济安全。此外,可编程的智能合约使得应用程序可以:利用原生资产、发行具有期望属性的新数字资产、为其参与者定义自己的原生资产和激励机制。
- 开放性和组合性:区块链平台对用户和应用开发者都是开放访问的。此外,基于部署在区块链上的智能合约的应用程序继承了开放性和无摩擦组合性的同样属性。
- 密码学保证:区块链利用现代密码学提供独特的安全性、可审计性和可编程隐私水平。结果是,它们是信任最小化的,比遗留系统更安全。注意,区块链黑客来自智能合约的漏洞,这在技术的早期阶段是不可避免的。随着技术栈的成熟,它变得更加稳健和安全,而依赖人类信任的传统系统没有这个属性。
我们可以与传统互联网进行对比,后者只具有去中心化。基层协议如TCP/IP或SMTP是开放的,但几乎所有在其上构建的应用都是专有的。这使得互联网的组合性较差,我们认为这是设计代理互动协议的关键属性。此外,互联网在协议层完全缺乏激励和现代密码学。
接下来,我们将介绍一个理想的经济模型,其中人类和代理合作,并展示它需要区块链协议提供的整套特性。
区块链对AI代理的好处
快进几年。假设我们到了AI代理可以执行大量人类活动,并且具有足够的决策和规划能力的时代。它们也可以自主执行任务,可能与其他代理合作。代理在社会中被广泛部署,并承担对人类具有潜在高价值的活动,无论是社会价值还是财务价值。
以下是我们希望这些代理AI系统及其与人类的互动具备的一些属性/愿望,以及区块链如何使之成为可能。
代理系统需求
- 一致性:代理一致性的某些方面,例如价值学习、可解释性和可操纵性,取决于人工智能设计和培训过程,而这些过程在很大程度上不会直接利用区块链。然而,区块链应用程序的开放性和可组合性可以提供独特的机会,使代理活动清晰、自动监控和可归因,这是激励分配和代理系统协调的关键。
- 安全性:区块链旨在在价值巨大的对抗性环境中以最小的信任假设提供可靠和安全。通过智能合约应用互动的代理继承了这些强大的属性。此外,现代密码学的进步,如零知识证明,为智能合约应用提供了超强力量。例如,应用程序可以要求对敏感计算进行证明,而代理权重和输入可以保持私有。可信智能合约也是限制代理行动空间和设置默认和条件权限的理想工具。
- 发现:应用程序间环境的开放性允许根据应用状态以及代理过去的表现进行更丰富的请求路由,这些都可以被完全观察到。很容易想象代理基于其行动历史可信地积累声誉,然后以程序化的方式用于任务的排名和发现最佳代理。
- 效率:区块链基础设施通过允许代理在没有直接人类干预的情况下执行重要决策,包括支付,并且成本低廉,增强了代理的自主性。
人类的愿望
- 控制和可编程隐私:区块链使人类能够直接拥有并维护对其代理的控制,无需中介。个人数据可以保持私有,使用密码学小工具条件性地控制访问,从完全私有计算(TEE/FHE)到通过zk证明可编程分享选定属性。
- 所有权和公平性:人们可以建立协议来共同拥有和管理代理。代理工作的奖励可以通过编程方式分配到最小的一美分。公平性可以通过协议升级和民主治理来衡量和改善。区块链基础设施与正在开发的现代身份解决方案相结合,还可以支持和自动化雄心勃勃的分配计划,例如全民基本收入(或 UBI),这是一个重要的长期应用。
AI供应链简述
值得注意的是,除了通信和互操作性之外,区块链基础设施还可以惠及整个模型生产供应链(数据收集、数据策划、训练、微调)。正在开发的许多应用程序,包括多个数据收集协议和计算市场。它们是去中心化AI堆栈的重要组成部分,但我们在这里不讨论它们。
全球监管和治理
区块链提供了多种协议,可以在其中可信地执行广泛的规则和检查。在我看来,这是对AI市场和应用进行全球监管的独特机会,可以轻松进行审计和合规性检查。跨协议的透明度也使得很容易实时识别偏差并部署纠正修复,这在传统系统中是不可能的。
区块链基础设施的风险和成本
在训练做出敏感和有影响的决策的AI代理时,开放性并不总是可取的。例如,部署一个开放权重模型,用于保险核保决策,可能会暴露模型漏洞并增加遭受攻击/利用的可能性。
一种解决方法可能是利用现代密码学保持代理私有,但其行为公开。然而,黑盒对抗性机器学习攻击仍然可能,并且一般来说,安全但可验证的机器学习计算的密码学方案成本高昂,这增加了本已昂贵的训练过程的开销。这是AI安全和区块链交叉研究中最重要的领域之一。我们需要在实践中使其技术和经济上可行。一项最近的创新是针对ML计算的乐观证明,我将在下文讨论。
另一个已经讨论过的风险是,基于LLM的预言机降低了部署可以正确分配激励到现实世界中潜在有害行动的门槛。今天这还不可能,但应该更多地研究如何启用积极用例,以及如何检测和预防有害行为。
基于区块链的系统可以增长以满足需求
一个经常出现在不熟悉当前区块链系统状态的人们心中的问题是,它们是否准备好容纳用户活动增加带来的负载。
至少在过去五年里,这一直是区块链研发的重点,而今天,我们正处于转折点,许多解决方案正在上线,并且可扩展性提高了几个数量级。例如,以太坊及其第2层区块链继承了完整的经济安全性和可扩展的数据可用性解决方案,很快将能够处理每秒数万笔交易(TPS)。新的链正在上线,利用并行化每秒处理数十万笔交易。共享排序解决方案和安全桥将允许部署在不同域中的应用程序安全有效地互操作。零知识证明聚合的进步将使交易变得更加便宜,并实现新型的链下计算和混合系统,从而使安全权衡更加有效。
随着所有这些基础设施创新在未来几年成熟,毫无疑问,成熟的区块链生态系统将能够支持非常高的吞吐量,从今天的每秒数万TPS到每笔交易成本极小的百万TPS。
通往代理互联网之路
上图是一张宝藏地图,代表了通往代理互联网路径上的三个主要步骤。
让我们一一探究。
增强当前的去中心化应用程序
第一步是用AI增强当前的区块链应用。AI已经在去中心化金融(DeFi)中发挥作用,这是迄今为止最受欢迎的应用类别。这采取了专门的模型形式,不断监控市场状态以采取特定行动。例如:交易机器人、清算机器人、路由机器人、统计套利机器人,以及更广泛地执行旨在从用户交易流中提取利润(也称为MEV)的策略的机器人。
随着区块链经济在当前 DeFi基础上发展,很自然地从这里开始讨论利用人工智能的机会。
DeFi增强
区块链协议目前是自动化的,但与它们的接口非常手动,有时笨拙,经常效率低下。AI有潜力成为连接人类和链上市场的新接口,通过智能代理的调解。至少有三个领域有具体的增强当前协议的机会。
- 用户意图匹配:用户与AI代理互动以传达、有时构建/细化他们的意图,AI将其匹配到用户委托给它的一系列链上行动。意图采取一个目标和多个防护措施的形式,行动可以是一次交易或在更长时间尺度上执行的结构化计划。一个简单的意图示例是
- “我想以不高于$Z的价格获得X单位的代币Y”或者
- “我想在接下来的六个月里每月投资$Z于以太坊第二层项目”,或
- “我想将我的$ETH重新质押给EigenLayer并将其委托给AVSs,APR至少为X%,风险因子最多为Y%”。
- 虽然第一个示例只需要几次交易,但其他示例需要制定计划、在计划范围内执行多个交易的计划、多个价格反馈、风险和回报的预测模型以及上下文信息。
- 行动规划和路由:在以太坊区块链上发送交易的基础设施变得更加成熟和复杂。现在有不同的路线优化不同的愿望:安全性、速度、价格效率、隐私。甚至还有一个协议旨在使部署新路线变得更容易。类似于今天的DEX聚合器对个别交换所做的那样,可以设计更高级的路由算法,这些算法还考虑到更广泛的交易供应链背景和各种应用。特别是当代表用户或在Layer 1协议上购买服务的Layer 2应用程序规划长期策略时,行动空间相当大,随着新机制的部署正在扩大。例如,对用户投资组合优化的最佳计划可能是将他们的资金部分重新部署到一个更便宜的Layer 2,并在那里执行他们的投资。
- 共享基金和资产池:创建和管理基金,其中许多人汇集资源,达成目标,然后将执行委托给AI代理。这需要意图匹配和行动规划的方面,以及区块链可以独特提供的共享所有权机制。例如,现代版的数字艺术收藏代理将需要所有这些能力,并且还利用最新一代LLM提供的更丰富的背景,既为综合社区偏好,也为识别匹配它们的资产。
在所有这些情况下,我们都有一个主要的人类或社区将高价值的链上行动外包给一些在链下运行的代理。因此,有很大的推断保证需求。这可以通过两种方式实现:
- 在链下运行一个代理网络,具有自己的安全假设。例如,通过重新抵押或运行具有特意设计的激励措施的L1,利用锚链上资产的经济安全或ETH经济安全。
- 使用链上智能合约设计代理编排协议,该协议需要推理证明来确保操作有效性。这可以通过zkML(zk-proofs)或opML(乐观证明)来实现。这两个领域都进展迅速,但opML是一个非常有趣的解决方案,可以经济地确保大型LLM执行,而如今使用加密安全的zk-proofs 来实现这一点是不可能的,或者成本过高。
AI服务协议
一个相关类别是用自治代理增强协议基础设施,而不是零售应用。这里的大多数应用类似于为传统商业服务构建的基于代理的产品,但这些代理可以利用区块链的开放性、活跃性和数据丰富性。
例如,作为智能合约安全审计员/测试员的代理、分析代理以及自动化财务和风险管理服务。专注于 Web3 的公司已经提供了各种类型的此类服务,但代理自治和推理证明方面的进步现在提供了去中心化和消除从关键服务到协议操作的信任的机会。
一个新的应用领域是内容管理。随着Farcaster 和Lens 等去中心化社交媒体的兴起,代理自动化/中介管理的新机会出现了。然而,这些需要创建新的机制来协调我们现在描述的代理协作。
打造代理服务新机制
我们可以利用区块链创建可信承诺设备的超能力来实施直接利用代理用户的新应用程序和新市场机制。从这里我们将开始观察协调许多代理以提供新服务的力量。我们在最近的论文中详细讨论了这个主题,在这里我想重点讨论一些具体的应用。
https://www.coindesk.com/consensus-magazine/2024/03/04/how-ai-crypto-will-lead-to-a-hyper-financialized-future/
AI预测市场
短期内最令人兴奋和具体的应用是AI预测市场。DeFi解锁了在区块链上交易长尾资产的能力,如小协议的效用代币,这些代币在传统市场中无法交易,因为支持它们的基础设施运营成本太高。AI预测市场有潜力用超长尾资产做同样的事情。人们关心的最小事件的结果可以被代币化并交易。要使这些市场工作,它们需要:
- 有效的价格发现:包括有意义的流动性和大量的交易量以聚合信息。
- 可信的市场解决方案:市场需要可信且高效地解决。
AI可以通过让专业交易代理查询LLM以获取事件的概率估计,然后下注,如在最近的大规模竞赛中所示,自动化这些操作。也有人建议,多轮争议协议可以用于自动化市场解决,在早期轮次中使用LLM,只有在升级到后期轮次的案件中才涉及人类。
一旦这些市场工作,它们就成为了一种新的原语,用于完全自主地评估小不确定性,无需依赖中央权威,后者可能面临安全威胁或偏见。可以在此基础上构建各种应用:小额保险、金融产品、去中心化社交媒体上的内容调节、垃圾邮件过滤等。
为专用模型提供可靠高效的路由选择
今天,大多数人类和AI互动被隔离在具有通用模型的专有环境中,无论是封闭的“前沿”模型(重模型)还是开放权重模型(轻模型)。然而,GPT Store的早期成功,以及类似聚合器,指向了一个世界,上述互动模式只是进入一个广阔的GPT供应,具有代理能力和专业技能的入口(即,我们很快就会从解释扑克规则到玩扑克,从规划行程到预订全程行程)。
在那个世界中,有一个明确的需求,需要高效地将用户会话路由到最能以最佳方式满足他们意图的专业模型。当代理代表用户进行交易时,将有大量的价值可以从服务用户中提取。无论是路由器/中介方(提取租金)还是终端模型方(误报结果/性能以获取更多流量),都有提取价值的激励。因此,有一个明确的需求,需要可信路由机制和市场,服务提供商将竞争以满足用户偏好。这是我非常期待的一个即将到来的应用领域。
为新市场创建构建模块
随着更多具有专业技能的代理被部署并在链上积累历史,可以开发更强大的基础设施的构建块。例如,代理发现协议,包括基于过去结果和代理排名的声誉、基于预测结果的微服务自动投标等等。
这是一个迭代过程,需要数年时间才能完全实现,随着每一波新的代理服务协议的创建,通信、声誉和交换基础设施的新迭代也会不断发展。最终目标将是最有效的数字协调机制系统,极其便官且免租金,这将成为世界经济份额不断增加的支柱。最终,随着代理能力的不断增强以及更多现实世界活动的自动化,我们可以预期大部分社会经济交易将在这一基础设施上解决。
扩展共享所有权和治理
一旦规模化,解决共享所有权、公平价值分配和智能代理生产系统治理等问题将变得至关重要。区块链提供了实现该解决方案的基础。今天,我们正处于实验的早期阶段,但出现了一些有趣的模型。我们有两个极端:
- 直接所有权和治理最小化:这是一种协议治理最小化的模型,类似于比特币。该协议是最小的并且相对固定。代理资产/资源所有权机制很简单,代理资产由其创建者直接拥有,并根据其使用量按比例累积价值。有一种原生网络代币可以简单地用作实用程序、支付服务费用以及作为奖励贡献的有价值的资本资产
- 共享所有权和DAO治理:另一个极端是更丰富的协议,更像我们今天在以太坊上看到的应用。有一个丰富的协议规范,其参数可以通过显式治理过程进行更改。原生代币可以用于治理,并具有更丰富的激励机制,使不同系统组件的共享所有权成为可能。
第一个类似于Morpheus正在试验的东西,第二个类似于Olas,这两个都是构建自治代理经济的早期尝试。我们仍处于这些新类型的基于代理的协议的早期阶段,将有新的应用和新的能力可能改变激励和所有权模型的设计方式。这只是展示协议设计师可用的广泛解决方案范围的两个非常不同的示例。最后,请注意,除了代理经济之外,人工智能堆栈的其他级别也存在类似的问题,并且类似的解决方案可用于激励人工智能培训、数据和基础设施服务。