对AI+Crypto各赛道的最新思考与探索
作者: Ian@Foresight Ventures
TL;DR
在深入研究AI和加密货币结合的领域数月后,对这个方向的理解更加深入。本文对早期观点和目前的赛道走向进行了对比分析,对赛道熟悉的朋友可以从第二个section开始看。
- 去中心化算力网络:面临市场需求挑战,特别强调去中心化的终极目的是降低成本。Web3的社区属性和token带来了不可忽视的价值,但对于算力赛道本身来说还是一种附加值,而非颠覆性的改变,重点在于找到与用户需求结合的方式,而不是盲目将去中心化算力网络作为一种对于中心化算力不足的补充。
- AI市场:讨论了一个全链路金融化的AI市场的构想,社区和代币带来的价值和至关重要。这样的市场不仅关注底层算力和数据,还包括模型本身和相关应用。模型金融化是AI市场的核心要素,一方面吸引用户直接参与到AI模型的价值创造过程,另一方面给底层的算力和数据创造需求。
- Onchain AI,ZKML面临需求和供给的双重挑战,而OPML则提供了一种成本和效率更为平衡的方案。尽管OPML在技术上是一个创新,但它未必能解决链上AI面临的根本性挑战,即没有需求。
- 应用层,大部分web3的AI的应用项目都过于naive,AI应用更合理的点在于增强用户体验和提高开发效率,或是作为AI市场中的重要一环。
一、AI赛道回顾
在过去几个月我对AI + crypto这个话题进行了深度的研究,经过几个月的沉淀,很高兴自己在比较早的阶段洞悉到了一些赛道的走向,但也能看到有一些现在看来并不准确的观点。
这篇文章只讲观点不做intro,会覆盖web3里AI的几个大方向并且展示之前和现在我对赛道的观点和分析。不同的视角可能会有不一样的启发,可以对比辩证地来看。
先来回顾一下在上半年定下的AI + crypto几个主要的方向:
1.1 分布式算力
在“理性看待去中心化算力网络”中,基于算力将成为未来最有价值的资源的大逻辑,分析了crypto能为算力网络赋予的价值。
虽然去中心化的分布式算力网络在AI大模型训练上的需求是最大的,但是也面临最大的挑战和技术瓶颈。包括需要复杂的数据同步和网络优化问题等。此外,数据隐私和安全也是重要的制约因素。虽然有一些现有的,技术能提供初步解决方案,但在大规模分布式训练任务中,由于计算和通信开销巨大,这些技术仍无法应用。显然去中心化的分布式算力网络在模型推理上更有机会落地,可以预测未来的增量空间也足够大。但也面临通信延迟、数据隐私、模型安全等挑战。和模型训练相比,推理时的计算复杂度和数据交互性较低,更适合在分布式环境中进行。
1.2 去中心化AI市场
在“去中心化AI Marketplace的最佳尝试”中,提到了一个成功的去中心化AI marketplace需要将AI和Web3的优势紧密结合,利用分布式、资产确权、收益分配和去中心化算力的附加值,降低AI应用的门槛,鼓励开发者上传和分享模型,同时保护用户的数据私有权,构建一个开发者友好,且满足用户需求的AI资源交易、共享平台。
当时的想法是(现在看来可能也不完全准确)基于数据的AI marketplace有更大的潜力。死磕模型的marketplace需要大量高质量模型的支撑,但早期平台缺乏用户基数和优质资源,使得优秀模型提供者的激励不足,难以吸引优质模型;而基于数据的marketplace通过去中心化,分布式地采集、激励层设计和数据所有权的保证,可以积累大量有价值的数据和资源,尤其是私域数据。
去中心化AI marketplace的成功依赖于用户资源的累积和强大的网络效应,用户和开发者可以从市场中获得的价值超过他们在市场之外能够得到的价值。在市场的早期,重点在于积累优质模型以吸引并保留用户,然后在建立起优质模型库和数据壁垒后,转向吸引和留住更多的终端用户。
1.3 ZKML
在ZKML的话题被广泛讨论之前就在“AI + Web3 = ?”中对链上AI的价值进行了讨论。
在不牺牲去中心化和trustless的基础上,onchain AI有机会带领web3世界进入“next level”。目前的web3就像是web2的早期阶段,还没有承接更广泛应用或者创造更大价值的能力。而onchain AI恰好为了提供一种透明的、trustless的解决方案。
1.4 AI应用
在“AI + Crypto出发聊聊Web3女性向游戏—HIM”中,结合portfolio项目“HIM”解析了大模型在web3应用上带来的价值;什么样的AI + crypto能给产品带来更高回报?除了硬核地从基建到算法,开发链上trustless的LLM,另一个方向是在产品中淡化推理的过程黑盒带来的影响,找到契合的场景来将大模型强大的推理能力落地。
二、当下的AI赛道分析
2.1 算力网络:想象空间很大但门槛高
算力网络的大逻辑依然没变,但是仍然面临市场需求的挑战,谁会需要效率和稳定性更低的解决方案?因此,以下这几点我认为需要想通:
去中心化是为了什么?
要是现在去问一个去中心化算力网络的founder,他八成还是会告诉你我们的算力网络可以增强的安全性和抗攻击能力、提高透明度和信任、资源优化利用、更好的数据隐私和用户控制、抵御审查和干预……
这些都是common sense,任何web3项目都能扯到抗审查、去信任、隐私等等,但我的观点是这些都不重要。仔细想一下,论安全性难道中心化的服务器不能做的更好?去中心化的算力网络本质上也没有解决隐私的问题,诸如此类的矛盾点还有很多。所以:一个算力网络去中心化终极目的一定是为了更低的成本。去中心化的程度越高,使用算力的成本越低。
所以,从根本上看“利用闲置算力”更多是一种长远的叙事,而一个去中心化算力网络能不能做成,我认为很大程度上取决于他有没有想明白以下几点:
Web3提供的价值
一套巧妙的token设计以及随之而来的激励/惩罚机制显然是去中心化社区提供的强有力value add。相比传统互联网,token不仅作为交易媒介,和smart contract相辅相成能让protocol实现更复杂的激励和治理机制。同时,交易的公开透明、成本的降低、效率的提升都得益于crypto带来的价值。这种独特的价值为激励贡献者提供了更多灵活性和创新空间。
但同时也希望可以理性看待这种看似合理的“契合”,对于去中心化算力网络来说,Web3和区块链技术带来的这些价值从另一个角度看仅仅只是“附加值”,而不是根本性的颠覆,并不能改变整个网络的基本工作方式和突破现在的技术瓶颈。
简而言之,这些web3的价值在于增强了去中心化网络的吸引力,但不会完全改变其核心结构或运作模式,如果希望去中心化网络在AI浪潮里真正占据一席之地,仅仅靠web3的价值是远远不够的。因此,就像后面会提到的,合适的技术解决合适的问题,去中心化算力网络的玩法绝不是单纯地去解决AI算力短缺的问题,而是给这个沉寂已久的赛道一个新的玩法和思路。
可能是像pow挖矿或者存储挖矿一样,把算力作为一种资产进行货币化。在这种模式下,算力的提供者可以通过贡献自己的计算资源来获取代币作为报酬。吸引力在于它提供了一种直接将计算资源转换为经济收益的方式,从而激励更多的参与者加入网络。也可能是基于web3创造一个消耗算力的市场,通过将算力的上游金融化(比如模型),开辟出能接受不稳定、且更慢的算力的需求点。
想明白怎么和用户的实际需求结合,毕竟用户和参与者的需求不一定只是高效的算力,“能赚到钱”永远是最有说服力的动力之一。
去中心化算力网络的核心竞争力是价格
如果一定要从实际价值上讨论去中心化算力,那web3带来最大的想象空间就是有机会被进一步压缩的算力成本。
算力节点的去中心化程度越高,单位算力的价格越低。从以下几个方向可以推演:
- token的引入,支付给节点算力提供者的从现金变为协议的原生代币,这从根本上降低了运营成本;
- 在准入上的permissionless以及web3强大的社区效应直接促成了一种市场驱动的成本优化,更多个人用户和小型企业可以利用现有的硬件资源加入网络,算力供应增加,市场上算力的供应价格下降。在自治和社区管理模式下。
- 协议所创造的开放的算力市场会促进算力提供者的价格博弈,从而进一步降低成本。
Case: ChainML
简单来说:ChainML是一个为inference、finetuning提供算力的去中心化平台。从短期看,chainml会实现基于开源的AI代理框架Council,通过Council的尝试(一个chatbot,可以integrate到不同application中)为去中心化计算网络带来需求的增长。从长期看,chainml会是一个完整的AI + web3平台(后面会详细分析),其中就包括模型市场和算力市场。
我认为ChainML的技术路径规划非常合理,之前提到的问题他们想的也很明白,去中心化算力的目的一定不是和中心化的算力相提并论,给AI industry提供充足的算力supply,而是逐步降低成本让合适的需求方接受这种品质更低的算力来源。那么,在项目初期,在协议无法获取大量去中心化算力节点的情况下,重点就是找到一个稳定且高效的算力来源,因此,从产品路径看,应当是先从中心化的方式做起,在早期阶段就把产品链路跑通,并且通过强大的bd能力开始积累客户,拓展和据市场,然后逐步将中心化算力的提供者分散到更成本的小公司,最后把算力节点大范围地铺开。这就是chainml divide and conquer的思路。
从需求端的布局看,ChainML构建了一个中心化的基础设施协议的MVP,设计理念是可移植的。并且从今年2月开始就在和客户一起运行这个系统,在今年4月开始在生产环境中使用。目前正Google Cloud上运行,但基于Kubernetes和其他开源技术,很容易移植到其他环境(AWS、Azure、Coreweave等)。后续会逐步去中心化这个协议,分散到小众云,然后最后是提供算力的矿工。
2.2 AI市场:想象空间更大
这个sector叫AI markerplace多少有点限制了想象空间。严格意义上来说,一个真正具备想象空间的”AI市场”应该是一种将模型全链路金融化的中间平台,涵盖从底层的算力和数据,到模型本身和相关的应用。之前提到去中心化算力在早期的主要矛盾是如何创造需求,而一个闭环的将AI全链路金融化的市场正好有机会诞生出这类需求。
大概是这样:
一个web3加持下的AI市场以算力和数据为底层,吸引开发者通过更有价值的数据搭建或者微调模型,进而发展出相应的基于模型的应用,这些应用和模型在开发和使用的同时也为算力创造了需求。在代币和社区的激励下,基于bounty的实时数据采集任务或者常态化的对于贡献数据的激励都有机会扩充并且扩大该市场中数据层的独特优势。同时,应用的普及也返回给数据层更多有价值的数据。
社区
除了之前提到的token带来的价值,社区无疑是web3带来的最大增益之一,是推动平台发展的核心动力。社区和token的加持使得贡献者和贡献内容的质量有机会超过中心化机构,比如,数据多样性成就是这类平台的一个优势,这对于构建准确、无偏见的AI模型是至关重要的,同时也是目前数据方向的瓶颈所在。
整个平台的核心我认为就在于模型,我们在很早的时候就意识到,一个AI marketplace是否成功取决于是否存在高质量的模型,以及开发者有什么动力来一个去中心化的平台提供模型?但我们似乎也忘记思考了一个问题,拼基建不如传统平台硬,拼开发者社区不如传统平台成熟,拼声誉也没有传统平台的先发优势,那么相比传统AI平台庞大的用户基数和成熟的基建,web3的项目只能弯道超车。
答案可能就在AI模型金融化
- 模型可以被当作为一种商品,将AI模型视为可投资的资产是可能是Web3和去中心化市场的一个有意思的创新。这种市场允许用户直接参与到AI模型的价值创造过程中,并从中受益。这种机制也鼓励了对更高质量模型的追求和社区的贡献,因为用户的收益直接与模型的性能和应用效果相关联;
- 用户可以通过对模型进行质押来投资,引入收益分成的机制一方面激励用户选择和支持有潜力的模型,为模型开发者创造更优秀的模型提供了经济激励。另一方面,对于质押者来说最直观的评判模型的标准(特别是对于图像生成类的模型)就是多次进行实测,那么这就为平台的去中心化算力提供了需求,这可能也是之前提到的“谁会想用更低效更不稳定的算力?”的出路之一。
2.3 Onchain AI:OPML弯道超车?
ZKML:需求和供给两端双双踩雷
可以肯定的是on-chain AI一定是一个充满想象空间,并且值得深入研究的方向。链上AI的突破能为web3带来前所未有的价值。但同时,ZKML极高的学术门槛和对底层基建的要求确实不适合大多数初创公司死磕。大多数项目也不一定需要融入trustless LLM的支持才能达成自身价值的突破。
但并不是所有AI模型都需要搬到链上用ZK来做trustless,就像大多数人并不关心chatbot是怎么对query进行推理并给出结果的,也不在意使用的stable diffusion是否是某个版本的模型架构或者特定的参数设置。在大多数场景中,大多数用户关注的是模型是否能给一个满意的output,而不是推理的过程是否trustless或者透明。
如果proving system并没有带来百倍的overhead或者更高的推理成本,或许ZKML还有一战之力,但在高昂的链上推理成本和更高的成本面前,任何需求方都有理由质疑Onchain AI的必要性。
从需求端看
用户在乎的是模型给出的结果是不是make sense,只要结果合理,ZKML带来的trustless可以说一文不值;试想一下其中一个场景:
- 如果一个基于神经网络的交易机器人每个周期都给用户带来百倍的收益,谁还会去质疑算法是否中心化或者是否可验证?
- 同样的,如果这个trading bot开始给用户亏钱了,那项目方更应该思考的是如何提升模型的能力而不是把精力和资本花在让模型可验证上。这就是ZKML需求中的矛盾所在,换句话说模型的可验证在很多场景下并不从根本上解决人们对AI的质疑,就有点南辕北辙的意思。
从供给端看
开发足以支撑大预言模型的proving system任重而道远,从现在头部项目的尝试看,几乎看不到大模型上链的一天。
参考我们之前关于ZKML的文章,从技术上看ZKML的目标是将神经网络转化成ZK电路,难点在于:
- ZK电路不支持浮点数;
- 大规模的神经网络难以转换。
从当前进展看:
- 最新的ZKML库支持一些简单的神经网络ZK化,据称能将基础的线性回归模型上链。但现存的demo很少。
- 理论上最大能支持~100M的参数,但仅存于理论。
ZKML的发展进度并没有达到预期,从目前赛道头部项目modulus lab和EZKL发布的proving system的进度看,都能将一些简单的模型转化成ZK电路做模型的上链或推理证明上链了。但这还远远没有达到ZKML的价值所在 not event close,并且技术的瓶颈似乎也没有核心的动力去突破,一个严重缺乏需求的赛道从根本上无法获得学术界的关注,也就意味着更难以做出优秀的poc来吸引/满足仅存的需求而这可能也是杀死ZKML的死亡螺旋。
OPML:是过渡还是终局?
OPML和ZKML的差异在于ZKML证明了完整的推理过程,而OPML会在推理受到挑战时重新执行部分推理过程。很显然,OPML解决的最大的问题就是成本/overhead过高,这是一种非常务实的优化。
作为OPML的开创者,HyperOracle团队在“opML is All You Need: Run a 13B ML Model in Ethereum”中给出了one-phase到multi-phase opML的架构和进阶过程:
- 构建一个用于链下执行和链上验证的虚拟机,确保离线VM和链上智能合约中实现的VM之间的等效性。
- 为了确保AI模型在VM中的推理效率,实现一个专门设计的轻量级DNN库(不依赖于像Tensorflow或PyTorch这样的流行机器学习框架),同时团队也提供了一个可以将Tensorflow和PyTorch模型转换为这个轻量级库的脚本。
- 通过交叉编译将AI模型推理代码编译成VM程序指令。
- VM image通过Merkle tree来管理。只有代表VM状态的Merkle root会被上传到链上智能合约。
但显然这样的设计有一个关键缺陷,就是所有计算必须在虚拟机内执行,这阻止就阻碍了利用GPU/TPU加速以及并行处理,局限了效率。因此引入multi-phase opML。
- 只有在final phase中,计算在VM进行。
- 在其他阶段,状态转换的计算发生在native的环境中,这样就利用了比如CPU、GPU、TPU的能力,并支持并行处理。这样的做法减少了对VM的依赖,显著提高了执行性能,达到与原生环境相当的水平。
Reference: https://mirror.xyz/hyperoracleblog.eth/Z__Ui5I9gFOy7-da_jI1lgEqtnzSIKcwuBIrk-6YM0Y
LET’S BE REAL
有观点认为OPML是一种实现全面ZKML前的一个过渡,但更现实的说不如把它当作一种Onchain AI基于成本结构和落地预期的取舍,或许ZKML全面实现的一天永远不会到来,至少我对此持悲观的态度,那么Onchain AI的hype最终还是要面对最现实的落地和成本,那么OPML可能就是Onchain AI的最佳实践,就像是OP和ZK的生态也从来不是替代的关系。
虽然但是,不要忘记了,之前需求的短板仍然存在,OPML基于成本和效率的优化并不从根本上解决“既然用户更在意结果的合理性,为什么要把AI搬到链上做成trustless”南辕北辙的问题,透明、所有权、去信任,这些buff叠加在一起确实很花里胡哨,但用户真的在乎吗?相比之下,价值的体现应该是在模型的推理能力上。
我认为这种对成本的优化从技术上是一个创新且solid的尝试,但从价值上看更像是一种蹩脚的圆场;
或许Onchain AI这个赛道本身就是在拿着锤子找钉子,但这也没错,一个早期行业的发展就是需要不断探索跨领域技术的创新结合,在不断磨合中找到最佳的契合点,错的从来都不是技术的碰撞和尝试,而是缺乏独立思考的盲目跟风。
2.4 应用层:99%的缝合怪
不得不说AI在web3应用层的尝试确实前赴后继,好像大家都在fomo,但其中99%的integration还是就停留在integration吧,没必要借着gpt的推理能力映射项目本身有多大价值。
从应用层看,大致有两种出路:
借助AI的能力提升用户体验,提升开发效率:这种情况下AI并不会是核心亮点,更多时候是作为一种幕后工作者默默付出,甚至对用户无感;举个例子,web3游戏HIM的团队对于游戏内容、AI、crypto的结合想很聪明,抓住了契合度高,最能产生价值的点,就是一方面利用AI作为生产价值工具,提升开效率和质量,另一方面通过AI的推理能力提升用户的游戏体验,AI和crypto确实带来了非常重要的价值,但根本上还是利用了将技术工具化的手段,项目真正的优势和核心仍然是团队对游戏开发的能力
和AI marketplace结合,成为整个生态中面向用户的重要一环。
三、最后…
如果真的有什么需要强调或者总结的:AI仍然是web3最值得关注也是机会最大的赛道之一,这个大逻辑一定不会变;
但我认为最值得关注的是AI marketplace的玩法,从根本上看这种平台或者infra的设计是符合价值创造的需求以及满足各方利益的,宏观来说,在模型或者算力本身以外创造出了一种web3特有的价值捕获的方式就足够有吸引力,同时,这也允许用户用一种独特的方式直接参与到AI的浪潮中。
或许再过三个月我又会推翻我现在的想法,所以:
以上只是我关于这个赛道很real的观点,真的不构成任何投资建议!
Reference
“opML is All You Need: Run a 13B ML Model in Ethereum”: https://mirror.xyz/hyperoracleblog.eth/Z__Ui5I9gFOy7-da_jI1lgEqtnzSIKcwuBIrk-6YM0Y