超越 Web3,资本新宠 AIGC 的奇幻漂流
最近,闲来无事,问一些在硅谷的互联网投资者,重点关注什么领域?
本以为又是“Saas”、“Web3”等老名词,结果出乎意料,“AI”成为了高频关键词,众多一线硅谷 VC 开始瞄准 AI 初创公司,巨额融资不断浮出水面。
比如,Meta(原Facebook)工程师 Lin Qiao 离职之后,开始基于开源的深度学习框架 PyTorch 进行创业,为诸如 Stable Diffusion 之类的 AI 图像创建工作提供支持。
众多一线 VC 竞相追逐,尽管只有一个 PPT,一个梦想,但是该项目最终以上亿美元的估值完成了千万美元融资,Benchmark 和红杉资本均有参与。
这只是 AI FOMO 下的一个缩影。
10 月 17 日,英国开源人工智能公司 Stability AI 宣布获得 1.01 亿美元融资,估值高达 10 亿美元,跻身独角兽行列,由Coatue、Lightspeed Venture Partners 和 O'Shaughnessy Ventures LLC 参与投资。
如果聊到最近大火的 AI 生成艺术一定离不开这家公司,StabilityAI 于今年发布了深度学习文字转图像模型 Stable Diffusion,主要用于根据文字的描述产生详细图像,Stable Diffusion 的诞生让 AI 绘画这个领域愈发火爆。
根据最新 Tiger 致投资者信中的内容,他们已然悄悄投资了AI领域巨头 OpenAI。
一场 AI 飓风席卷科技创投界,这股Fomo 浪潮也和红杉资本的一篇文章有关。
2022 年 9 月 23 日,红杉美国官网发表了最新一篇题为《生成式AI:一个创造性的新世界》的文章,认为AIGC(AI-Generated Content 人工智能生成内容)会代表新一轮 Paradigm shift(范式转移)的开始。
原文作者是红杉的两位合伙人,Sonya Huang 和 Pat Grady,有趣的是第三位作者,赫然还写着 GPT-3,OpenAI 旗下基于深度学习原理的语言预测模型,简单理解就是基于上下文的生成 AI 系统。
当你向 GPT-3 提供提示或上下文时,它可以填写其余内容,也就是说你给GPT-3提供素材,他帮你撰写文章。
此外,这篇文章插图也是用 Midjourney 生成的,输入关键词,即可得到一张精美的插画,这也让众多绘画师感到忧心忡忡,甚至在微博上有了“绘画会被 AI 替代吗”的热搜,引得众多画师下场讨论。
图源:知著网
文字、图片可 AI 生成,音频和视频同样不在话下。
在 Podcast.ai 推出的第一集播客里,已故的苹果创始人乔布斯竟然成为首位嘉宾,与美国知名播客主持人 Joe Rogan 进行了一场长达 20 分钟的交流,讨论了乔布斯对大学、计算机的看法以及工作状态、信仰等。
人死不能复生,这背后当然是 AI 作祟。
Podcast.ai 是一个完全由 AI 生成的播客通过乔布斯的传记和收集网络上关于他的所有录音,用 Play.ht 的语言模型大量训练,最终生成了这段“假 Joe Rogan 采访乔布斯”的播客音频内容。
以上种种都是 AIGC (人工智能生成内容),以前 AI 还只是辅助内容创作的工具,今天 AI 已经可以成为内容创作的主体,能够独立完成写作、设计、绘画、视频制作等创意性工作。
从 PGC 到 UGC,内容产业得到了极大的繁荣,而 AIGC 的兴起,则将给内容产业带来革命性突破,甚至影响到社会的历史进程。
Play.ht 表示,“我们相信在未来,所有内容创作都将由人工智能生成,但由人类指导,而最具创造性的工作将取决于人类将他们想要的创作表达到模型中的能力。”
AIGC 与元宇宙
谈到 AIGC 与 Web3 的结合,笔者首先想到的是元宇宙,道理很简单,一个真正的元宇宙是需要海量的优质“内容”进行填充。
在 PGC 的商业模式下,生产内容与变现的权利掌握在少数人手中,并且人力是有限的,很难满足大规模的元宇宙内容生成。
UGC 让人人皆可成为创作者,在一定程度上解决了产能瓶颈,中心化,满足用户多样性的需求的问题,但是内容创作质量良莠不齐,大量的“垃圾内容”反而是损害,仍然难以满足元宇宙对于内容的需求。
只有 AIGC 才能让人类突破生产力枷锁,高效率生成高质量内容,让人类进入到真正的元宇宙之中。
拿最落地的一个场景游戏举例,游戏中的美术、配音、文案等理论上都可以由 AI 辅助或者自主完成,比如,最近 B 站 UP 主“拔丝柠檬制作组”利用 AI,花了 6 小时制作了一个简单的二次元 galgame 游戏Demo。
这一领域的成长速度将远超大多数人的预期。
站在 AI 与Web3 的交叉口
如果说 Web3 的内核是“去中心化”,那么现在的 AIGC 毫无疑问是中心化的。
过往,AI 模型往往开源存在,但是在过去的几年里,大型模型变得越来越封闭,以及和互联网巨头绑定愈发紧密。
以 AIGC 之王 OpenAI 为例,成立于 2015 年,由马斯克发起创立的 OpenAI 从第一天便将自己定位为“非营利组织”,目标是以安全的方式实现通用人工智能,使全人类平等收益,而不是为公司的股东创造利润。
但在2019 年,OpenAI 违背其初衷,成为了一家名为“OpenAI LP”的营利性公司,由一家名为“OpenAI Inc”的母公司控制。
OpenAI 更改结构数月后,微软便注资了 10 亿美元,附属条件是微软有权将 OpenAI 的部分技术商业化,比如 GPT-3 与 Codex。
批评纷涌而至,艾伦人工智能研究所的所长 Oren Etzioni 表示:“我不同意非营利组织不具备竞争力的观点……如果规模更大、资金更多就代表(这个机构)会发展得更好,那 IBM 就不会被挤下第一名的位置。”
就连OpenAI 联合创始人埃隆·马斯克(Elon Musk)也在“微软获 GPT-3 独家授权”的新闻后,给予批评:“这种决定似乎是与‘开放’相悖的。实质上 OpenAI 已经被微软控制了。”(注:马斯克于 2019 年离开了OpenAI 董事会)
如果 OpenAI 是生产力的王者,那么他则是遇到了生产关系的问题,公共产品还是盈利组织,如何长期维系发展……
在我们看来,Web3 提供了一个开发公共产品和公地范式的机会,过去,公共产品创造了巨大的价值,但没有一种价值获取方法来自我维持,Web3 的经济系统可以帮助公共产品定义新的价值获取途径,又可以确保将获取的价值优化分配给公共产品和公共资源。
首先,AI 模型所需要的数据生产可以通过 Web3 的组织形态进行聚合。
一个成熟且强大的 AI 模型需要被喂养海量的数据进行自我学习,同时也需要外部训练与调教,因此也产生了人工智能训练师这样的职业。
数据天然具有“垄断性”,目前海量的数据是被大型科技公司所有,并且几乎没有动力开放对其数据的生产或分发的访问。
但是,我们也看到全球也有一些开源社区正在向全球研究人员开放数据和模型训练。
Common Crawl,十年互联网数据的公共存储库,可用于一般的AI训练。
LAION,一个非营利组织,旨在向公众提供大规模机器学习的模型和数据集,并发布了LAION5B,一个58.5亿个经过CLIP过滤的图像-文本数据集,一经发布就成为世界上最大的公开访问的图像-文本数据集。
EleutherAI,一个去中心化社区,发布了全球最大的开源文本数据集之一,The Pile,一个 825.18 GiB 的英语语言数据集,用于使用 22 个不同数据源的语言建模。
目前,这些组织依然还是非盈利性质,主要靠志愿者“用爱发电”。
那么,如何用 Web3 对AI数据的生产与访问进行优化?
CoinFund 曾提出自己的一些设想,比如 Token可以作为一种激励机制来鼓励创建开源数据集,根据数据贡献来进行分配,比如给大型文本-图像数据集贴标签进行AI训练等,这样的一个开源社区也可以转变为一个 DAO 社区,一个编译良好的开源数据集对于扩大大型模型的研究可及性和提高模型性能至关重要。
一个优质的大型 AI 模型可以有属于自己的 Token,而建立在模型之上的产品的下游收入可以累积到 Token 价值中,这样一来,数据集贡献者可以获得合理分配,总之,Web3 可以更好将数据货币化以及建设更好的公共产品。
其次,训练大规模神经网络需要海量的算力,在过去十年中,训练人工智能模型的计算需求每 3、4 个月就翻一番。
例如,OpenAI 的GPT-3有1750亿个参数,训练时间为 3640 petaFLOPS-day,用世界上最快的超级计算机需要两周时间,而标准笔记本电脑需要一千年以上的时间来计算。
因此,AI 训练一般需要因数学运算需要而优化的特定硬件,如 GPU、ASIC,这些硬件基本被少数寡头垄断的云服务提供商所控制,如谷歌云、AWS、微软 Azure 和 IBM。
这可以成为 Web3 去中心化治理/市场模式与 AI 计算的另一个交叉点。
比如,去中心化的治理和激励系统,可能被用来激励和分配计算资源,想象一下,一个通过Token来众筹模型培训的赏金系统,成功的众筹者将获得模型的优先计算权。
目前,市场中已有类似的参与者,比如 Gensyn ,使用区块链来验证深度学习任务是否已正确执行,并通过 Token 触发支付,将未使用的计算能力货币化。
如果说区块链是生产关系的革新优化,AI 就是生产力的跃升,二者的交叉结合或许可以擦出火花,这也成为不少投资机构所关注的领域,比如 CoinFund 投资人 Rishin Sharma 明确表示在寻找 AI 与 Web3 交叉的三类团队:
1.以开放人工智能为核心任务的团队
2.更好地管理公共资源(如数据和计算)以帮助构建 AI 模型的社区
3.利用人工智能将创造力、安全性和创新带入主流应用的产品