为联邦学习引入智能合约:Flock如何重塑AI生产关系?

转载
62 天前
7924
ChainFeeds

文章转载来源: ChainFeeds

撰文:LINDABELL

在上一轮去中心化 AI 热潮中,Bittensor、io.net 和 Olas 等明星项目凭借其创新技术与前瞻性布局,迅速成为了行业领军者。然而,随着这些老牌项目估值的节节攀升,普通投资者的参与门槛也越来越高。那么,面对目前这一轮的板块轮动,是否还存在新的参与机会?

Flock:去中心化 AI 训练和验证网络

Flock 是一个去中心化的 AI 模型训练和应用平台,将联邦学习和区块链技术结合,以为用户提供安全的模型训练和管理环境,同时保护数据隐私和公平社区参与。Flock 这个词最初于 2022 年进入公众视野,其创始团队联合发布了一篇题为「FLock: Defending malicious behaviors in federated learning with blockchain」的学术论文,提出了将区块链引入联邦学习以防范恶意行为的理念。该论文阐述了如何通过去中心化机制加强模型训练过程中的数据安全和隐私保护,还揭示了这种新架构在分布式计算中的应用潜力。

经过初期的概念验证后,Flock 在 2023 年推出了去中心化的多 Agent AI 网络 Flock Research。在 Flock Reseach 中,每个 Agent 都是为特定领域调优的大语言模型(LLM),能够通过协作为用户提供不同领域的见解。随后在 2024 年 5 月中旬,Flock 正式开放了去中心化 AI 训练平台的测试网,用户可以通过使用测试代币 FML 参与模型的训练和微调,并获得奖励。截至 2024 年 9 月 30 日,Flock 平台的日活跃 AI 工程师数量已突破 300 人,累计提交模型数量达到 15,000 以上。

随着项目的持续发展,Flock 也受到了资本市场的关注。今年 3 月,Flock 完成了由 Lightspeed Faction 和 Tagus Capital 领投的 600 万美元融资,DCG、OKX Ventures、Inception Capital 和 Volt Capital 等参投。值得注意的是,Flock 还是 2024 年以太坊基金会学术资助轮中唯一获得拨款的 AI 基础设施项目。

重塑 AI 生产关系的基石:为联邦学习引入智能合约

联邦学习(Federated Learning)是一种机器学习方法,允许多个实体(通常称为客户端)在确保数据本地存储的前提下,共同训练模型。与传统的机器学习不同,联邦学习避免了将所有数据上传至中心服务器,而是通过本地计算的方式保护用户隐私。目前,联邦学习其实已经在多个实际场景中得到了应用,例如谷歌自 2017 年起将联邦学习引入其 Gboard 输入法中,用于优化输入建议和文字预测,同时确保用户的输入数据不被上传。特斯拉在其自动驾驶系统中也应用了类似技术,以本地方式提高车辆的环境感知能力,减少了对海量视频数据传输的需求。

但这些应用仍存在一些问题,尤其是在隐私和安全性方面。首先用户需要信任中心化的第三方,其次在模型参数传输和聚合的过程中,还需要防止恶意节点上传虚假数据或恶意参数,导致模型在整体性能上产生偏差甚至输出错误的预测结果。根据 FLock 团队在IEEE期刊上发表的研究显示,传统联邦学习模型在 10% 的恶意节点存在时,准确率会下降至 96.3%,而当恶意节点比例增至 30% 和 40% 时,准确率则分别降至 80.1% 和 70.9%。

为了解决这些问题,Flock 在其联邦学习架构中引入了区块链上的智能合约作为「信任引擎」。智能合约作为信任引擎,能够在去中心化环境下实现自动化的参数收集与验证,并对模型结果进行无偏见的发布,从而有效防止恶意节点篡改数据。与传统联邦学习方案相比,即使在 40% 节点为恶意节点的情况下,FLock 的模型准确率仍能保持在 95.5% 以上。

定位 AI 执行层,解析 FLock 三层架构

当前 AI 领域的一个主要痛点在于,AI 模型训练和数据使用的资源仍然高度集中在几家大型公司手中,普通开发者和用户很难有效使用这些资源。因此,用户只能使用预先构建的标准化模型,而无法根据自身需求进行定制化。这种供需错配的现象也导致即使市场拥有丰富的计算能力和数据储备,也无法转化为实际可用的模型和应用。

针对这一问题,Flock 希望能够成为一个有效协调需求、资源、计算能力和数据的调度系统。Flock 借鉴 Web3 技术栈将自己定位为「执行层」,因为作为核心功能,其主要负责将用户的定制化 AI 需求分配至各个去中心化节点进行训练,并通过智能合约来调度这些任务在全球各节点上运行。

同时,为了确保整个生态系统的公平和高效,FLock 系统还负责「结算」和「共识」。结算指的是激励和管理参与者的贡献,根据任务完成情况进行奖励和惩罚。而共识则负责对训练结果的质量进行评估和优化,确保最终生成的模型能够代表全局最优解。

FLock 整体产品架构由三大模块构成:AI Arena、FL Alliance 和 AI Marketplace。其中,AI Arena 负责去中心化的模型基础训练,FL Alliance 负责在智能合约机制下进行模型微调,而 AI Marketplace 则是最终的模型应用市场。

AI Arena:本地化模型训练与验证激励

AI Arena 是 Flock 的去中心化 AI 训练平台,用户可以通过质押 Flock 测试网代币 FML 参与,并获得相应的质押奖励。在用户定义好需要的模型并提交任务后,AI Arena 中的训练节点会在本地使用给定的初始模型架构进行模型训练,无需将数据直接上传至中心化服务器。在每个节点完成训练后,会有验证者负责评估训练节点的工作,检查模型的质量并进行评分。如果不想参与验证过程,也可以选择将代币委托给验证者以获得奖励。

在 AI Arena 中,所有角色的奖励机制都取决于质押数量和任务质量两个核心因素。质押数量代表了参与者的「承诺」,而任务质量则衡量了其贡献值。例如,训练节点的奖励取决于质押数量及提交模型的质量排名,而验证者的奖励则取决于投票结果与共识的一致性、质押代币数量及参与验证的次数和成功数。委托者的收益则取决于其选择的验证者及质押数量。

AI Arena 支持传统的机器学习模型训练模式,而且用户可以选择在自己的设备上使用本地数据或公开数据进行训练,以最大限度提升最终模型的性能。目前,AI Arena 公开测试网上共有 496 个活跃训练节点,871 个验证节点及 72 个委托用户。当前平台质押比例为 97.74%,训练节点的平均月收益为 40.57%,验证节点的平均月收益为 24.70%。

FL Alliance:智能合约自动管理的微调平台

在 AI Arena 上评分最高的模型会被选定为「共识模型」,并会被分配至 FL Alliance 中进一步微调。微调会经过多轮操作。每轮开始时,系统都会自动创建一个与该任务相关的 FL 智能合约,这个合约会自动管理任务执行及奖励。同样地,每个参与者都需要质押一定数量的 FML 代币。参与者会被随机分配为提议者或投票者,其中提议者使用自己的本地数据集进行模型训练,并将训练后的模型参数或权重上传给其他参与者。而投票者则会对提议者的模型更新结果进行汇总并投票评估。随后所有结果会被提交给智能合约,智能合约会将每一轮分数与上一轮分数进行比较,以评估模型性能的进步或下降。如果性能分数有所提高,系统将进入下一阶段的训练;如果性能分数有所下降,则将使用上一轮验证过的模型开始另一轮训练、汇总和评估。

FL Ailliance 通过结合联邦学习和智能合约机制,实现了多参与者在保证数据主权的前提下共同训练一个全局模型的目标。而且通过整合不同的数据并聚合权重,能构建一个性能更好及能力更强的全局模型。此外,参与者通过质押代币表明参与承诺,并根据模型质量和共识结果获得奖励,形成了一个公平透明的生态机制。

AI Marketplace:如何提供个性化 AI 服务?

而在经过 AI Arena 训练和 FL Alliance 微调后的模型,将被最终部署至 AI Marketplace 中,供其他应用程序调用使用。和传统的「模型市场」不同,AI Marketplace 不仅提供现成的模型,还允许用户进一步对模型进行修改,并集成新的数据源以应对不同的应用场景。此外,AI Marketplace 还集成了RAG(Retrieval-Augmented Generation「检索增强生成」)技术,以提升特定领域的模型准确性。RAG 是一种增强大语言模型的方法,通过在生成回答时从外部知识库中检索相关信息,确保模型的相应更加准确和个性化。

目前 AI Marketplace 上已经推出了很多基于不同应用场景的定制化 GPT 模型,包括 BTC GPT、Farcaster GPT、Scroll GPT、Ethereum GPT 等。我们可以通过 BTC GPT 举个例子来理解定制化模型和通用模型的区别。

2023 年 12 月,当同时向 BTC GPT 和 ChatGPT 提问「什么是 ARC20?」时:

  • BTC GPT 的回答:「ARC20 协议是基于比特币网络构建的协议,允许用户创建、转移和升级数字物品,例如 NFT 和可互换的代币。通过 ARC20 协议,可以在比特币网络上生成非互换的 NFT 和可互换的代币。ARC20 协议的主要代币是 ATOM,并用于协议内的各种用途。」
  • ChatGPT 的回答:「截至我在 2022 年 1 月的最后一次知识更新时,技术、金融或其他常见领域中没有被广泛认可的名为 ARC20 的标准或技术。可能在那之后出现了名为 ARC20 的新技术或标准,但我没有相关信息。」

从二者的回答中我们可以看出定制 GPT 模型的重要性和优势。 不同于通用型语言模型,定制化 GPT 模型可以通过针对特定领域的数据进行训练,从而提供更精准的回答。

同为 DCG 支持,Flock 和 Bittensor 有何异同?

随着 AI 板块的回暖,去中心化 AI 项目的代表之一 Bittensor 的代币在过去 30 天内涨幅超过 93.7%,价格一度接近历史最高点,总市值再度突破 40 亿美元。值得注意的是,Flock 的投资机构 DCG 也是 Bittensor 生态中最大的验证者和矿工之一。此前据知情人士透露,DCG 持有约 1 亿美元的 TAO,并且在 2021 年「商业内幕」的一篇文章中,DCG 投资者 Matthew Beck 推荐 Bittensor 为 53 家最有前途的加密初创公司之一。

尽管同为 DCG 支持的项目,FLock 和 Bittensor 的侧重点却有所不同。在具体定位上,Bittensor 的目标是构建一个去中心化的 AI 互联网,使用了「子网(Subnet)」作为基本单位,每个子网都相当于一个去中心化的市场,参与者可以以「矿工」或「验证者」等角色加入。目前,Bittensor 生态系统中有 49 个子网,覆盖文本转语音、内容生成及大语言模型微调等多个领域。

自去年以来,Bittensor 一直是市场关注的焦点。一方面是由于其代币价格的迅速上涨,从 2023 年 10 月的 80 美金一路狂飙至今年的最高点 730 美金。另一方面则是各种各样的质疑声,包括对其依赖代币激励吸引开发者的模式是否能够可持续发展。此外,Bittensor 生态中,前三大验证者(Opentensor Foundation、Taostats & Corcel、Foundry)质押的 TAO 份额合计接近 40%,这也引发了用户对其去中心化程度的担忧。

与 Bittensor 不同, FLock 则通过将区块链引入联邦学习,致力于为用户提供个性化 AI 服务。Flock 将自己定位为「AI 领域的 Uber」,在这一模式中,Flock 充当了匹配 AI 需求与开发者的「去中心化调度系统」,通过链上智能合约自动管理任务分配、结果验证和奖励结算,确保每个参与者都能够根据其贡献公平地参与分配。但和 Bittensor 类似的是,除了成为训练节点和验证者,Flock 也为用户提供了委托参与的选项。

具体而言:

  • 训练节点:通过质押代币参与 AI 任务的训练竞争,适合拥有计算能力和 AI 开发经验的用户。
  • 验证者:同样需要质押代币参与网络,负责验证矿工的模型质量,并通过提交验证评分影响奖励分配。
  • 委托人:将代币委托给矿工和验证者节点,以提升节点在任务分配中的权重,同时分享被委托节点的奖励收益。通过这种方式,即使没有技术能力去训练或验证任务的用户,也可以参与网络并赚取收益。

FLock.io 现正式开放委托人参与功能,任何用户均可通过质押 FML 代币来获取收益,并且可以根据预期年化收益率选择最优节点从而最大化自己的质押收益。Flock 还表示,测试网阶段的质押和相关操作将影响未来主网上线后的潜在空投奖励。

未来,FLock 还计划推出更加友好的任务发起机制,让没有 AI 专业知识的个人用户也能够轻松参与到 AI 模型的创建和训练中,实现「人人皆可参与 AI」的愿景。同时,Flock 还在积极展开多方面合作,例如与 Request Finance 合作开发链上信用评分模型,与 Morpheus 及 Ritual 合作构建交易机器人模型 提供一键部署的训练节点模板使得开发者能够轻松在 Akash 上启动和运行模型训练。此外,Flock 还为 Aptos 训练了服务开发者的 Move 语言编程助手。

总体来看,尽管 Bittensor 和 Flock 在市场定位上存在差异,但二者都在尝试通过不同的去中心化技术架构来重新定义 AI 生态中的生产关系,它们的共同目标都是打破中心化巨头对 AI 资源的垄断,构建一个更加开放和公平的 AI 生态体系,而这也正是目前市场所迫切需要的。