Nous Research
Nous Research
1.Nous Research是什么
Nous Research 是一家 美国 的人工智能公司。
虽然它位于美国,但在选址上有些“特立独行”:
总部地点:设在 纽约 (New York),而不是像大多数 AI 初创公司那样扎堆在硅谷。
团队背景:这是一家成立于 2023 年的初创公司,团队规模非常精简(早期仅约 10 人),由 Jeffrey Quesnelle 和 Teknium 等人联合创立。
2.Nous Research是干什么的
Nous Research 是一家专注于开源人工智能和去中心化AI训练的创新型研究实验室。
简单来说,你可以把它看作是AI 领域的“开源先锋”。与 OpenAI 或 Google 等闭源巨头不同,Nous Research 致力于打破技术垄断,通过发布完全开放的模型权重、训练数据和底层代码,让全球开发者都能平等地参与 AI 的开发与使用。
3.Nous Research有什么成就
作为一个在短短几年内就成长为“独角兽”的创新机构,Nous Research 的成就主要集中在开源模型、去中心化训练技术以及AI智能体这三个领域。
以下是他们最核心的成就清单:
1. 打造了著名的“Hermes”开源模型家族
这是他们在开发者社区中最广为人知的成就。Hermes 系列模型以“高性能”和“高自由度”著称,是开源社区中不可或缺的基座模型。
Hermes 4:这是他们的最新力作,基于 Qwen 3 架构。它具备混合推理能力(类似 o1 的深度思考模式),在数学和代码基准测试中表现优异。更重要的是,它主打“无内容限制”,去除了常见的商业模型说教和过度审查,被许多开发者视为“真正自由”的模型。
Hermes 3 (405B):他们是首批成功微调 Llama 3.1 405B 参数的团队之一,证明了开源社区也能驾驭千亿级参数的超大模型。
Nous Chat:基于自家模型打造的聊天机器人,展示了他们在长上下文记忆和角色扮演方面的技术实力。
2. 构建了去中心化 AI 训练网络“Psyche”
这是他们最具颠覆性的成就,旨在打破科技巨头对算力的垄断。
DisTrO 技术:他们研发了一种名为 DisTrO 的优化器,能将分布式训练中 GPU 之间的通信数据量压缩数千倍。这意味着,原本需要昂贵数据中心才能进行的训练,现在可以通过全球各地分散的、网络条件普通的个人电脑或闲置显卡来完成。
Psyche 网络:基于 Solana 区块链构建的去中心化训练网络。它允许任何人贡献闲置算力来参与模型训练,并获得了 Paradigm 领投的 5000 万美元 A 轮融资,估值达到 10 亿美元。
3. 发布了突破性的 AI 智能体“Hermes Agent”
这是你之前了解过的产品,也是他们近期的重要成果。
自我进化:不同于普通的聊天机器人,Hermes Agent 是一个能长期运行、拥有持久记忆、并能通过实践自动生成新技能的智能体。
独立创作小说:他们的 CEO 曾演示 Hermes Agent 独立撰写了一本 7.9 万字的小说《The Second Son of the House of Bells》,从构思、大纲到排版全流程自主完成,这一成就引起了包括 AI 教父 Andrej Karpathy 在内的广泛关注。
4. 贡献了底层关键技术“YaRN”
在开源社区中,你可能听说过 YaRN。这是 Nous Research 开发的一种高效扩展上下文窗口的方法。它让原本只能处理短文本的模型(如早期的 LLaMA)能够轻松处理 128k 甚至更长的文本,这一技术被广泛应用于各种开源模型中。
4.Nous Research 在做什么?
核心理念
“AI 民主化” —— 挑战闭源技术垄断,主张通过透明和开源来确保 AI 安全。
主要产品
Hermes 模型系列(高性能开源大模型)、Hermes Agent(个人智能体)、Psyche(去中心化训练网)。
技术路线
结合 区块链(Solana)与 AI,利用分布式算力降低训练门槛。
行业地位
开源社区的核心贡献者,Hugging Face 上最活跃的发布者之一,深受开发者和极客喜爱。