OpenAI发布可在笔电运行的开放权重推理模型

如果你也听说
LV3 流浪的疾风

帖子 86

新博币 1126

提现

提现 0 元

发表于 2025-8-6 05:52:04 1182 2 | 显示全部楼层 |倒序浏览

楼主

本帖最后由车车飞飞于 2025-8-6 14:30 编辑

路透社旧金山8月5日消息，OpenAI周二宣布，推出两款具备高级推理能力的开放权重语言模型，专为笔记本电脑优化，性能与公司自家较小型的专有推理模型相当。

开放权重语言模型指的是训练完成后的参数（或称权重）对外公开，开发者无需原始训练数据，就能分析模型并进行微调，以适配特定任务。

OpenAI联合创始人格雷格·布洛克曼（Greg Brockman）在新闻发布会上表示：“开放模型的独特之处在于，人们可以本地运行它们，在自己内部网络或自有硬件上使用。”

开放权重模型与开源模型不同，后者不仅公开权重，还包含完整的源代码、训练数据及方法论。

另外，亚马逊宣布，OpenAI的开放权重模型现已登陆其AWS云平台的Bedrock生成式AI市场。

Bedrock产品总监迪奥（Atul Deo）表示，这是OpenAI首次在Bedrock上提供模型服务。

他说：“OpenAI开发的这些模型非常优秀，我们相信它们将成为出色的开放源选项，或者说是优秀的开放权重模型。”

迪奥在采访中说道，但他拒绝透露AWS与OpenAI之间的合同安排。

上周，亚马逊股价大跌，原因是AWS业务增长放缓，尤其相较于竞争对手。

今年以来，开放权重与开源AI模型市场竞争激烈。一度，Meta的Llama系列模型被认为是最强者，但今年早些时候，中国的DeepSeek发布了一款强大且高性价比的推理模型，Llama 4则迟迟未能面世，使格局发生变化。

这两款新模型是OpenAI自2019年推出GPT-2以来，首次再次发布开放模型。

OpenAI表示，较大的模型gpt-oss-120b可在单张GPU上运行，而较小的gpt-oss-20b甚至能直接在普通个人电脑上运行。

两款模型的性能与OpenAI的o3-mini和o4-mini专有推理模型相当，在代码编写、数学竞赛和健康问题等领域表现尤为突出。

OpenAI还表示，这两款模型是在仅包含文本的数据集上训练的，该数据集中除了通识知识外，还重点涵盖了科学、数学与编程相关内容。

OpenAI没有公布这两款模型与DeepSeek-R1等竞品的对比基准。

由微软支持、估值达三千亿美元的OpenAI，目前正由软银集团领投一轮高达四百亿美元的新融资。

OpenAI发布可在笔电运行的开放权重推理模型