本帖最后由 车车飞飞 于 2025-8-6 14:30 编辑
路透社旧金山8月5日消息,OpenAI周二宣布,推出两款具备高级推理能力的开放权重语言模型,专为笔记本电脑优化,性能与公司自家较小型的专有推理模型相当。
开放权重语言模型指的是训练完成后的参数(或称权重)对外公开,开发者无需原始训练数据,就能分析模型并进行微调,以适配特定任务。
OpenAI联合创始人格雷格·布洛克曼(Greg Brockman)在新闻发布会上表示:“开放模型的独特之处在于,人们可以本地运行它们,在自己内部网络或自有硬件上使用。”
开放权重模型与开源模型不同,后者不仅公开权重,还包含完整的源代码、训练数据及方法论。
另外,亚马逊宣布,OpenAI的开放权重模型现已登陆其AWS云平台的Bedrock生成式AI市场。
Bedrock产品总监迪奥(Atul Deo)表示,这是OpenAI首次在Bedrock上提供模型服务。
他说:“OpenAI开发的这些模型非常优秀,我们相信它们将成为出色的开放源选项,或者说是优秀的开放权重模型。”
迪奥在采访中说道,但他拒绝透露AWS与OpenAI之间的合同安排。
上周,亚马逊股价大跌,原因是AWS业务增长放缓,尤其相较于竞争对手。
今年以来,开放权重与开源AI模型市场竞争激烈。一度,Meta的Llama系列模型被认为是最强者,但今年早些时候,中国的DeepSeek发布了一款强大且高性价比的推理模型,Llama 4则迟迟未能面世,使格局发生变化。
这两款新模型是OpenAI自2019年推出GPT-2以来,首次再次发布开放模型。
OpenAI表示,较大的模型gpt-oss-120b可在单张GPU上运行,而较小的gpt-oss-20b甚至能直接在普通个人电脑上运行。
两款模型的性能与OpenAI的o3-mini和o4-mini专有推理模型相当,在代码编写、数学竞赛和健康问题等领域表现尤为突出。
OpenAI还表示,这两款模型是在仅包含文本的数据集上训练的,该数据集中除了通识知识外,还重点涵盖了科学、数学与编程相关内容。
OpenAI没有公布这两款模型与DeepSeek-R1等竞品的对比基准。
由微软支持、估值达三千亿美元的OpenAI,目前正由软银集团领投一轮高达四百亿美元的新融资。
OpenAI发布可在笔电运行的开放权重推理模型
OpenAI发布可在笔电运行的开放权重推理模型
|
|