关闭 More 保存 重做 撤销 预览

   
关闭   当前为简洁模式,您可以更新模块,修改模块属性和数据,要使用完整的拖拽功能,请点击进入高级模式
http://www.odty595.net
https://t.me/FIL389 https://t.me/magicianSMS_bot

上一主題 下一主題
»
国家和规
LV3 流浪的疾风
帖子    76
新博币    480 提现
提现    0
     
    228 0 | 显示全部楼层 |倒序浏览
    本帖最后由 车车飞飞 于 2025-8-22 10:57 编辑

    image.png

    DeepSeek发布了对旧模型的更新版本,称其在关键基准测试中超越了标志性的R1,使这家中国初创企业在业界等待下一代旗舰产品时继续保持竞争力。

    公司周四在微信发文表示,V3.1能更快回答问题,并标志着该公司迈向打造AI智能体的第一步。

    该平台已在Hugging Face上线,并针对新一代国产AI芯片进行了定制优化。

    DeepSeek今年1月凭借高性能、低成本的R1震动硅谷,之后一直站在中国AI研发浪潮前沿。

    周四,公司还公布了对V3版本的新收费计划,上调部分价格、取消夜间优惠,但降低了部分场景的费用,新方案9月6日生效。

    DeepSeek的模型挑战了美国的OpenAI等巨头,显示中国企业即便没有最尖端芯片也能在AI领域取得突破。

    业界正等待R1继任者的推出,该机型原定今年早些时候发布。

    DeepSeek在微信发文称,DeepSeek-V3.1的UE8M0 FP8精度格式已针对“即将发布的新一代国产芯片”进行优化,但公司未透露具体的芯片型号或制造商。

    FP8,即8位浮点数,是一种数据处理格式,可让AI模型更高效运行,用更少的内存并比传统方法更快。

    公司在微信中表示,DeepSeek-V3.1采用混合推理架构,使模型能够在推理模式与非推理模式间切换。

    用户可通过其官方应用和网页平台上的“深度思考”按钮在两种模式间切换,这些平台已运行V3.1版本。

    当地媒体称推迟原因在于创始人梁文峰坚持“要把它做好”,尽管他仍在经营盈利颇丰的高毅资产管理公司。也有人猜测是训练或研发中出现问题。

    与此同时,阿里巴巴集团和腾讯控股等对手也在加速AI模型迭代。尤其是阿里巴巴的通义千问(Qwen)系列,已收获广泛人气。


    本专区转载内容来源网络公开渠道,版权归原作者,平台不承担真实性及立场。转载请注明出处。
    如有侵权问题,请联系管理员处理:Telegram @boniuom
    个人签名


    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    关闭

    博牛社区 x 菠菜圈上一条 /1 下一条

    快速回复 返回顶部 返回列表