在中国人工智慧公司DeepSeek (深度求索)一夕爆红引发华尔街震荡之际,“阿里云”计算公司(Alibaba Cloud)在29日(大年初一)宣布推出新一代AI模型“通义千问旗舰版模型Qwen2.5-Max”,并宣称在性能测试中,其表现几乎全面超越DeepSeek-V3等其他AI模型。
阿里云29日凌晨在微信公众号宣布,通义千问Qwen2.5-Max全新升级发布,并表示新模型不仅展现出极强劲的综合性能,更在多项公开主流模型评测基准上均取得高分,全面超越目前全球领先的开源混合专家模型(MoE)及最大的开源稠密模型。
阿里云说,通义团队分别对Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本效能进行了评估测试。
在指令模型方面,Qwen2.5-Max在多个基准测试中比肩美国的Claude-3.5-Sonnet模型,几乎全面超越另外三个模型GPT-4o、DeepSeek-V3及Llama-3.1-405B。
在基座模型方面,阿里云则表示,通义团队将Qwen2.5-Max与目前领先的开源MoE模型DeepSeek V3、最大的开源稠密模型Llama-3.1-405B,以及同样位列开源稠密模型前列的Qwen2.5-72B进行了对比,Qwen2.5-Max在所有11项基准测试中,表现全部超越对比模型。
据路透报导,选择大年初一发布Qwen 2.5-Max是较为特殊的时间点,也显示了DeepSeek过去三周迅速崛起,给中国境内外竞争对手带来压力。
|
|