最新全球模型榜单：阿里 Qwen2.5-Max 超 DeepSeek V3

gate.io交易平台快讯嘉禾肖飒2025-02-05 15:41:55138

2 月 4 日凌晨，三方基准测试平台 Chatbot Arena 公布了最新的大模型盲测榜单，刚刚发布的 Qwen2.5-Max 超越 DeepSeek V3、o1-mini 和 Claude-3.5-Sonnet 等模型，以 1332 分位列全球第七名，也是非推理类的中国大模型冠军。同时，Qwen2.5-Max 在数学和编程等单项能力上排名第一，在硬提示（Hard prompts）方面排名第二。

最新全球模型榜单：阿里 Qwen2.5-Max 超 DeepSeek V3

猜你喜欢