最新全球模型榜单:阿里 Qwen2.5-Max 超 DeepSeek V3
2 月 4 日凌晨,三方基准测试平台 Chatbot Arena 公布了最新的大模型盲测榜单,刚刚发布的 Qwen2.5-Max 超越 DeepSeek V3、o1-mini 和 Claude-3.5-Sonnet 等模型,以 1332 分位列全球第七名,也是非推理类的中国大模型冠军。 同时,Qwen2.5-Max 在数学和编程等单项能力上排名第一,在硬提示(Hard prompts)方面排名第二。
猜你喜欢
- 2025-04-24 苹果 Siri 团队大换血,Vision Pro 班底全面上马
- 2025-04-24 上海市浦东新区:2025年力争培育40家具有较大发展潜力、高成长性的出海先锋企业
- 2025-04-23 全球首颗量产5纳米智驾芯片正式量产上车
- 2025-04-23 教育部新增游戏专业,高等教育迎来“游戏时代”
- 2025-04-23 乘联分会:1-2月新能源乘用车L2级及以上的辅助驾驶功能装车率达到66.3%
- 2025-04-22 广东:要千方百计稳住外贸基本盘 全力支持外贸企业抢抓订单
- 2025-04-22 广东:要持续用力推动房地产市场止跌回稳 加强“好房子”规划设计建设
- 2025-04-22 广东:大力推进免税店建设,优化离境退税“即买即退”服务
- 2025-04-22 姚尚坤:中国低空经济年均增速超30%,2025年市场规模或破1.5万亿元
- 2025-04-22 罗永浩发布细红线招聘信息,此前消息称硬件团队已被全部裁撤