Coder - 搜索 News

在指令跟随、理解结构化数据（如表格）、生成结构化输出等方面Qwen2.5都进步明显。专项模型方面，用于编程的Qwen2.5-Coder和用于数学的Qwen2.5-Math都比前代有了实质性进步。Qwen2.5-Coder在多达5.5T tokens的编程相关数据上作了训练；Qwen2.5-Math支持使用思维链和工具 ...

来自MSN1 天

Qwen2.5登上全球开源王座！72B模型击败LIama3 405B，轻松胜过GPT-4o-mini

白小交发自凹非寺量子位 | 公众号 QbitAI 击败LIama3！Qwen2.5登上全球开源王座。而后者仅以五分之一的参数规模，就在多任务中超越LIama3 405B。各种任务表现也远超同类别的其他模型。

来自MSN2 天

阿里重磅开源！新模型超越GPT-4、Llama3.1，引领AI新纪元？

阿里巴巴近日宣布了其史上最大规模的开源发布，推出了包括基础模型Qwen2.5、专用编码模型Qwen2.5-Coder以及数学专用模型Qwen2.5-Math在内的多个重要模型。这一系列模型以其出色的性能和广泛的适用性，立即引起了业界的广泛关注。

2 天

阿里通义千问开源Qwen2.5系列模型：Qwen2-VL-72B媲美GPT-4

Qwen2.5系列模型的开源，不仅采用了Apache2.0许可证，还提供了多种不同规模的版本，以适应不同的应用需求。此外，通义千问团队还开源了性能媲美GPT-4的Qwen2-VL-72B模型。

新浪网2 天

「全球大模型竞技场」更新：DeepSeek-V2.5全面领跑国内模型

V2.5 相比 V2 能力全面提升相比合并前的两个模型（DeepSeek-V2-0628 和 DeepSeek-Coder-V2-0724），V2.5 在总排名和所有分项排名上均提升，下表展示了模型合并后在ChatBotArena 榜单各项能力的排名：最懂中文的中国模型业内一直有一句名言“国内模型更懂中文”，但从 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果