Qwen3-4B超顶小模型更新登场!手机也能轻松跑!
前两周,我们陆续更新了 Qwen3-235B-A22B 和 Qwen3-30B-A3B 的 Instruct/Thinking 「2507」版本模型,今天,我们发布更小尺寸新模型——Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 。
新模型性能有了大幅提升。在非推理领域,Qwen3-4B-Instruct-2507 全面超越了闭源的 GPT4.1-Nano;在推理领域,Qwen3-4B-Thinking-2507 甚至可以媲美中等规模的 Qwen3-30B-A3B(thinking)。
我们相信, SLM(Small Language Models)对 Agentic AI 的发展极具价值。「2507」版本的 Qwen3-4B 模型,体积小,性能强,对手机等端侧硬件部署尤为友好,我们期待更多的 AI 硬件采用 Qwen3-4B-2507 新模型系列。目前新模型已在魔搭社区、Hugging Face正式开源,欢迎大家前往体验👏
以下为模型核心亮点——
1、Qwen3-4B-Instruct-2507
🌟通用能力显著提升,更全能的端侧利器
Qwen3-4B-Instruct-2507 的通用能力均大幅提升,超越了商业闭源的小尺寸模型 GPT-4.1-nano,与中等规模的 Qwen3-30B-A3B(non-thinking)性能接近。
🌟掌握更多语言和长尾知识,回答更合你意
新模型覆盖了更多语言的长尾知识,在主观和开放性任务中增强了人类偏好对齐,可提供更符合人们需求的答复。
🌟上下文理解扩展至 256K,小模型也能处理长文本
原创文章,作者:feiniu,如若转载,请注明出处:https://www.lrblog.cn/322.html