日期:2025-08-08 08:19:47
官方表示,SML(SmallLanguageModels)对AgenticAI的发展极具价值,“2507”版本的Qwen3-4B模型,体积小股查查,性能强,对手机等端侧硬件部署尤为友好。
IT之家援引博文介绍股查查,在非推理(non-thinking)领域,Qwen3-4B-Instruct-2507显著提升通用能力,目标成为更全能的端侧利器。
该模型掌握更多语言和长尾知识,上下文理解扩展至256K,小模型也能处理长文本。该模型通用能力超越了闭源的小尺寸模型GPT-4.1-nano,性能接近等规模的Qwen3-30B-A3B(non-thinking)。
官方表示该模型更像一位高效的“执行专家”,遵循指令、迅速响应股查查,更适合用于内容创作、工具调用等。
在推理(thinking)领域,Qwen3-4B-Thinking-2507大幅提升了推理能力,AIME25高达81.3分。Qwen3-4B-Thinking-2507的推理表现可媲美中等模型Qwen3-30B-Thinking,在聚焦数学能力的AIME25测评中,以4B参数量斩获惊人的81.3分的好成绩。
官方表示该模型像一位严谨的“学术专家”,面对复杂问题逐步推理,完成任务更深入可靠。
股查查
淘配网提示:文章来自网络,不代表本站观点。