您的当前位置:首页 > 焦点 > 通义千问Qwen3系列AI模型正式发布 继续采用开源模式引领AI开源社区发展 – 蓝点网 正文
时间:2025-08-28 10:38:25 来源:网络整理 编辑:焦点
#人工智能 阿里巴巴推出 Qwen3 系列开源模型,在编程、数学、通用能力等方面取得重大进步,该模型还采用统一多模态编码技术可以通过单一架构实现多模态输入的深度融合。目前 Qwen3 已经在其英文对话
2025 年 4 月 29 日,采用阿里巴巴人工智能团队通义千问推出最新的开源开源开源大型语言模型系列:Qwen3。根据通义千问团队的引领介绍,该模型在架构、社区训练数据、蓝点推理效率、通义多模态能力等多方面实现显著提升,千问为学术研究、系列产业应用和开源社区注入新活力。
通义千问团队提供的权重包括旗舰版 Qwen3-235B-A22B,该模型在编程、数学和通用能力等基准测试中,与 DeepSeek-R1、GPT-o1、GPT-o3-mini、Grok-3 和 Gemini-2.5-Pro 相比取得极具竞争力的优势。
而 Qwen3 的小型 MoE 架构模型 Qwen3-30B-A3B 激活参数量是 QwQ-32B 的 10 倍,得益于混合专家模式,即便是 Qwen3-4B 这类微型模型,其性能也可以与 Qwen2.5-72B-Instruct 相媲美。
Qwen3 在模型架构方面的优势:
在模型架构上通义千问团队进行深度优化,相较于前代产品也就是 Qwen2.5 系列,引入更加先进的 Transformer 变体设计。Qwen3 采用混合专家架构的部分思想,通过动态分配计算资源而显著降低推理时的计算成本,同时还可以保持甚至提升模型能力。
这种设计使得 Qwen3 在处理复杂任务时能够以更低的能耗实现更高的吞吐量,为大规模部署提供了可能。此外 Qwen3 提供多种尺寸选择,包括小型的 3B 参数模型到超大型的 72B 参数模型,满足开发者和企业在不同场景的使用需求,尤其是在资源受限的环境中。
Qwen3 的多模态能力全面升级:
该模型不仅在自然语言处理方面表现出色,还在多模态能力上取得突破性进展,Qwen3 增强对文本、图像、音频和视频的统一处理能力,该模型使用统一多模态编码技术 (Unified Multimodal Encoding),通过单一模型架构实现多模态输入的深度融合,从而在视觉推理、语音交互、视频分析等任务中展现出卓越性能。
例如在视觉推理任务中,Qwen3 能够精准解析复杂图像中的数学公式、表格和文本内容,并结合上下文进行逻辑推理,这种能力在教育、科研和内容创作等领域具有广泛的应用前景。Qwen3 支持实时语音生成和视频流处理,因此在智能客服、虚拟助手和多媒体内容生成等场景中表现出色。
Qwen3 的训练数据多样化和规模化:
该模型的预训练数据集覆盖超过 30 种语言并包含高达数万亿 token 的多模态数据,包括但不限于文本、图像、音频和视频等多种形式。Qwen3 在中文和英文数据方面的优化尤为突出,使其在多语言任务中表现出色,尤其是中英文混合场景下的语义理解和生成能力。
为了减少模型偏见,开发团队还在数据清洗和质量控制方面投入了大量精力,通过自动化和人工审核相结合的方式,确保训练数据的多样性和可靠性,以此减少模型偏见并提升模型在敏感任务中的鲁棒性。
开源生态领域的继续扩展:
Qwen3 基于 Apache 2.0 许可协议发布,这意味着无论是个人还是企业都可以自由使用 Qwen3 模型并进行修改和商业化,与 Meta Llama 复杂的许可协议相比,Qwen 系列模型的宽松许可模式有助于人工智能开源社区的进一步发展。
下面是 Qwen3 不同权重和对应的上下文长度:
Qwen3-0.6B:32K
Qwen3-1.7B:32K
Qwen3-4B:32K
Qwen3-8B:128K
Qwen3-14B:128K
Qwen3-32B:128K
Qwen3 系列模型在上下文处理能力方面优化了注意力机制并引入分块预填充技术,该技术大幅度降低长序列推理的内存占用,因此 Qwen3 能够高效处理超长文档、代码库分析和多轮对话等任务,为企业级应用提供强有力的支撑。
目前该模型已经在通义千问英文版 AI 平台提供在线对话,同时开源权重模型也已经在 HuggingFace 等平台发布,有兴趣的用户可以下载 Qwen3 模型进行本地测试、调试和部署。
在线对话:https://chat.qwen.ai/
模型下载:https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f
微软不再向非营利机构免费提供Microsoft 365 Business Premium和Office 365 E1许可证 – 蓝点网2025-08-28 10:24
加密货币版纸黄金:Tether称其黄金代币XAUt在瑞士存储7.7吨黄金进行支持 – 蓝点网2025-08-28 10:05
传并夕夕解散100余人的漏洞团队 但仍保留20名核心成员继续挖掘和利用漏洞 – 蓝点网2025-08-28 09:49
OpenAI推出价格更便宜的Flex API接口 处理速度较慢但只需要半价即可使用 – 蓝点网2025-08-28 09:41
通义千问Qwen3系列AI模型正式发布 继续采用开源模式引领AI开源社区发展 – 蓝点网2025-08-28 09:37
B站否认在用户访问网页版时使用CPU进行PCDN流量分发 相关说法纯属猜测 – 蓝点网2025-08-28 09:22
群晖正式发布DS925+网络附加存储设备 采用AMD处理器和双2.5GbE网口 – 蓝点网2025-08-28 08:24
英特尔200S处理器存在重大性能问题 SSD最高速度被限制在12GB/秒且无法修复 – 蓝点网2025-08-28 08:23
微软将更改账户注册流程默认不需要设置密码 希望用户使用通行密钥等替代密码 – 蓝点网2025-08-28 08:12
微软宣布将从下周开始在Microsoft Azure平台推出OpenAI Sora视频生成模型API – 蓝点网2025-08-28 08:09
加密通信应用Signal发布新版本阻止Windows 11 Recall(回顾)截取其用户的聊天记录 – 蓝点网2025-08-28 10:27
蓝牙技术联盟SIG发布蓝牙6.1版 新增随机可解析私有地址用来增强隐私 – 蓝点网2025-08-28 10:24
谷歌也在逐渐废弃远程办公 要求员工必须返回办公室否则拿着补偿金走人 – 蓝点网2025-08-28 09:45
如果最终Chrome要从谷歌剥离的话 OpenAI有意收购该浏览器 – 蓝点网2025-08-28 09:33
在iOS 18.5中苹果将拆机电池的诊断提示从「已使用」改成「二手」增强提醒 – 蓝点网2025-08-28 09:02
奢侈品品牌迪奥疑似遭到黑客攻击被拖库 泄露中国区客户的敏感资料 – 蓝点网2025-08-28 08:59
[附解决方案] 工程造价软件开发商广联达驱动程序导致Windows 11大规模蓝屏死机 – 蓝点网2025-08-28 08:59
部分国内高校学生开通的Cursor Pro会员暂时保留 后续可能需要再次验证身份 – 蓝点网2025-08-28 08:39
微软用于修复安全漏洞而创建的空文件夹inetpub的做法本身也存在安全缺陷 – 蓝点网2025-08-28 08:18
英特尔计划裁员21,000人以缩减运营成本和精简管理层 占比高达20% – 蓝点网2025-08-28 07:58