Products
GG网络技术分享 2025-03-18 16:16 0
今天,阿里云举办通义千问发布会,开源通义千问 720 亿参数模型 Qwen-72B。
地址:https://modelscope.cn/models/qwen/Qwen-72B/
据介绍,Qwen-72B 在 10 个权威基准测评创下开源模型最优成绩,成为业界最强开源大模型,性能超越开源标杆 Llama 2-70B 和大部分商用闭源模型。
通义千问 - 72B (Qwen-72B) 主要特性:
大规模高质量训练语料:使用超过 3 万亿 tokens 的数据进行预训练,包含高质量中、英、多语言、代码、数学等数据,涵盖通用及专业领域的训练语料。通过大量对比实验对预训练语料分布进行了优化。
强大的性能:Qwen-72B 在多个中英文下游评测任务上(涵盖常识推理、代码、数学、翻译等),效果显著超越现有的开源模型。具体评测结果请详见下文。
覆盖更全面的词表:相比目前以中英词表为主的开源模型,
通义千问还开源了 18 亿参数模型 Qwen-1.8B 和音频大模型 Qwen-Audio。至此,通义千问共开源 18 亿、70 亿、140 亿、720 亿参数的 4 款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现 “全尺寸、全模态” 开源。
Demand feedback