其他教程

其他教程

Products

当前位置:首页 > 其他教程 >

中国电信将于年内开源千亿级参数大模型

GG网络技术分享 2025-03-18 16:16 0


近日中国电信开源了 12B 参数规模星辰语义大模型 TeleChat-12B。相较于 1 月开源的 7B 版本,内容、性能和应用等方面整体效果提升了 30%。其中,多轮推理、安全问题等领域提升超 40%。另外,据了解,中国电信将于年内开源千亿级参数大模型。

根据介绍,TeleChat-12B 将 7B 版本 1.5T 训练数据提升至 3T,优化数据清洗、标注策略,持续构建专项任务 SFT(监督微调)数据,优化数据构建规范,大大提升数据质量;同时,基于电信星辰大模型用户真实回流数据,优化奖励模型和强化学习模型,有效提升模型问答效果。

TeleAI 通过更彻底地开源推动大模型技术进步和大模型国产化进程。此次开源提供基础模型以及基于相应版本的对话模型、不仅支持传统的全量参数更新还支持 LoRA 等只更新部分参数的高效微调方法、支持 Deepspeed 微调、支持 int8、int4 量化和国产芯片训练推理,推动大模型国产化进程。

与此同时,星辰大模型也在深入推动人工智能与各行各业的融合,积极探索新兴的应用场景。星辰语义大模型已应用于行文写作、代码编程、网络故障分析以及经营分析等场景。行文写作方面,平均生成字数超过 1500 字,有效采纳率为 85.7%。

早在 2023 年年报中,中国电信就表示,2024 年公司将把握以人工智能为代表的新一轮科技革命和产业变革趋势。

开源项目地址:https://gitee.com/Tele-AI/tele-chat

标签: 开源 模型

提交需求或反馈

Demand feedback