新闻中心
近日,巨擘大模子评测基准SuperCLUE发布最新《汉文大模子基准测评2024年10月论说》。其中,由中国电信(601728)打造的星辰语义大模子TeleChat2,行为央企大模子代表,凭借出色后果,详细才调位列大模子第一梯队。TeleChat2在理科“器具调用”维度排名前二,在Agent智能体总榜排名比肩第二。
数据起头:SuperCLUE TeleChat2-35B以更小参数目和更佳后果赢得开源模子名次榜铜牌,详细后果最初Llama-3.1-70B-Instruc和Llama-3.2-90B-Instruct等较大参数模子。
数据起头:SuperCLUE
星辰语义大模子由中国电信改革研发并不休迭代冲突。TeleChat2系列是在星辰语义大模子TeleChat发布以来推出的第二代版块。
本年9月,TeleAI认真发布并开源了首个基于宇宙产化万卡集群和国产深度学习框架历练的千亿参数大模子TeleChat2-115B,近日又进一步开源了TeleChat2-3B、7B和35B,以适配不同场景的应用需求,构建了全尺寸大模子开源布局。
超强器具使用及Agent才调
本次最新的SuperCLUE10月论说笼罩43个国表里有代表性的大模子,收受多维度、多档次的详细性测评决策,由理科、文科和Hard任务三大维度组成,评测题目总量最初2900说念。理科任务方面,TeleChat2展现了极强的函数调用才调,在器具调用维度排名前二。文科任务方面,TeleChat2在谈话和会、长文本等维度分解隆起。Hard任务方面,TeleChat2在教唆免除维度分解优异,展现了优秀的复杂推理才调。
为了提高模子性能,TeleAI团队在数据维度和后历练阶段进行了优化。在数学才调方面,通过抽取常识点合成问答数据,并聚积数学RM(奖励模子)筛选高质地数据。在代码才调方面,抽取高质地代码函数合告成能已矣代码,并通过单位测试确保代码质地。关于教唆免除才调,通过教唆进化构建无数数据并进行剧本校验,从而大幅擢升模子后果。在后历练阶段,通过模子微调、权重交融和DPO(顺利偏好优化)进一步擢升后果。微调阶段,使用IFD(教唆奴婢难度)和RFT(间隔采样微调)筛选数据,并迭代优化模子。权重交融阶段,聚积多个模子的上风赢得新权重。DPO优化阶段,专注于中等难度问题,迭代补王人模子才调。
不仅如斯,TeleChat2系列模子还完成了Agent才调诱导,要点加强了模子在教唆奴婢、任务拆解、器具调用等方面的才调解分解。在10月的SuperCLUEAgent总榜中,TeleChat2排名比肩第二。
数据起头:SuperCLUE TeleAI团队构建了一个基于图结构和MutltiAgent(多智能体)的框架,通过细分器具场景,创建详备的依赖相关图,从而擢升历练数据的信得过性和复杂度。
同期,欺诈MultiAgent的增强交互种种性,并通过规则搜检,确保交互合理。此外,团队还将器具调用才调分为多个阶段,为每个阶段策动种种化数据,以幸免模子仅学习名义圭臬,这使得模子后果擢升了约15%。
全尺寸开源布局适配多场景落地
TeleAI弥远积极通过开源股东大模子本领改革和国产化进度,并为产业执续运送最初的本领才调,加快应用落地。早在本年前半年,就连续开源了1B、7B、12B和52B参数的第一代TeleChat系列模子。最近,TeleChat2系列也已完成3B、7B、35B和115B模子开源,逐渐构建了全尺寸开源布局,并勾引了国表里盛打开发者的督察和使用。
凭借超卓的性能和开源生态孝敬,星辰语义大模子在Gitee开源社区赢得了“GVP-Gitee最有价值开源形式”。前不久,星辰大模子还被中国信息通讯推敲院(信通院)授予“果然开源大模子老到度才调”认证和“2024年度央国企开源形式典型案例”称呼。
凭借不同的参数建树和机动的架构策动,TeleChat2系列模子可机动适配于不同应用场景、不同资源建树、不同延时条目、不同反映速率的种种化需求。现在,星辰语义大模子系列已在政务奇迹、智谋西席、计辞别析、公文写稿等领域无为应用落地。
在政务场景,星辰语义大模子已应用于智能常识库、智能受理助手、智能分类助手、智能客服机器东说念主、智能语音坐席助手等,助力政务使命擢升使命效用。
在西席领域,星辰语义大模子落地西席听力机,扶助学生进行英语白话对话教训、中英文写稿、汉文诗歌创作等,擢升他们的学习兴味和个性化体验。
在智谋办公场景,基于星辰语义大模子的超强语义和会和追溯才调,星辰慧记一站式会议助手八成一键索求会议纪要,已矣会后追溯秒生成,股东企业更高效、更智能发展。
在本次参选SuperCLUE10月榜单的43个大模子企业中开云体育,TeleAI是唯独的央企大模子机构,同期TeleChat2系列大模子是基于宇宙产化万卡集群和国产深度学习框架历练完成。

