腾讯大模型升级,落地路径聚焦 B 端产业应用,竞争白热化
2024-06-04
自去年9月混元大模型发布以来,腾讯大模型经历了史上最大一次升级。
5月17日,在“腾讯云生成式AI行业应用峰会”上,腾讯披露了混元大模型一系列新进展,包括智能体平台“腾讯元气”、三大PaaS工具引擎,以及行业大模型最新能力升级等。
2024年被普遍认为是国产AI大模型全面商用的元年。各大互联网公司之间的落地争夺战已经拉开帷幕,竞争愈发激烈,甚至打响价格战。近一个月来,智扑AI、零一万事等国内外大厂、创业公司相继推出并迭代重磅AI大模型版本,字节跳动、阿里、百度等也纷纷加入价格战。
在实施路径上,腾讯与其他大模厂商略有不同——相较于单一的C端大模应用,腾讯更注重B端,即行业应用的实施。
2023年6月,腾讯云率先发布行业大模型,让市场看到了互联网巨头对行业大模型落地的思考:通过聚焦行业场景、针对解决痛点,推动前沿创新加速落地,帮助企业降本增效。
三个月后,直接面向C端用户使用的混元大模型正式发布网站模板,腾讯进一步强调“打造大模型只是起点,目标是将技术落地到产业场景,创造价值”。
腾讯集团高级执行副总裁、CISG(云与智慧行业事业群)CEO汤道生在会上指出,腾讯始终把“行业实用性”作为公司大模型发展的核心战略,目前腾讯推出的行业大模型已在金融、医疗、教育、汽车、能源等20多个行业落地。
与此同时,混元模式也在加速落地。据悉,混元已在腾讯内部600多个业务和场景进行测试。汤道生以腾讯会议为例,基于混元的AI助手上线后,用户只需要简单指令,就能完成发言提醒、观点汇总、会议纪要等能力,大幅提升会议效率。过去4个月,用户每日通话量增长了20倍。
在大模型落地过程中网站开发,场景选择、需求匹配、结果准确性、数据保密性、实施成本、技术壁垒等挑战不断涌现。汤道生总结称,腾讯将通过打造高性能的模型、高效的工具平台、高敏捷的场景应用、高可用的计算基础设施、强大安全的模型环境,打造最贴近产业的AI。
腾讯混元应用加速
要讨论规模化模型实现的前提,必须保证领先的基础模型能力,与多数厂商一样,腾讯也在不断升级混元的技术实力。
一方面,腾讯率先采用MoE(of)架构,将混元大模型拓展到万亿级参数规模,升级之后混元整体性能相比上一代提升了50%,部分中文能力已经追上GPT-4,在回答“新”问题上的表现也有了很大提升。
浑元在多模态性上也取得了一些进展,据腾讯集团副总裁姜杰介绍,在AI原始图像领域,腾讯浑元的原始图像基础设施已全面升级为与Sora相同的DiT架构,具备多轮绘制能力。
在视频生成领域,姜杰指出,腾讯混元支持文本生成视频、图片生成视频、图文生成视频、视频生成视频等多种视频生成能力,生成的视频时长可达16秒。预计在第三季度上线的下一代文本生成视频模型,预计可以生成30秒以上的视频。
为了进一步降低应用门槛网站开发,让大模型更加“实用”,腾讯已经开始加快大模型能力输出的步伐。
例如,腾讯混元发布智能坐席平台“腾讯元气”,帮助用户以极低的门槛打造专属的AI智能坐席,并支持一键分发到QQ、微信客服、腾讯云等渠道,被普遍视为腾讯版的“通用智能坐席”。
今年1月GPT发布时,市场曾将其视为人工智能领域的“一鸣惊人”,有望助力大模型技术真正实现突破。但现在回头看,它的进展并未如预期般顺利。
腾讯混元模型应用负责人张锋指出,智能代理仍是时代的前沿产品,市场接受还需要时间。同时,智能代理的普及与模型基础能力息息相关。“随着模型基础能力的提升,智能代理的建设也会更好地满足用户需求。”
腾讯云还在PaaS层发布了三款全新引擎工具。腾讯云副总裁、腾讯云智能负责人吴云生表示,通过PaaS方式接入大模型,可以简化数据工程、模型微调、应用开发的流程,从而帮助企业更高效、更简单地将大模型能力应用到生产、销售和服务场景中。
以大模型知识引擎为例,这是一个基于大语言模型的知识应用开发平台,通过腾讯打造的“模块化”应用模板,基层人员只需要用自然语言网站开发,5分钟就能开发出一个知识服务应用,快速落地到客服营销、企业知识社区等各类与人连接的业务场景中。
图片及视频创作引擎将通过大模型全面提升素材生成效率,例如“图片创作引擎”可为企业客户提供AI拍照、线描、图片风格化等能力;“视频创作引擎”可提供视频翻译、视频风格化、画布扩展等功能。
此外,算力也是市场能否更大规模运行大模型的关键,腾讯云通过自研星脉网络3.2T通讯带宽和统一接入层能力,构建了可支持十万张以上卡并行计算、兼容多种GPU生态的算力集群。
吴云胜透露,通过自研的高性能计算网络,腾讯的算力成本低于购买相关网络设备,训练与推理平台的结合使用,让资源在训练和推理过程中得到更高效的利用。
根据
据了解,包括百度、百川等90%的头部大模型公司均在腾讯云上建设大模型。
姜杰在会上还透露,C端助手App“腾讯元宝”将于5月底上线,首批上线的功能包括AI搜索、翻译、文献摘要、口语练习等,但更多信息目前尚未透露。
此前,混元宝的C端入口仅有小程序“混元助手”和网站端,缺乏统一的移动端入口。借助腾讯强大的流量池,“腾讯元宝”有望为大模型的C端应用带来新的突破。