高通与腾讯合作,推动腾讯混元大模型端侧部署

骁龙峰会期间,

高通技能公司

宣告与腾讯混元协作,根据骁龙8至尊版移动渠道,一起推动了腾讯混元大模型7B和3B版别的终端侧布置,展现了此协作完成超卓的运转体现。这将有助于腾讯混元大模型为广泛的事务场景供给技能支持,经过运用终端侧AI加快产品立异,有用下降运营本钱,并进一步扩展生成式AI在终端侧的运用和遍及。

骁龙8至尊版移动渠道搭载全新的第二代定制高通Oryon CPU和增强的高通Hexagon NPU,充分运用高通AI引擎优势,能够带来更强壮的终端侧生成式AI处理才能。骁龙8至尊版的AI算力,结合高通AI软件栈以及职业抢先的东西套件,包含高通AI模型增效东西包(AIMET)等,为模型供给了全栈优化才能。经过运用根据硬件的INT4量化技能,能够大幅进步腾讯混元大模型在终端侧的运转功率,端侧推理完成首个token生成时延到达150ms,解码速率到达超越30 tokens/秒。

而腾讯混元大模型已为腾讯内部超越700个事务场景和C端运用供给底层技能支持,包含微信输入法、腾讯手机管家、QQ、腾讯视频、QQ浏览器、企业微信、腾讯会议等,经过完成面向骁龙8至尊版的终端侧布置,能够运用终端侧生成式AI的丰厚优势,更好地满意广泛的终端侧事务需求。例如,腾讯手机管家短信智能辨认功用首先运用腾讯混元的终端侧模型才能,经过海量数据结合深度神经网络与预练习,让模型具有极强的语义了解才能,经过结合上下文语境信息更精确地了解短信目的,使短信召回率大幅进步将近200%,辨认精确率进步20%。因为部分短信触及用户个人灵敏信息,端侧AI还能够在确保超卓功能体现的一起,有用维护用户的个人信息隐私安全。

返回资讯列表