共计 1464 个字符,预计需要花费 4 分钟才能阅读完成。
连接网络后,进入相应网页,才能够使用人工智能大模型。展望未来,您的手机将成为随时可与AI进行对话的智能终端。
在3月28日,阿里云与知名半导体企业联发科(MediaTek)携手宣布,通义千问的18亿和40亿参数大模型已成功整合到天玑9300移动平台。这一进展意味着,用户能够在离线环境中顺畅进行多轮AI对话,显著提升手机的AI使用体验。

据了解,此次是通义大模型首次实现芯片级别的软硬件适配,象征着Model-on-Chip的探索正式进入商业化的新阶段。
当前,使用大模型仍需连接互联网,但在手机端部署后,端云混合AI将充分利用设备的计算能力,在运营成本、用户信息安全、实时性以及个性化体验等方面展现出明显的优势。
不过,要成功将大模型集成并运行于终端设备,必须完成从底层芯片到操作系统及应用开发的软硬件深度适配,这一过程中仍面临技术整合不完善、算子支持不足以及开发待完善等多重挑战。
阿里巴巴通义实验室的业务负责人徐栋介绍,阿里云与联发科在模型瘦身、工具链优化、推理和内存优化等多个方面展开了深入合作,使得基于AI处理器的高效异构加速得以实现,成功将大模型“嵌入”手机芯片并运行,为业界展示了端侧AI的Model-on-Chip部署新模式。

基于通义千问大模型,天玑9300设备能够实现离线的AI多轮对话
目前,通义千问的18亿参数开源大模型在多个权威测试集上的表现超越了之前的SOTA模型,推理2048 token的内存使用仅为1.8G,展现出低成本、易于部署和商业友好的特点。
根据MediaTek公布的数据,天玑9300已整合第七代AI处理器APU790,配备硬件级的生成式AI引擎,其生成处理速度是前一代AI处理器的八倍。在引入通义千问18亿参数大模型后,手机芯片在推理时表现出了优异的性能和低能耗。数据显示,推理过程中CPU的占用率仅为30%左右,内存使用少于2GB,推理速度超过20tokens/秒,各项指标均处于行业领先水平,能够在离线条件下顺畅进行多轮AI对话。
目前,这些成果将通过SDK的形式提供给手机制造商和开发者。未来,用户只需对手机“动动嘴”表达需求,由天玑移动平台和通义大模型驱动的AI智能体便能够自动创建并完成任务。这为广大开发者和终端设备厂商带来了更为广阔的创新空间。
MediaTek无线通信事业部副总经理李彦辑博士表示:“阿里云的通义系列大模型在AI领域中处于领先地位,期待通过双方的合作为应用开发者和终端用户提供更强大的硬件与软件解决方案。”他强调,推动生成式AI的端侧部署以及AI应用、智能体生态的迅速发展,将为用户带来更多令人兴奋的AI产品体验。
当天,阿里云与MediaTek共同启动了AI智能体解决方案的联合探索计划,整合MediaTek天玑移动平台的AI算力以及阿里云通义千问的大模型能力,为开发者和企业提供更为完善的软硬件联合开发平台。此外,双方团队已经完成了通义千问40亿参数大模型与天玑9300的适配,未来将基于天玑适配70亿等更多参数的大模型,推动开发更多的AI智能体及应用。
推广
【如果您有新闻线索,欢迎向我们报料,一经采纳有费用酬谢。报料微信关注:ihxdsb,报料QQ:3386405712】
