共计 2200 个字符,预计需要花费 6 分钟才能阅读完成。
“毫无疑问,我们有着宏大的愿景。”在被问及通义千问是否有拓展计划时,阿里云相关工作人员向北京商报记者明确表示,“请大家拭目以待。”随之而来的是3月19日,阿里推出的“通义听悟”大模型产品,新增了多个功能模块,包括音视频问答助手“小悟”和一键AI改写等功能。与通义家族其他应用相比,通义听悟的上线时间更早且更为引人注目。目前,通义听悟并无向消费者收费的意向,未来将会融入通义千问App之中。对于这一系列的计划,业界对此褒贬不一,有人认为阿里擅长于企业市场,这符合其整体战略,也有人认为这可能是技术实力不足的体现。无论如何,突破圈层都是大模型应用竞争中的关键。
无用户收费政策
用户只需直接询问,即可获取关键信息,并且能够一键将口语转换成书面内容……在3月19日,通义听悟推出了六项新功能。其中,音视频问答助手“小悟”通过多语言查询处理、长文本理解、指令演变框架优化和检索增强生成算法,能够实现对超长音视频的多样化问答,打破业界对内容问答的音视频时长和文件数量的限制。
根据北京商报记者访问通义听悟网站的情况,首页右上方已显现出“小悟”的动态图标,用户只需点击此图标便可与“小悟”进行互动。当记者要求总结当天的录音时,“小悟”迅速进行了概括,并附上了相关录音的名称和时间点。
总体而言,通义听悟保持了其产品的基本设置,首页上突出了三个主要功能:实时记录、音视频上传、播客链接转写。这与2023年6月通义听悟展开公测时的定位相符,旨在服务高知识附加值的音视频场景,例如会议、课堂、访谈、培训、面试、直播、观看视频及听播客等,阿里云CTO周靖人当时如是说。
自上线以来,通义听悟坚持不对消费者收费的策略。对此,产品负责人杨帆分享了一个故事:“商业模式的反馈每天都在不断增多,有用户甚至询问‘我能否支付费用’。看到这样的反馈让我倍感欣慰。但目前我们并没有计划向C端收费,C端的目的在于展示阿里的技术研究方向。我们的商业策略是通过API在B端实现盈利。”
第三方观察者对不向消费者收费的做法有不同见解。“如果一款应用的技术水平与免费的产品或竞争对手没有显著提升,就不应向用户收费,只能针对B端进行收费。因为B端可以通过打包和长期合作等方式实现收益。有市场地位的产品能强势销售,这实际上反映了技术能力的不足,”文渊智库创始人王超对北京商报记者表示。
集成至“通义千问”App
通常情况下,语音转写类产品采用会员制付费模式。用户使用通义听悟时,可以通过登录、分享等方式获得转写时长。
3月19日,针对细分用户的计划逐渐浮出水面。当天,通义听悟正式推出“高校公益计划”,所有中国内地高校的师生通过以edu.cn结尾的教育邮箱认证后,均可获得500小时的转写时长,存储空间由20G扩展至200G。
根据用户分享的案例,大部分用户通过PC端使用通义听悟。官网信息显示,通义听悟支持Chrome和Edge浏览器插件,以及钉钉和微信小程序。
在被问及是否会推出App版本时,通义听悟的研发负责人邢君告诉北京商报记者:“听悟App是我们计划中的一部分,目前确实有这个计划,第一阶段的功能会集成在通义千问的App内,大家很快就会看到。”
通过时间轴,能够更清晰地了解通义家族的发展历程。2023年4月,阿里云推出了大模型产品通义千问,并邀请用户参与内测。6月,专注于音视频内容的“通义听悟”上线,7月AI绘画创作模型“通义万相”启动定向邀请测试。
基于通义千问和通义万相,通义家族现有的八个行业模型包括:智能编码助手通义灵码、AI阅读助手通义智文、工作学习AI助手通义听悟、个性化角色创作平台通义星尘、智能投研助手通义点金、智能客服通义晓蜜、个人健康助手通义仁心和AI法律顾问通义法睿。2023年9月,通义千问通过备案正式向公众开放,次月其iOS版App也随之上线。
追求破圈的梦想
在2023年ChatGPT风靡之际,通义家族经历了激烈的竞争,阿里云是否有责任让通义千问突破圈层?对此,阿里云智能公众与客户沟通部的总监朱迅垚向北京商报记者表示:“通义千问确实有着宏伟的愿景。在视觉领域和开源大模型领域,通义千问已经取得了一些突破。而听悟作为我们重要的核心产品,当然希望能够突破圈层,但我们的主要目标仍然是为专业群体和学生提供优质服务。”
说到通义听悟,杨帆向北京商报记者透露了最新的使用数据,目前通义听悟的注册用户约为500万,活跃用户每天转写音视频三次以上,平台每天处理的字符数接近20亿字。对通义听悟团队而言,“我们更加关心真实用户的使用体验。”杨帆解释道,“现阶段大部分AI产品仍是工具型,听悟是一个典型的低频刚需产品,无法像微信那样成为每天高频使用的App,我们更注重它的使用量。”
将通义听悟集成到通义千问中,以此实现突破圈层。王超对此认为:“如果独立运作就要自己盈利,而集成在一起则更适合当下的阿里云。作为国内最大的云计算服务商,阿里云的某个产品若集成了通义千问,若toB价格不变,企业感知到的成本会降低。而在阿里云内部结算时,通义家族的确会产生收入。”
在与北京商报记者的交流中,深度科技研究院院长张孝荣表示:“阿里云的大模型应用既面向C端又面向B端,我认为更适合于B端市场。”
北京商报记者 魏蔚