共计 2974 个字符,预计需要花费 8 分钟才能阅读完成。
在 10 月 24 日举行的第七届世界声博会暨 2024 科大讯飞全球 1024 开发者节上,科大讯飞的董事长刘庆峰揭晓了讯飞星火大模型的最新应用成果,并推出了星火 4.0 Turbo。该模型的七项核心能力均已超越 GPT-4 Turbo,尤其在数学和编程能力上更是超越了 GPT-4o。在国内外 14 项主流测试中,讯飞星火 4.0 Turbo 在 9 项中获得了第一名。同时,国产超大规模智算平台“飞星二号”也正式启动。
讯飞星火 4.0 Turbo 的表现令人瞩目:在国际 14 项主流测试中,成功超越 9 项,效率提升达到 50%。
在最新发布的讯飞星火 4.0 Turbo 中,其数学和代码处理能力显著高于 GPT-4o。根据艾伦人工智能研究所、OpenAI 等国际权威机构发布的多样化测试集,讯飞星火 4.0 Turbo 在理解与推理、综合考试、数学与科学等 14 项主流测试中,超过了 9 项,展现出 50% 的效率提升。
为评估行业实际数学任务,科大讯飞构建了 CAppliedMath-1.0 测试集。在计算、财务、金融和度量等多个维度的任务中,讯飞星火 4.0 Turbo 都超越了 GPT-4o。其算法验证已完成超长思维链、树搜索及自我反思等,预计到今年底,数学能力将显著提升,达到类“o1”的高难度水平。
在发布会上,科大讯飞重新定义了万物智联时代的多模 AIUI 交互标准,除了原有的远场高噪音、全双工及多语种多方言能力,还升级了多模态能力,新增了超拟人和个性化功能。
超拟人数字人首次亮相,用户可以通过超拟人的语音与数字人进行互动,实现语音、视频和图文的全面联动。科大讯飞研究院院长刘聪现场与超拟人数字人进行了角色扮演游戏,表现生动有趣,无论是扮演孙悟空还是小猪佩奇,数字人的反应都非常逼真。
刘聪表示,目前讯飞星火支持用户创建个性化数字人,用户只需在后台进行简单编辑,就能迅速生成自己的卡通形象,并可以通过一句话复刻自己的声音,随时随地与自己对话。目前已支持 1300 多种人设的打造。
讯飞首次推出星火多语言大模型,为全球用户提供了新的选择。
在语音识别领域,科大讯飞在远场高噪场景下的语音识别能力进一步增强。
在多语言能力方面,首次实现全国地级市方言的全面覆盖,包括 288 个地市的 202 种方言。讯飞输入法 14.0 即将支持 202 种方言的自由表达。
在多语种能力上,讯飞发布了星火多语言大模型,除了中英文外,还支持俄、日、阿、法等八种语言。基于实际应用场景构建的 MMT-Eval-1.0 测试集显示,讯飞星火在汽车、家电、办公和翻译等行业的应用效果超越了 GPT-4o。
刘庆峰表示,作为中国唯一的认知智能全国重点实验室承建单位,讯飞肩负使命,要致力于多语言大模型的研发。讯飞星火的底层能力需要不断提升,力求达到全球最优水平,并针对实际应用场景提供最佳解决方案,“我们一定要代表中国给世界提供第二种选择。”
多模态和多语言能力的升级,将为汽车产业注入新动力。科大讯飞还首次推出了汽车端侧的星火大模型,预计在今年第四季度,奇瑞、广汽、长城等多款搭载该模型的车型将陆续上市。
科大讯飞一直以来的出发点是“用人工智能技术解决社会刚需”。在此次 1024 全球开发者节上,科大讯飞针对教育、医疗、司法、政务服务及企业办公等多个行业场景发布了最新的产品应用。
在教育领域,首次推出基于“问题链”的高中数学智能教师系统。
今年 1 月份,中国教育科学研究院与科大讯飞和华为展开深度合作,基于讯飞星火教育大模型开展“基于生成式人工智能的中小学智能教师示范研究”。此次发布的高中数学智能教师系统是众多优秀教师与 AI 大模型的智慧结合,旨在实现“人机共育”。该系统能够智能生成教学问题链,帮助教师逐步引导学生思考并解决问题,同时精准定位学生的薄弱环节,鼓励真实世界中的主动提问与探究式学习,促进学生能力与素养的全面提升。这一系统是中国教科院牵头,集合了 12 个区域 50 多位数学教研员与 400 多位优秀教师共同创作的成果。
在医疗领域,讯飞星火医疗大模型 2.0 的发布,标志着医疗知识问答、复杂语言理解、专业文书生成、诊断推荐和多轮交互等核心场景能力的重大升级。
基于讯飞星火医学影像大模型打造的智能医学影像助手也正式亮相,能够在智能质控环节快速评估图像质量,并及时纠正检查问题;在智能诊断环节,能迅速生成诊断报告,提供解释和溯源;在读片环节,接入医学影像大模型,通过相关问答帮助临床医生制定诊疗方案。
会上,讯飞医疗还联合安徽省卫生健康委员会与认知智能全国重点实验室,共同发布全谱系全模态医学影像大模型开放合作计划,旨在汇聚全球顶尖影像 AI 科研团队,共同推动医学影像大模型的发展。
在司法领域,法律大模型助力庭审笔录制作、裁判文书编写和法条类案检索等工作,效率从 61.7% 提升至 87.9%。
在政务服务方面,政务大模型持续迭代,全面覆盖 4500 多种标准化事项和 60 多种材料,民众与政务大模型的互动实现了边聊边确认办事意图,审核时间缩短 80%,登记效率提升了 5 倍。此外,发布会上首发了搭载政务大模型的“星火智办一体机”,方便群众从“问着办”转变为“领着办”。
科大讯飞已成为央国企首选的 AI 解决方案提供者。刘庆峰分享了大模型应用成绩单:央国企中标情况居首,教育医疗市场占有率最高,智能汽车市场第一,开发者生态领先,智能硬件市场第一,科研与工业应用均居于首位。
截至 2024 年 10 月,科大讯飞已与众多头部企业共建了 20 多个行业大模型,覆盖超过 300 个应用场景,涵盖的行业及场景数量均为第一。
为助力各行业更好地实现大模型落地,科大讯飞构建了从“算力建设、数据整理、模型训练,到场景落地、安全保障及运营优化”的完整解决方案。“科大讯飞拥有先进的工具链,显著提升了数据处理和模型训练的效率;在 300 多个行业场景的实际应用案例中,已经形成了相互借鉴和复用的规模化效应。”刘庆峰表示。
首个国产万卡算力集群“飞星二号”平台正式上线,持续引领全国产算力平台的发展。
在 2024 科大讯飞 AI 开发者大赛中,共有来自 14 个国家、348 座城市的 35268 支团队参赛,其中 9372 支为大模型团队。此次大赛中,科大讯飞联合 30 所科研机构和 44 家企业共同创作赛题,最终评选出十佳团队。
只有生态繁荣,才能实现人工智能的美好未来。根据 IDC 研究报告和市场公开数据,科大讯飞在语音与语义市场的占有率为第一,大模型开发者规模为第一,达到了 78.1 万。发布会上,科大讯飞宣布将开放全场景资源,从技术能力到实际应用,帮助开发者以最短路径实现产品成功,并通过线上线下渠道共享资源,加速开发者的市场成功。同时,科大讯飞将牵头成立 AI 基金,设立 5 亿创业基金以支持开发者创业,加速前沿技术的产业化进程,并与地方政府合作为 AI 创业团队提供实际落地支持。
发布会上,科大讯飞与华为及合肥市大数据资产运营有限公司联合推出的国产超大规模智算平台“飞星二号”正式启动。去年 10 月 24 日,首个国产万卡算力集群“飞星一号”平台上线,讯飞星火大模型在全国产算力平台的发展中持续引领。刘庆峰介绍,过去一年里攻克了众多技术难题,解决了超过 500 次的基础软硬件和模型适配问题。
“飞星二号”将不断适配新模型和新算法,推动智算集群规模的再一次飞跃,持续探索前沿领域,引领国产大模型基础的发展,为世界提供更好的选择。“只有在真正自主可控的平台上,中国人工智能的未来才会更加光明。”(张倩)