共计 1220 个字符,预计需要花费 4 分钟才能阅读完成。
“假如能够轻松消除所有痛苦的回忆,你会选择吗?”在大屏幕上,两位外形和服装几乎一致的辩论者围绕这一情感、伦理、心理和哲学交织的主题展开激烈争论。此时,一位是真人辩手、武汉大学的教师陈铭,而另一位则是来自上海企业MiniMax的人工智能模型。在7月26日举行的“2025中国·AI盛典”辩论赛后,42%的观众误认为模型是人类,这一结果显示该模型成功通过了人机辩论的图灵测试。
图灵测试是评估机器是否具备人类智能的经典标准,最初由被称为“人工智能之父”的艾伦·图灵在1950年提出:如果一台机器能够在自然语言的交流中“欺骗”超过30%的人类参与者,就可以被认为具有智能。
此次国内大模型首次通过人机辩论的图灵测试,不仅展示了我国在人工智能自然语言理解与逻辑推理方面的重大突破,也彰显了上海作为全球人工智能创新中心的实力。该“辩手”的文本模型学习了数以万亿计的人类数据,而其语音模型仅需6秒的声音样本便可重现真实的语音。辩论的影像则通过节目组运用人工智能技术进行统一处理,100位观众仅凭辩论内容、语言风格及思维逻辑作出判断。
在辩论过程中,模型展现了诸多亮点。例如,在“人工智能是否应拥有法律人格”等辩题上,模型能够迅速检索相关法律条文与伦理案例,构建出多层次的论证框架;在应对人类辩手的即兴提问时,模型能够在半秒内生成反驳的言辞,比如在“技术失业”话题中,结合制造业自动化的数据提出“岗位结构转型”的新视角;在情感表达方面,模型利用语音合成技术模拟语气变化,在“教育公平”的辩论中以感人至深的叙述引发观众的共鸣。
赛后,曾多次荣获国际辩论赛冠军的陈铭在微博上表示:“辩论几乎是检验推理能力的最佳方法。根据我此次的亲身体验,经过专门训练的推理模型,其辩论能力可能已经超越了90%的人类辩手。其观点、逻辑、幽默、精彩之语和感染力的输出,AI表现得极为流畅,几乎没有人类的空间。”他同时也指出,AI仍然存在不足,“最终的荣耀仍在那些对重大问题的深度探讨上。对于根本性的哲学思考,AI仍然显得力不从心。”
上海交通大学人工智能学院院长李颉表示,该模型在辩论场景中的突破为政务咨询、金融谈判等高互动领域提供了新的范式。目前,MiniMax已与复旦大学展开合作,将相关技术应用于科技伦理审查的智能系统“一鉴”,实现伦理风险的自动标注及合规性分析。
中国工程院院士、之江实验室主任王坚认为,这场图灵测试的意义早已超越了简单的“辨别人机”。他说:“当年的图灵测试为人工智能设定了一个极具挑战性的目标,而如今我们看到,通过图灵测试仅仅是人工智能新的起点。”
本网站转载的所有文章、图片、音频及视频资料的版权归原作者所有。如因无法联系到作者而侵犯您的权益,请与本网站联系,我们将采取适当的措施。