共计 542 个字符,预计需要花费 2 分钟才能阅读完成。
题主正处于雅思备考阶段,频繁使用 GPT- 5 和 Gemini 2.5 pro 来修改自己的雅思作文。然而,令他困惑的是,无论如何书写(就算是模仿 AI 之前生成的 7.5 分范文),AI 给出的评分始终没有超过 6 分。
为此,题主将书中的 7 分和 7.5 分的范文提供给 AI 进行评分。结果 AI 依然按照雅思作文的评分细则,逐条给出 5.5 到 6 分的评价,理由非常充分……
从理论上讲,英语应是这些国外 AI 的强项。而雅思作文的评分标准与普通高中英文考试的作文不同,其标准非常细致,涵盖了目标达成度、语法、语言风格等多个方面。那么,为什么 AI 总是倾向于给出 5 到 6 分的评价呢?难道当前能够理解复杂数学和法律问题的 AI,仍然无法掌握语言的本质?即便是基础的语法检查或连接词的合理使用,它们也无法胜任吗?
我认为,将评分规则和二十篇评分示例一并作为提示词提供给 AI,或许能够提高其评分的准确性。
来源:知乎
原文标题: 为什么目前的大模型难以正确完成英文作文评分?– 知乎
声明:
文章来自网络收集后经过 ai 改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完