用5句话打造文心快码的MBTI大模型测试器!

共计 3757 个字符,预计需要花费 10 分钟才能阅读完成。

在 AI 时代,如何快速构建 MBTI 测试器?

在人工智能快速发展的今天,模型的处理能力不断提升,特别是在长文本解析、多模态理解和复杂推理等领域的突破。无论是负责算法开发的工程师,还是产品经理,评估大模型的各项能力已成为 AI 行业的日常工作之一。本期将介绍如何在 20 分钟内,使用文心快码和只需 5 句话构建一个 MBTI 性格测试器,即便是零基础也能轻松上手。

一、需求分析背景

为何要为大模型设计 MBTI 性格测试?在社交网络上,MBTI 被视为人们自我标识的工具,能够在一定程度上反应个体的性格特质、价值观、交流风格及社交态度。既然大模型具备模拟人类思维的能力,那么它是否也会拥有 MBTI 性格特征呢?在职业发展和人际交往等诸多场合中,人们经常参考 MBTI,同样地,对 AI 模型进行 MBTI 性格测试也可以作为一种启发式工具,帮助分析、比较和预测模型的行为模式、倾向以及潜在的局限性。

对算法工程师和产品经理而言,了解大模型的 MBTI 特性有助于改善 人机交互体验、选择合适的模型以匹配任务、揭示模型的内在偏好与偏见,并为模型的开发和调优提供指导。而对于与 AI 进行互动的用户来说,给模型贴上“MBTI 标签”能够快速了解它的“脾气”——即知道它在什么类型的任务中表现更佳,怎样与之交流更加高效。因此,为大模型进行 MBTI 性格测试不仅富有趣味性,也具有实用价值。

参加过 MBTI 测试的朋友都了解,测试一共包含 93 个问题,完成全套测试大约需要 30 分钟。如果采用人工方式进行测试,用户需在客户端或网页上与大模型逐个提出问题,记录每个答案,这样一来,时间成本就会显著提高。然而,需要注意的是,在实际应用中,进行 MBTI 性格测试时,不可能只对一个模型进行测试,也不可能只测试一次。当需要测试多个模型,且为了确保模型表现的稳定性而进行多次测试时,人工测试的效率显得极为低下。即使最终得到测试结果,为了清晰比较不同模型的差异和观察稳定性,仍需耗费时间整理测评报告。整个流程繁琐复杂,难免让人感到沮丧。总体来看,人工测试主要存在以下问题:

场景设计耗时:构思有效的测试用例既耗时又费力;

样本生成低效:手动构建或生成高质量输入 / 输出样本的效率低下;

执行繁琐易错:手动调用不同模型的 API、进行多轮测试并记录结果,极易出错且难以实现规模化;

报告缺乏洞察:难以直观比较模型之间的差异,也难以发现稳定性问题。

幸运的是,我们可以借助文心快码这一编程工具,轻松编写自动化脚本。接下来将详细介绍具体的操作步骤。

二、清晰表达你的需求给 Zulu

文心快码的强大之处在于:它不仅可以生成代码,还能根据需求自动补充场景设计、分解任务,并输出可直接运行的结果。要最大化利用其功能,关键是准确描述需求。在表达需求时,建议详细说明背景、目标、交付标准和执行步骤,以便文心快码能够真正理解我们的意图,准确执行任务。以下是一个示例:

可以提前准备一个文档,包含模型名称、域名、API 密钥,明确告诉文心快码需要测试的模型,并指明要调用的 API,同时提供相应的 MBTI 测试题目。接着提出测试要求,表明需要进行 5 次测试以观察稳定性。此后,告知交付标准,最后提供初步的行动指引:首先让它编写一个项目设计文档,以便了解其思路;然后进行单模型测试以验证项目的可运行性,这样在试错成本更低的情况下为后续全量测试做好准备。

三、观察执行过程

将你的提示输入到文心快码 Zulu 对话框中后,Zulu 便会开始执行任务。在此过程中,我们只需关注它的操作:

第一步:编写项目设计文档 design.md,内容包括系统架构、核心模块设计、数据流和测试计划等部分。

第二步:开发核心测试模块。

第三步:开发报告生成模块。

第四步:开发主程序模块。

第五步:进行单模型测试,确认逻辑和输出是否正确。

在这个过程中,我们可以看到Zulu 能够自动调用相关工具,复用相同的终端,协助完成环境搭建和服务启动,整个过程无需我们操心。

【依赖自动安装】Zulu 自动识别项目中的依赖配置文件,并生成干净的虚拟环境,安装所有所需的依赖。

【服务自启动】Zulu 能够智能识别项目的启动命令,自动运行它,使开发环境的启动变得极为简单。

【错误自修复】如果在环境搭建或服务启动过程中出现问题,Zulu 会主动检测错误并提供修复建议。例如,当缺少某个依赖时,它会自动尝试安装,甚至直接解决问题。

例如 :在运行测试时,若终端报错:ModuleNotFoundError: No module named ‘toml’。Zulu 会立即捕捉到这个异常, 自动执行 pip install toml 命令来修复缺失的依赖,无需用户手动干预,随后继续执行后续任务。

项目初步完成后,Zulu 将提供清晰的项目使用说明和总结。

四、不断优化工作流程

Zulu 为我们开发的自动化脚本基本上已经完成了。但若整个过程是个“黑盒”,难免会引发疑虑:模型是否完成了所有测试?三次测试是否都已完成?如何应对呢?可以添加一个调试需求,以便实时观察模型的输入,使测试过程更加透明。

Zulu 可以根据当前的上下文,在原有代码库中精准定位并进行修改。即使不懂代码、不清楚如何修改,只需输入需求,Zulu 凭借其强大的理解能力,结合现有代码库,迅速找到需要修改的地方。而且,修改过程完全透明:删除的代码以红色标示,新增的代码以绿色标示。

通过 Zulu 优化 MBTI 模型测试流程的全面指南

在工作中,直接输入需求:“希望确认每次请求模型时,输入内容是否符合预期。因此,请增加一个调试模式,让我能够查看模型的输入,最好能将其记录到日志文件中。”这样做不仅能验证调用是否如预期,还便于后续问题的追踪。经过 Zulu 的修改后,调试模式下的执行命令也被提供出来以供测试。

实际上,在整个项目中,Zulu 的应用能够持续优化我们的工作效率。

1. 提升效率

在实际测试中,我们意识到逐一测试问题的效率太低,因而我们命令 Zulu:“为了减少请求次数,每次对话询问模型 8 个问题,以便模型能够批量输出结果。”Zulu 迅速理解了我们的意图,调整了主程序逻辑,将串行请求转换为批量处理,这大幅提升了测试的速度。

2. 自动生成报告

在单个模型的 MBTI 测试基本没有问题的情况下,我们可以指示 Zulu 生成综合报告:“请将 reports 目录下所有单个模型的测试结果整理成一份综合报告。”

3. 性能进一步优化

如果测试速度依然是个问题,我们可以提出更高的要求:“请改用多线程异步并行请求来测试模型,以便加快测试速度。”在这种情况下,Zulu 会重构代码,从而极大缩短测试耗时。

完成 Zulu 的调整后,项目基本就绪。我们可以在终端中输入调试模型的运行指令“python main.py –debug”,开始测试并生成报告。在调试模式下,测试过程将清晰可见。

五、通过预览调试功能完善报告

到此为止,测试报告已经生成,在 reports 目录下可以找到综合报告以及每个模型的历史测试报告。通过预览网页可以验收成果,若发现问题,仍可进行修改。

如果使用文心快码插件,Zulu 的多模态能力也能协助修改。Zulu 支持上传图片,并根据指令识别图片内容或将其转化为代码。可以截取有问题的界面并上传到对话框,再输入修改需求。如果使用的是 Comate AI IDE,则可利用预览调试功能进行修改。只需在 IDE 的左侧边栏点击预览按钮,打开预览调试界面,圈选问题位置,然后在 Zulu 对话框输入修改需求,就能完成修改。

在这个项目中,我希望 报告中的饼图能够展示每个模型的 MBTI 类型,因此在 Comate AI IDE 中选中这个组件,输入调整需求,Zulu 便对报告的 html 文件进行了针对性修改,刷新预览窗口后,便能看到最新的报告样式。

六、展示我们的成果

最后,我们利用 Zulu 的代码解读功能介绍我们的项目成果:我们实现了一个用于测试不同 LLM 模型 MBTI 性格类型的 Python 项目,主要功能包括:

1. 核心测试功能

  • 使用标准 MBTI 测试题目评估 LLM 模型

  • 支持批量测试多个模型

  • 异步执行提高测试效率

  • 多轮测试评估结果的稳定性

2. 报告系统

  • 生成每个模型的详细 HTML 报告

  • 创建多模型对比报告

  • 包含可视化图表展示测试结果

  • 记录历史测试数据

3. 技术特点

  • 基于 Python 3.12 开发

  • 使用 aiohttp 等异步库

  • 集成 Chart.js 进行数据可视化

  • 完善的日志记录系统

4. 测试结果示例

  • 对五种主流的 LLM 模型进行了评测

  • 大部分模型表现出 INTJ 性格特征

  • 不同模型的测试结果稳定性各异

从构想到实现,仅用 5 句话,耗时不足 30 分钟,在文心快码的支持下,我们成功开发出一个大模型 MBTI 测试器,旨在实现模型的自动化评估。以往需要几位同事共同协作、耗时数天才能完成的任务,现在一个人就能轻松搞定。尽管这个项目的代码量不小,但即使没有编程基础的人也能顺利完成开发。AI 编程工具现已不再是专业程序员的专属利器,而是提升日常工作效率的得力助手,帮助简化繁琐的流程,使得我们能将时间和精力投入到更具价值的方案设计和战略规划上。

来源:百家号
原文标题: 5 句话让文心快码实现一个大模型 MBTI 测试器
声明:
文章来自网络收集后经过 ai 改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2026-04-01发表,共计3757字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
评论(没有评论)
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!
0