共计 2855 个字符,预计需要花费 8 分钟才能阅读完成。
首先,我们需要排除一个可能的误解:OpenAI 并没有突然变得慷慨。
在 OpenAI 推出的多款产品中,最早且至今仍然免费的便是 ChatGPT3.5,这也是其吸引用户的主要因素。
随着 GPT- 4 的发布并引入付费机制,ChatGPT3.5 的运营成本骤降。许多地方为用户提供了有限次数的 GPT- 4 使用机会。亲身体验过 GPT- 4 后,我发现很难再回到 ChatGPT3.5。因此,OpenAI 选择继续提供 3.5 的免费版本,以此通过价格差异吸引用户订阅每月 20 美元的 GPT-4。虽然这部分会员收入对于 OpenAI 而言并不算丰厚,但至少在投资者面前,证明了其盈利能力。
然而,从 GPT- 4 到 GPT-4o 之间,近半年的时间里,GPT 系列并未更新。即便 GPT-3.5 在大多数大型模型中仍具竞争力,但在这段时间内,许多新兴的大型模型不断涌现,并在性能上与 GPT-3.5 不相上下。
例如,近期备受瞩目的 Kimi AI,因其免费使用及支持文件处理和联网功能而备受欢迎。它在中文环境下的智能表现,与 GPT-3.5 相比并没有显著差距,因此我在处理中文内容时,曾选择用 Kimi 替代 GPT-4。

这些功能是 ChatGPT3.5 所不具备的,用户必须每月支付 20 美元才能享用。

因此,选择十分简单:若 ChatGPT3.5 的功能已经有更优的替代品,继续留在 OpenAI 平台的理由又在哪里呢?
同理,GPT-4o 免费也体现了相似的逻辑,既然过去的功能差异不再存在,就需要创造新的差异。尤其是在大型模型整体智能迅速提升的背景下,尽管 GPT- 4 依然强大,但它能维持这种地位的时间却令人难以预测。
因此,GPT-4o 被有条件地提供免费使用,但限制为每日仅几条。这与之前的 ChatGPT3.5 无限使用相比,实际上差别不大,依然是 3.5 可以畅享,而其他服务则要收费。
最终解决方案只有两个:要么直接购买 OpenAI 的会员,每月 20 美元,要么拥有一款独特的大型模型。
幸运的是,如今开源的大型模型层出不穷,我们只需简单的训练和微调,即可打造自己的 AI 助手。例如,针对个人编程习惯训练的 AI 代理,能够高效地完成工作,事半功倍。
具体的训练思路可归结为“开源大模型”与“领域知识”的结合,以实现知识的增强。对于想深入了解 AI 大模型的人,我强烈推荐参加相关课程,尤其是开源模型训练的技术细节,定能受益匪浅!我已经为大家提供了直接的学习入口,欢迎点击收听⬇️
在我的日常工作中,AI 大模型已成为不可或缺的工具,无论是编写代码还是注释,它的速度和质量都远超我的水平。如今,任何与 AI 大模型相关的工作,薪资普遍高于普通岗位,这也激励我不断深入学习!
当然,如果你并非程序员,也可以尝试国内现成的 AI 工具:
文字处理工具
对于我来说,这类大型模型主要具备两项功能:阅读和写作。
阅读主要是帮助我处理冗长的邮件或大量论文。
在这方面,我推荐两个 AI 工具:
1 Kimi Chat – 可以直接读取链接,快速获取文章内容
2 通义千问 – 超长上下文处理,检索精度极高。
Kimi Chat
Kimi Chat 具有直接从链接或文件中读取的功能,非常实用。
例如,当你想要了解某篇新闻报道或公众号文章时,往往面临复制困难或读取限制的问题。
Kimi Chat 的优势在于,只需提供链接,它便能直接读取,且准确度令人满意。

另一个常见场景是处理 Arxiv 上的文章。

很多时候,我只想快速浏览一篇长文,以确认其价值,这通常需要花费几分钟,且可能无法完整阅读。
此时,可以直接请 Kimi Chat 来帮忙。

这种方法非常有效,逻辑同样适用于其他内容。例如,如果你在微信公众号上发现一篇优秀文章,但因篇幅过长而难以阅读,可以将链接直接发送给 Kimi Chat。

让它为你总结文章内容,快速且相对准确。

通义千问
通义千问的新版本已经发布,加入了其核心升级:“地表最强”的上下文处理能力。
这一进展使得该平台能够轻松处理高达一千万字的中文文本,相当于同时阅读 20 部《三体》(每本约 50 万字)和 3 套《哈利·波特》全集。
这一功能无疑对许多用户而言具有革命性,尤其是在面对那些极长文档时,如涉及复杂芯片架构的资料,其篇幅通常超过数千甚至数万页,对个人而言几乎不可能完全阅读,最多只能作为查阅工具。然而,依靠大型模型与强大的记忆能力,处理长文本已不再是难题。
例如,通义千问能够针对特定关键术语提供详细解释,有效理解和分析长文。我曾测试过一份超过 300 页的人工智能报告,若亲自阅读则需耗费数日。
例如,我想查询该报告中关于 K12 教育的 AP 计算机科学考试的性别比例,现在能够迅速得到答案。
这就是原文中提到的内容。

我通过通义千问获取的信息完全正确,尽管我询问的是中文,而原文是英文。

这便是长文本上下文处理的优势,获取所需信息变得极为轻松。
多文档的读取与理解
我们这次测试能够同时读取多个文档,根据其 1000 万字的读取能力,理论上可以轻松读取超过 100 个文档。我们在 arxiv 上根据关键词 LLM 搜索了最新的论文。

我们选择了最新的 15 篇并下载下来,先读取这 15 篇文章。

可以看到,这 15 篇内容被轻松加载到通义千问中。

同时,我提出了一个需求:对这些文章进行分析。

过程依旧流畅,可以轻松上传并处理这些文章。

这一特性在进行文献综述时尤其强大,通常撰写综述需要阅读大量论文,几十篇粗读是常事,阅读上百篇也并非不可能。
这种方法令繁琐的文献综述变得轻松无比,对于总结某些知识点极为有用。
音频处理工具
通义听悟 – 免费的实时翻译软件

不多说,我来展示一下这个工具的效果。你只需播放一个英文视频,它便能流畅地实时提供中文字幕。

它甚至能够辨识出不同人的声音,这在涉及多人对话的视频中显得尤为实用,让你能够轻松进行摘录和记录。
例如,下面这个视频中就包含了三位参与者:主持人、马斯克以及一位评论员。

我们可以将视频下载,并选择适合多人对话的设置。

对于一个五分钟的视频,翻译仅需 15 秒即可完成。

绘画类
奇域 AI
奇域 AI 专注于中国风格的艺术创作,其绘制的作品展现了明显的中国文化特色。如果您想创作带有浓厚中国元素的作品,比如刺绣或中式美学等,奇域 AI 将是一个极佳的选择。

使用方法也非常简单,只需输入提示词即可。

如果您缺乏灵感,亦可参考他人的作品,只需点赞便能查看其他用户使用的提示词。

libilibi
这个平台相信许多 AI 绘画爱好者都耳熟能详,它是一个基于 stable diffusion 的创作平台,里面汇聚了大量的绘画模板和创作技巧。

最重要的是,您只需注册即可免费使用他人创作的基础作品,同时还可以利用该网站提供的免费计算资源。
当然,如果您想进行更高级的创作,比如训练 Lora,那就需要支付相应的费用了。

