共计 2861 个字符,预计需要花费 8 分钟才能阅读完成。
在 OpenAI 的众多产品中,最初推出且至今仍然免费的便是 ChatGPT3.5,这无疑是其最初吸引用户的最大亮点。
随着 GPT4 的发布并开始收费,ChatGPT3.5 的运营成本大幅降低,尤其是在许多地方推出了有限次数的 GPT4 使用权限后。亲身体验过 GPT4 的我,发现自己再也无法回到 GPT3.5,因此 OpenAI 选择继续提供 3.5 的免费版本,以此创造价格差异,吸引用户订阅每月 20 美元的 GPT4。坦白说,这笔会员费用对 OpenAI 而言并不算多,但至少对于投资者来说,证明了其盈利能力。
然而,从 GPT4 到 GPT4o 之间,整整半年时间里,GPT 系列并未更新。尽管 GPT3.5 在众多大型模型中依然表现出色,但这段时间内,许多类似的大型模型相继问世,并不断进化,其表现不亚于 GPT3.5。
例如,近期颇具人气的 Kimi AI,其免费的特性尤为突出,同时支持文件处理和联网服务。在中文场景下,其智能水平与 GPT3.5 相当,因此我在处理中文内容时,甚至选择了 Kimi 而非 GPT4。

由于这些功能,ChatGPT3.5 显然无法与之匹敌,只有每月支付 20 美元才能享受。

这是一个简单的权衡问题,ChatGPT3.5 的功能被其他产品替代,甚至更为出色,那为何还会继续留在 OpenAI 的平台呢?
至于 GPT-4o 免费使用的原因也在于,之前的差异不复存在,亟需创造新的差异化,尤其是在大型模型智能水平整体迅速提升的背景下,虽然 GPT4 实力强劲,但其地位能维持多久却难以预料。
因此,推出有条件的免费 GPT-4o,而这个条件是每日限制使用次数,实际上与之前的 ChatGPT3.5 无限使用并无太大区别,其他功能依然需要收费。
所以,解决方案只有两个:要么直接购买 OpenAI 的会员,每月 20 美元;要么拥有属于自己的大型模型。
幸运的是,现在有很多开源大型模型,我们只需进行简单的训练和微调,就可以获得自己的 AI 助手。例如,我们可以根据自己的编程习惯训练出的 AI 代理,效果显著且高效。
具体的训练思路是结合「开源大模型」与「领域知识」进行知识增强。详细的原理和训练方法,我强烈建议大家去听一门关于大模型技术的课程,尤其是开源模型训练的实际技术细节,值得认真学习!我已经为大家找到了入口,直接听就可以⬇️
在我的日常工作中,AI 大模型已经成为不可或缺的工具,无论是编写代码还是撰写注释,其效率和质量远超我的手动工作。特别是现在,任何与 AI 大模型相关的工作,其薪资往往高于普通岗位,这也激励我更加深入地学习!
当然,如果你不从事编程工作,也可以关注一些国内现成的 AI 工具:
文字类
对我而言,这类大型模型主要具备两个功能:阅读与写作。
阅读功能通常用于处理冗长的邮件或多篇论文。
我推荐两个 AI 工具:
1 Kimi Chat – 直接读取链接,获取文章内容
2 通义千问 – 超长上下文,检索精度极高。
Kimi Chat
Kimi Chat 的一个显著优点是可以直接读取链接或文件,使用体验极为流畅。
例如,当你想查看一篇新闻报道或公众号文章时,某些内容可能难以复制,甚至受到访问限制。
Kimi Chat 的优势在于,只需获取链接便可直接阅读,并且准确度相当高。

还有一个应用场景是处理 Arxiv 上的文章。

在很多情况下,我只想快速浏览一篇文章,看是否有价值,但即便是快速浏览,也需要花费几分钟,且可能无法看完整。
此时,我便可以让 Kimi Chat 来帮助我阅读。

这项功能非常便捷,且同样的逻辑适用于其他内容,比如你在公众号看到一篇很有价值的文章,由于篇幅过长,可以直接将链接交给 Kimi。

让它快速总结这篇文章,既迅速又相对准确。

通义千问
通义千问的最新版本已发布,引入了其核心升级:强大的上下文处理能力。
这一进展使得该平台能够轻松处理高达一千万字的中文文本,相当于同时阅读 20 部《三体》(每本约 50 万字)和 3 套《哈利·波特》全集。
这一功能对许多用户来说无疑是革命性的,尤其是面对那些篇幅极长的文档,如涉及复杂芯片架构的资料,通常超过数千甚至数万页,个人几乎无法完全阅读,最多只能作为查阅工具。然而,得益于大型模型与其强大记忆能力,处理长篇文本已不再是难题。
例如,通义千问能够针对特定术语提供全面解释,有效理解和分析长文。我曾测试过一份超过 300 页的人工智能报告,若亲自阅读需耗费数日。
比如说,我想了解该报告中关于 K12 教育的 AP 计算机科学考试性别比例,现在可以迅速获得答案。
这是我从通义千问中检索到的内容。值得注意的是,原文为英文,而我提问时使用中文,因此它的回答同样是中文,并且内容完全正确。

这就是长文上下文处理的优势,使得我们可以轻松获取所需信息。
多文件读取与理解
此次测试中,我们尝试同时读取多个文档,按照 1000 万字的处理能力,理论上可以轻松一次性读取 100 多个文档。这次我们在 arxiv 上根据关键词 LLM 找到最新的论文。

选择了最新的 15 篇并进行了下载,接下来读取这 15 篇文章。

可以看到,这 15 篇内容非常轻松地加载到了通义千问上。

并且我提出了一个需求,希望对这些文档进行分析。

操作依然流畅,可以轻松地将这些文章上传并进行处理。

这一特性在进行文件综述时尤为强大,通常撰写综述需要阅读多篇论文,几十篇的粗读很正常,上百篇也不是不可能。
运用这种方法,可以轻松完成繁琐的综述写作,这是一个非常有用的功能,特别适用于总结某些知识点。
音频类
通义听悟 – 免费的实时翻译软件

不多说,我来展示这个工具的效果,它可以轻松在播放英文视频时,实时给出中文字幕。

这个工具甚至能够区分不同说话者的声音,对于那些包含多方对话的视频非常实用,用户可以轻松完成摘录和记录。
例如,以下这个视频中有三位参与者:主持人、马斯克以及一位评论员,构成了一个精彩的对话场景。

我们能够将该视频下载,并选择适合的多人对话参数进行处理。

对于一个时长约 5 分钟的视频,翻译仅需 15 秒钟。

绘画相关
奇域 AI
奇域 AI 专注于中国风艺术,其作品展现出鲜明的传统文化特色。若你想创作与中国元素息息相关的艺术品,如刺绣、中式美学或皮影戏等,奇域 AI 无疑是一个极佳的选择。

此外,使用该工具也相当简单,只需输入提示词即可。

如果你在创意上受到限制,还可以浏览他人的作品,通过点赞即可看到他们使用的提示词。

libilibi
许多从事 AI 绘画的人都会熟悉 libilibi,这是一个基于 Stable Diffusion 的平台,提供了大量的绘画模板和技巧供用户分享。

最重要的是,注册后你可以免费在他人的创作基础上生成新的图像,还能使用该平台提供的免费计算资源。
不过,如果你想进行更高级的操作,比如训练 Lora 模型,就需要付费了。

