共计 727 个字符,预计需要花费 2 分钟才能阅读完成。
在我们进行学术论文查询时,频繁访问或不干净的 IP 地址常常会触发“我是人类”的验证,要求我们证明自己不是机器人。然而,一些 AI 模型,例如 Gemini 的 Deep Research 功能,却能在短时间内进行大量论文搜索。作为机器人,它们是如何通过这些验证的呢?或者,它们是否有办法绕过这些验证?
另外,AI 是否能够访问那些需要付费订阅的学术期刊数据库中的论文呢?
答案是——大型语言模型(LLM)根本不需要输入验证码。这就像 普通人需要在大门口排队刷卡,而 AI 则可以直接走贵宾通道。原因主要有以下三点:
- 不通过“前端浏览器”进行访问
验证码的作用是防止爬虫和异常流量,而 Gemini 不会像人类一样在浏览器中不停点击网页。它查询论文的方式是通过调用后端的接口,因此验证码根本不会出现。 - 拥有“VIP 通行证”
大型公司与出版商及数据库之间常常有合作协议。Gemini 在查找论文时,通常会使用 Crossref、Semantic Scholar、arXiv 等 API,甚至直接通过出版社的授权接口进行访问。这对它而言,就如同机场的 VIP 通道,凭票和身份,不需经过安检和排长队。 - 关于付费论文的情况
AI 能够获取的信息主要是论文的标题、摘要和引用等这些公开信息。若想查看收费的全文,仍然需要进行订阅。AI 并没有“偷书”的特权。
来源:知乎
原文标题:AI 在通过大量网络搜索查找论文时是怎样通过学术期刊网站“我是人类”验证的?– 知乎
声明:
文章来自网络收集后经过 ai 改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完