AI搜索，革了的旧引擎的命吗

寂静回声 · 发表于 2024-8-3 14:41:10

肯定不能，现在人们用百度搜索用的少是百度自己的作死，不是因为网页搜索不行。
毫无疑问，2024年最热门的科技赛道，AI搜索一定是排名靠前的。自2022年末的生成式AI大爆炸以来，这条赛道就一直络绎不绝，人满为患。
7月25日，曾经跳票过的OpenAI终于宣布开放自家AI搜索引擎SearchGPT的内测。
而仅在国内，近一个月就有两个新玩家涌入。6月30日，知乎宣布推出AI搜索产品「知乎直答」，宣称要探索提问的全新形态，帮助用户“用提问发现世界”；7月10日，阿里旗下的夸克也推出了AI搜索，主打一个“能搜索、能创作、能总结的超级搜索框”概念。
加上之前已经入局的秘塔AI搜索、KIMI、360AI搜索、昆仑万维的天工AI、Genspark等等，AI搜索进入战国时代。
事实上，AI搜索听起来高精尖，但是门槛并不高，不仅大厂和初创企业染指，连个人开发者也能挤进来。

据报道，阿里前高管贾扬清用500行代码就写了一个AI搜索引擎；独立开发者「艾逗笔」花了一个周末就写了AI搜索ThinkAny，三个月时间做到了月访问量60万。
但这么低的门槛，钱景却无限。进入2024年，此中翘楚Perplexity的估值连连跳涨，从1月份的5亿美元，暴增到30亿美元。

业内最早布局AI搜索的微软必应，从去年二月推出New Bing以来，到2024年1月整整一年的时间，Bing的全球市场份额从2.81％上升到3.43％，增长只有0.62％。AI没帮到一点，一开始紧张不已的谷歌，也松了一口气。
投资了秘塔AI搜索的猎豹移动董事长傅盛在一次专访中坦言，“只要大厂不犯重大错误，大搜索格局上，很难有大的变化。”
傅盛的断言并非信口开河。AI搜索至少要越过三个坎——足够高的准确性、足够低的成本和足够成熟的商业模式，才能勉强跟传统搜索引擎掰掰手腕。
目前，我们所说的AI搜索主要有三类产品形态。一类是具备检索增强生成（RAG）能力的聊天机器人，比如ChatGPT、文心一言、Kimi等。
第二类是专门做 AI 搜索的产品，有搜索框和搜索详情页，比如 Perplexity、秘塔AI搜索。
还有一类是将传统搜索和AI结合在一起，主要形式是在搜索结果页首条加上AI生成的答案，比如谷歌的AI Overview和百度的AI智能回答。
今年5月，谷歌推出了自家的AI Overviews，也就是在谷歌搜索结果页的首条，展现由谷歌大语言模型Gemini生成的答案。
但刚推出就翻车了，网友发现谷歌的AI答案常常不着边际。
网友问披萨上的芝士容易脱落怎么办，谷歌AI的回答是“要加上八分之一杯的胶水”；网友问每天应该吃多少石头时，谷歌AI给出建议“每天至少吃一块小石头”；网友表示自己心情沮丧，谷歌AI建议从金门大桥上跳下去。
不靠谱的AI答案立刻引起了媒体的群嘲，下面的截图展现了各大媒体疯狂吐槽的热闹景象。
即便是强如OpenAI，也堵不住SearchGPT的胡说八道。官方演示视频里，在回答某音乐节的相关问题时，SearchGPT给出了错误的购票日期，OpenAI官方已承认了这个错误，并表示“这只是初始的原型，我们会不断改进。”
业界领头羊尚且如此，国内众多AI搜索更不用说。往往只需要略施小计，就能让AI搜索犯错。
《真故研究室》在测试天工AI搜索时中，故意把美国畅销小说作家史蒂芬・金的国籍说成英国，天工AI便不假思索给史蒂芬・金办了移民。
而昆仑万维董事长兼CEO方汉就在前不久的一次访谈中直言不讳称：“我认为 AI 搜索首先是没有幻觉问题的，因为从技术原理上来说，它是先搜索再总结，然后再通过智能体去处理。在这个流程过程中，我们从源头杜绝了这个欺诈的问题。”
但是，他旗下的天工AI搜索，却在显著位置标注了“内容由AI生成，不能保证真实”的字样。
AI搜索的很多错误，有的很明显，但最糟糕的是有的深埋在文案中，防不胜防。
《真故研究室》在百度上随意搜了一个词条，看似没有问题，但AI答案说梅西获得了七次金球奖，事实上梅西2023年获得了第八座金球奖。
AI搜索界的头号种子选手 Perplexity，胡说八道的概率也不低。在《真故研究室》提出的一个问题里，它连普通人百度一下就能搜到的百度财报数据也无法提供。
美国科技杂志《连线》（Wired）也进行了测试，也发现Perplexity是说谎惯犯。记者临时新建了一个网页，上面只有一句话「我是《连线》杂志记者」，然后让Perplexity总结网页内容。结果Perplexity“脑洞大开”，直接编了一个童话故事。此外，针对各类新闻事件，Perplexity也常常张冠李戴无中生有，比如让一名加州警察蒙冤犯了罪，给人物编造直接引语等等。
统计学的结果，也与经验相吻合。一篇论文发现，AI搜索看上去富含信息量，但常常掺杂没有论据的观点和不正确的引用。在Perplexity等AI搜索中，AI生成的论点，仅有51.5％有参考链接支持，援引的参考链接，只有74.5％支持其论点。
也就是说，AI搜索结果的正确性，充其量也就5到7成而已。你搜索十次，可能有五次的结果都有问题。这么高的错误率，让人不得不挨个点击链接，复查结果的准确性。但我既然都要一个个点开链接了，跟传统的搜索又有什么区别呢。
这一点上我在使用文心一言时就发现它生成的回答里面有所谓的从哪篇文章的参考，但是在那篇文章里根本就没有它生成内容，也就是说它说是参考，就是瞎忽悠。

AI搜索产生的错误，在业内被称为“幻觉”。幻觉是大语言模型的劣根性，就像说谎是男人的劣根性，甚至有学者和业内人士悲观地表示，或许大模型永远也解决不了幻觉问题。
这与大语言模型的原理有关，大模型并不理解人类和事物，它的核心运行法则是通过预测下一个字词的出现概率而生成文本。
直白点说，大模型就是台概率机器，并不关注真相或事实，本质上是一只模仿能力极强的鹦鹉，可以模仿人类的说话方式，但并不理解人类说的是什么。
正如知识计算引擎Wolfram Alpha的主要设计师、科学家斯蒂芬・沃尔夫拉姆所言，大语言模型本质上是就文本生成“合理的延续”，所谓“合理”是指，“人们在看到诸如数十亿个网页上的内容后，可能期待别人会这样写”，而不是事实，就像很多人只是想活成别人期待的样子，但那并不一定是真实的自己。
为了解决大模型“幻觉”，AI搜索引入了检索增强生成（Retrieval-augmented Generation，简称RAG）技术：在回答问题之前，先从网络或资料库检索相关信息，然后结合检索到的信息生成文本，提高内容的准确性。
这样的手段确实可以一定程度上减轻大语言模型的幻觉，但效果并没有传说中的那么好。比如有研究发现，即使是接入了计算引擎 Wolfram Alpha，ChatGPT的数学能力也只是稍微增强，出错依然是常态；ChatGPT在使用接入了医学资料库后，还是常常捏造信息。
从某种程度上，RAG反而增加了人类辨别真伪的难度。接入数据库，只是让大模型看起来更专业，模仿得更像数据库里的内容。
RAG加持的AI搜索，还面临一个要命的问题，无法辨别信源的优劣真伪。
谷歌的AI Overviews之所以出现这么多啼笑皆非的答案，一部分原因就是分不清来源的真假，比如谷歌AI让网友用胶水涂在披萨上的建议，就是从10多年前美国贴吧Reddit上的一则评论学来的，那条评论显然是在开玩笑。
不仅无法判定真伪，AI搜索甚至无法判定信息源是不是AI内容。
有人做了一个实验，从Perplexity的推荐条目、旅游、科技AI三个领域各抽取五条搜索提示词，每次输入搜索提示词后，就点击“相关推荐”栏的内容，直到参考链接里出现AI文章为止。结果是：在科技AI领域，只需要一次搜索就准能碰到参考链接出现AI文章，其他两类普遍也是在1到3次就会出现引用AI文章的情况。
用AI文章，生成AI答案，AI形成了自产自销的内容闭环。《福布斯》杂志不客气地将这种现象称为“垃圾进，垃圾出”（Garbage In, Garbage Out）。

谷歌母公司Alphabet的董事会主席约翰・轩尼诗在去年初表示，大语言模型每一次互动的成本可能比传统搜索要高10倍。
摩根士丹利的分析师估计，如果AI为谷歌50%的搜索关键词生成50字的答案，每年可能会让谷歌多付出60亿美元的成本。
有数据显示，传统搜索的成本是0.2美分左右。OpenAI的CEO山姆·阿尔特曼2022年底曾在社交网站X上透露，ChatGPT平均每次对话的计算成本在10美分以内。也有数据表明，AI搜索成本介于3至30美分之间。
成本高是谷歌和百度在AI搜索上步子不敢迈得太大的原因之一，另一个原因是传统搜索引擎赚钱太容易了，轻易不敢让商业化前景并不明朗的AI搜索，影响主业的收入。
搜索引擎带来的广告收入始终是两大搜索巨头的主要收入来源。广告占谷歌总收入的一半以上；近年来迟迟没找到第二曲线的百度则更高，2024年第一季度的在线营销（基本可等同于搜索引擎广告）收入占其核心收入达71%。
所以，谷歌直到今年5月才正式在搜索中加入生成式AI，起初官宣的范围是15％的搜索结果，但到了7月，下降到了7％。
大洋这一侧的百度也差不多，虽然在2023年的百度世界大会上，李彦宏高调喊出“百度新搜索”，但实际落地则保守很多。
“百度新搜索”并没有在百度APP中大规模上线。可能是为了配合老板的PR，百度业务部门只在旗下的“简单搜索”App上推出了完整功能。
“简单搜索”是无广告版百度搜索，使用量级很小，除了大会宣传期外，“简单搜索”鲜少出现在百度的官方传播物料里。
这说明，在没有找到合适的商业化路径之前，百度不敢破釜沉舟，砸掉自己本就日益缩小的饭碗。因此，百度的AI搜索，也主要是在搜索结果的首条加入生成式AI。
近期百度还推出了聊天模式的AI助手，但只是作为百度搜索的补充，在不破坏基本的商业模式下，有限地尝试。
在今年一季度的财报电话会上，李彦宏表示：“大约11%的搜索结果是利用生成式人工智能技术来推算的，但我们目前还没有对这部分生成式人工智能的结果进行商业变现，所以相关营收的对应增长要等一段时间。”

传统的搜索引擎是台印钞机，商业模式简单却高效，搜索引擎通过关键词，列出一条条网站链接，网站通过用户的点击获得流量收入，搜索引擎通过展示广告赚钱，双方互相成就。
但AI搜索打破了这个利益链条。借用Perplexity的官方话术，AI搜索与其说是“搜索引擎”，不如说是“答案引擎”，是“维基百科和ChatGPT生的孩子”，免去了点开链接的烦恼，直接生成答案，把饭喂到用户嘴边。原本站在C位的链接们，只能作为注脚，出现在不起眼的角落里。大部分链接甚至连注脚也挤不进去。
答案引擎只给答案，而不是列出链接，相当于把所有的流量截留在自己的界面。用户是方便了，但那些靠搜索引擎流量过活的网站，一下子被断了生路。
但AI搜索生成的内容，却恰恰来自被剥夺了流量的网站。你用着我的内容，还夺走了我的流量，这谁受得了。
据报道，美国已经有88％的顶尖新闻机构禁止AI爬虫爬取网站内容。美国贴吧Reddit，已经在加强措施限制各类大模型的爬虫爬取自己的公开内容。
对于AI搜索，他们也是加倍防范。《福布斯》、《连线》等新闻机构发现，Perplexity在搜索的时候，会偷偷绕过付费墙，抓取只有付费会员才能看到的内容，而且还剽窃记者辛辛苦苦花了几个月写成的文章。
Perplexity这种违反了无视网络爬虫排除标准（Robots Exclusion Protocol）的行为，引发了多家媒体机构的不满。《福布斯》已经向Perplexity发函，要求Perplexity删除相关内容，并赔偿福布斯损失的收益。

AI搜索打破了网站与搜索引擎之间的互惠互利，但还未建立新的商业模式。
AI搜索商业化的艰难，还体现在整个市场的变化上。投资者从OpenAI刚刚推出的兴奋，慢慢回归冷静，甚至开始失去耐心。
高盛收集了一波可能因AI而受益的公司股票，组成股票指数，发现自2022年底以来，这些公司的股价并没有跑赢标普500指数。这说明整个投资市场，并没有太看好AI的商业前景。
所以，现在AI搜索能否取代还言之过早。事实上，很多业内人士都认为，两者的关系是互补，而非取代。
AI搜索更容易满足在特定细分领域的搜索需求，比如知识类的分析与调查。而很多搜索行为，并不只是为了研究“第二次世界大战爆发的原因”，可能只是想通过搜索去另一个网址，或者获得两三句话就能讲清楚的简单信息，不需要附着十几条参考链接的长篇大论，在这些方面，传统引擎显然更合适。

		自动登录	找回密码
密码			立即注册

AI搜索，革了的旧引擎的命吗

本帖子中包含更多资源