引言

距离《AI 搜索,一次讲透》文章发布已经快一个月了,AI 搜索赛道依然火热,各款产品都在努力优化,时间到了6月,非常好奇各款产品表现如何,就准备帮助读者测一测。

本来准备狠狠测几轮的,结果第一个Query刚测完,结果就已经高下立判。

本文将如实记录这一轮的AI搜索测试,并在未来的第二轮中剔除明显水平很差的选手,节省精力和时间。

本文不是权威测试,只是为了个人日常选择AI搜索所做的辅助选择。为了中立客观,本文对所有的搜索结果进行了截图保存。

本文没有接受任何赞助,不接受任何的删帖请求,但接受开放地交流讨论,请大家心态平稳,实事求是。

本轮入围选手

国际巨头白月光,4家, Perplexity、OpenAI ChatGPT、Google Gemini、Microsoft Bing Copilot

国内大模型厂商,8家,月之暗面 Kimi、字节跳动 豆包、MiniMax 海螺、智谱 Chatglm、01万物 万知、腾讯 元宝、百度 文心一言、百川智能 百小应

国内AI搜索应用,3家,昆仑万维 天工AI、360 AI 搜索、秘塔 AI 搜索。

AI搜索创业团队,1家,ThinkAny

入围说明:

  1. 这里有一半是AI助理,并非单纯的AI搜索,因为本质上AI搜索是一个很基本的功能,而且技术上来说也是一套,所以放在一起测试没有任何问题。而且AI助理的搜索结果未必就比专业的AI搜索差。
  2. 有些品牌有更好的选择,比如 Google 的搜索和Gemini其实是两款产品,百度的搜索和文心一言也是两款产品,但是因为灰度等原因,我无法触发AI搜索,所以就用他们的助理代替。
  3. 排除了 devv.ai 等特别垂类的搜索,因为对于通用Query,垂类搜索和通用搜索相比明显弱势。

本轮的测试方法

Query 选择的原则:

  1. Query 所对应的答案应该具备一定的实时性,答案不在大模型本身的知识库里,必须通过搜索才能获得答案
  2. Query 所对应的是一个特定人群的需求,因为没有一个人可以代表另一个人群,这里选择我自己所属的典型人群,AI早期接受者,我认为这个人群和AI搜索的目标人群是高度重合的