文|讀懂財經(jīng)
曾經(jīng),很多人以為,ChatGPT的橫空出世,就幾乎等于敲響搜索的喪鐘。
這樣的說法在當時不在少數(shù)。按前谷歌第23位員工、Gmail的創(chuàng)建者之一Paul Buchheit的說法,ChatGPT將摧毀谷歌,就像當年搜索引擎徹底干掉黃頁電話簿一樣。
一年時間過去了,AI大模型替代搜索的進程,遠沒有大家想象的那般順利。但一切并非毫無意義。隨著Perplexity等AI搜索產(chǎn)品的涌現(xiàn),也讓我們對AI給搜索行業(yè)帶來的變化有了更加清晰的認識:
首先,與傳統(tǒng)搜索引擎相比,AI搜索讓信息的顆粒度從網(wǎng)頁細化到信息本身,進而提升了信息獲取的效率。這是AI搜索最大的價值。
其次,作為一款AI套殼產(chǎn)品,像Perplexity等產(chǎn)品的成功在于,實現(xiàn)了單點的價值創(chuàng)造和體驗優(yōu)化,更是一次AI工程化層面的勝利。
第三,像Perplexity這樣的AI搜索,目前更多集中在知識等小眾領域,距離替代谷歌成為通用搜索引擎仍然有很長的距離要走。
盡管當下AI搜索替代谷歌幾無可能,但長期并非毫無可能。從過去科技的演進看,新技術(shù)對老技術(shù)的替代,往往是以意想不到的顛覆形式完成的。正如誰能想到如今擁有上億用戶的快手,當初只是一個做GIF的工具。變化與未知,就是新技術(shù)的魅力。
01 比搜索更精準是如何做到的?
在AI搜索的賽道,Perplexity 是絕對的明星。公司創(chuàng)始人Aravind Srinivas來自OpenAI,2022 年 8 月創(chuàng)立了 Perplexity。2023年10月,公司完成了新一輪融資,估值達到 5 億美元。
與其說,Perplexity是一個搜索引擎,倒不如說是答案引擎。當用戶向Perplexity輸入問題并點擊搜索后,你能得到一個回答。比如,當你向Perplexity提問“蠟筆小新是誰”,會得到Perplexity的相應回答。
這個答案是通過網(wǎng)上已有的信息總結(jié)提煉而來。在回答欄目的上方,Perplexity還會給出參考內(nèi)容的來源,并支持點擊。在回答的下方,Perplexity預測了幾個用戶可能會追問的問題,點擊后頁面繼續(xù)向下展開對于該問題的答案,用戶也可以自行進行提問。
此外,在回答欄目的側(cè)邊,用戶還可以搜索相關(guān)主題的圖片和視頻。
Perplexity不僅能夠回答簡單問題,還能理解用戶一些比較復雜的問題,比如當用戶就“生成式AI與過去的AI相比有哪些不同和特點”進行提問時,Perplexity也能進行回答。
但不足的地方是,在“生成式AI與過去的AI相比有哪些不同和特點”問題來說,Perplexity推薦的視頻和主題關(guān)系并不大。也就是說,在復雜問題從文字向更多模態(tài)轉(zhuǎn)化過程中,搜索內(nèi)容的效率有比較大的下降。
看上去,AI搜索更像是傳統(tǒng)搜索引擎的一次升級,即從過去的單邊的信息查詢和SEO策略優(yōu)化,轉(zhuǎn)變成雙邊的信息交互。
過去的傳統(tǒng)搜索引擎的工作流程是,基于用戶搜索的內(nèi)容,對相關(guān)內(nèi)容進行索引并創(chuàng)建搜索索引,所謂的索引,可以理解為內(nèi)容過濾后,一個與搜索內(nèi)容有關(guān),且包含頁面及其內(nèi)容和排名信息的數(shù)據(jù)庫。然后再對索引中的頁面使用各種算法進行排名,進而給出搜索結(jié)果。
相比之下,Perplexity比搜索引擎額外多做了幾件事。在搜索前,Perplexity會通過大模型,重新理解用戶提出的問題,然后解析為一個更清晰的搜索指令。接下來,調(diào)用Google、Bing等搜索引擎的API創(chuàng)建相應的索引庫,然后用自有的排序算法,對所有的搜索結(jié)果做重新排序,篩選出數(shù)量不等且高質(zhì)量的網(wǎng)頁。最后,讓大模型閱讀篩選出來的內(nèi)容并輸出和問題相關(guān)的答案,以及可能用到的問題。
也就是說,相比搜索引擎做的是信息相關(guān)度的匹配,而Perplexity是在此基礎上做了更多理解指令上的工作,進而讓搜索結(jié)果更接近用戶想要的東西。
搜索效率升級的背后,是搜索顆粒度的細化。在互聯(lián)網(wǎng)時代,搜索引擎將信息以網(wǎng)頁為最小粒度為用戶進行排序和推薦。而大模型能夠?qū)W習所有 Google上能得到的信息,并將知識以詞匯為最小粒度生成相應的內(nèi)容。
02 Perplexity破局的啟示
聽起來,Perplexity所做的事情很簡單,就是在原有搜索引擎基礎上加入了大模型的自然語言理解和生成豐富回答能力。那么,是不是意味著所有大模型企業(yè)也可以做?
其實并非如此。曾經(jīng)在很多人看來,生成式 AI 可能會取代傳統(tǒng)搜索引擎,但用大模型直接進行搜索也會出現(xiàn)很多問題。
比方說,生成式AI無法做到實時更新,且受限于訓練數(shù)據(jù),可能無法覆蓋相對小眾、缺乏通用性的長尾知識。同時,生成式AI對生成內(nèi)容的可控性較差,存在“幻覺”問題,用戶也難以對答案進行直接驗證。
Perplexity所做的事情就是,把這些大模型搜索過程中出現(xiàn)的“坑”一個個都填掉,其中最重要的事情就是信息的實時性和準確性。
實時性方面,與ChatGPT等大模型依賴訓練時的數(shù)據(jù)和語料獲取信息不同,Perplexity基于底層傳統(tǒng)搜索引擎開發(fā)而得,能夠及時抓取最新的信息。
準確性方面,Perplexity做了兩件事情:減輕幻覺和內(nèi)容溯源。為了減少幻覺現(xiàn)象,Perplexity引入了RAG技術(shù)(檢索增強生成),RAG的作用好比是給模型提供一本教科書,讓它根據(jù)特定的問題去查找信息,通過關(guān)聯(lián)外部知識來提高答案的準確性,有效減少了語言模型中出現(xiàn)的虛假信息,使得生成的回答更準確可信。
與此同時,Perplexity還對生成的每一句話都附有引用鏈接,在保證可靠性的同時便于用戶溯源或深入研究。
不僅如此,Perplexity還對召回和排序環(huán)節(jié)的算法做了創(chuàng)新,保證內(nèi)容的有用性及引用的精確程度。其中,“召回”指根據(jù)搜索指令從數(shù)據(jù)庫中獲取盡可能多的正確結(jié)果,“排序”指根據(jù)用戶搜索內(nèi)容的相關(guān)性對召回結(jié)果進行排序,決定了搜索引擎的精確程度和性能上限。
來源:中金研究部
這也讓Perplexity成為當下綜合性能最好的AI搜索引擎。在2023年4月的論文中,斯坦福的研究人員對YouChat、Perplexity.AI、NeevaAI及BingChat四個生成式搜索引擎進行了人工評估。結(jié)果顯示,Perplexity.ai生成內(nèi)容有用性的評分為4.56分,排名第二;引文召回率和精確度為68.7,排名第一;在泛搜索引擎類的體驗中,綜合能力位于最前列。
除了在信息準確、可靠上,Perplexity在響應速度上也花了很多功夫。比如,Perplexity通過自研推理堆棧,讓其內(nèi)容生成速度快于GPT類通用模型。在模型側(cè),公司對GPT-3.5進行微調(diào),在降低成本的同時進一步提升響應速度。
Perplexity的成功,也給了那些苦苦探索AI大模型落地的創(chuàng)業(yè)者一些啟示:比起模型能力,產(chǎn)品本身單點的價值創(chuàng)造和體驗的優(yōu)化,是一個更為重要的事情。
03 替代谷歌言之過早
從數(shù)據(jù)上看,自產(chǎn)品發(fā)布以來,Perplexity的成績著實不錯。
根據(jù)Similar Web數(shù)據(jù),截至2023年10月25日,Perplexity APP的日度下載量為14,163次;2023年2月1日至10月25日,Perplexity網(wǎng)頁端的周度訪問量由275萬增加至1,113萬,增長3倍,與同類別的AI搜索應用YouChat相比增長勢頭強勁。
盡管Perplexity的表現(xiàn)足夠優(yōu)秀,但距離真正替代谷歌等傳統(tǒng)搜索引擎還有很長的距離。從定位上看,當下的Perplexity更像一個知識平臺,用戶對其需求大都集中在知識領域,定位類似于AI時代的Wikipedia 和 Quora。
從Perplexity后續(xù)的更新動作上,也不難看出這一點。比如,Perplexity正在嘗試以知識分享為核心,創(chuàng)建相關(guān)的內(nèi)容社群生態(tài),Perplexity支持用戶將搜索問題及答案分享至社區(qū),供其他用戶學習討論。
之所以Perplexity選擇以知識平臺為切入點,主要基于兩點考慮:
一是RAG技術(shù)更擅長在開放域知識問答及生成式問答中發(fā)揮作用。Meta的技術(shù)論文對RAG技術(shù)進行了詳細測評,包括開放域問答、開放域問題生成、抽取式問答及分類推理任務。在開放域問答中,RAG-Token和RAG-Seq得分處于領先地位;在生成任務和分類任務中,RAG表現(xiàn)優(yōu)于BART模型。
二是谷歌在消費、地圖上積累了大量的數(shù)據(jù),這讓Perplexity在生活/購物等更高頻的場景沒有任何優(yōu)勢,很難實現(xiàn)場景的泛化。
以知識平臺為目標,固然讓Perplexity找到了差異化的方向。但同時也意味著,Perplexity短期內(nèi)很難成為一款低門檻的大眾化互聯(lián)網(wǎng)產(chǎn)品,至于替代谷歌更是無從談起。
不僅如此,與大多數(shù)AI創(chuàng)業(yè)公司一樣,Perplexity并沒有形成可持續(xù)的商業(yè)模式。目前,Perplexity的變現(xiàn)方式主要有兩個:會員訂閱和API調(diào)用,但尚未形成規(guī)?;杖?。
雖然收入沒起來,但支出卻一點都不少。根據(jù)中金測算,目前Perplexity調(diào)用Bing搜索引擎及GPT-4的單個問題成本約為0.03美元,年成本約為6000萬美元,這還不包括后續(xù)Perplexity自研模型所產(chǎn)生的成本。
從過去看,搜索向來是個馬太效應極其明顯的市場。盡管用戶對百度詬病頗多,也不影響百度在中國搜索引擎的市占率超過7成。如果用當下的視角理解產(chǎn)品技術(shù)演進的結(jié)果,Perplexity似乎沒有任何機會。
但這事好就好在,新技術(shù)對老技術(shù)的替代,往往是以顛覆的形式出現(xiàn)的,甚至老玩家固有的“習慣”還會成為其迭代的最大障礙。就拿搜索這事來說,AI搜索直接給出關(guān)鍵信息的交互方向,天然與谷歌現(xiàn)有競價排名的商業(yè)模式相背離。
如何取舍對谷歌來說是一個難題,而對Perplexity來說則是一個機會。從這個角度來說,Perplexity替代谷歌固然言之過早,但也未必沒有可能。