3300萬美元把公司賣給Salesforce,轉(zhuǎn)身拿著這筆錢天使投資HuggingFace,現(xiàn)在又想挑戰(zhàn)Google的搜索引擎!
編者按:本文來自微信公眾號(hào) 有新Newin(ID:NewinData),作者: 有新,微新創(chuàng)想經(jīng)授權(quán)轉(zhuǎn)載。
今天為大家?guī)?You.com 背后的創(chuàng)始人故事與思考:
-
囤了24年的頂級(jí)域名
-
從 LLMs 到搜索2.0
-
You 的產(chǎn)品組合與商業(yè)化
-
如何看待應(yīng)用層的含金量?
enjoy ??~
01囤了 24年的頂級(jí)域名
1996 年,時(shí)任甲骨文銷售高級(jí) VP 的 Marc Benioff 正在夏威夷的海灘上放假,他突然意識(shí)到了互聯(lián)網(wǎng)即將發(fā)生的大事,網(wǎng)絡(luò)世界將會(huì)成為現(xiàn)實(shí)的鏡像他思考了數(shù)字孿生的概念并思考著什么東西會(huì)出現(xiàn)在互聯(lián)網(wǎng)上,于是他開始購買域名,搶購數(shù)字世界的一小片土地以構(gòu)建未來。
在 Marc Benioff 當(dāng)時(shí)購買的域名中就有 You.com;在 1996~2020 年間,Benioff 一直持有這個(gè)域名,直到他找到了這個(gè)域名的繼任者 —— Richard Socher。
2003 年,Socher 剛開始在萊比錫大學(xué)學(xué)習(xí)計(jì)算機(jī)科學(xué),而后輾轉(zhuǎn)計(jì)算機(jī)視覺并獲得碩士學(xué)位,其中涉及了更多統(tǒng)計(jì)和模式識(shí)別、統(tǒng)計(jì)學(xué)習(xí)的內(nèi)容,隨后受到深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺的啟發(fā),開始探索在自然語言領(lǐng)域的應(yīng)用,最終為 Socher 在大模型領(lǐng)域的發(fā)展奠定了基礎(chǔ)。
2014 年,Marc Benioff 和 Richard Socher 相遇,當(dāng)時(shí) Socher 剛在斯坦福大學(xué)完成博士學(xué)位,并在那里開創(chuàng)教授了一種計(jì)算機(jī)理解自然語言的新方法,神經(jīng)網(wǎng)絡(luò)在理解 Facebook 照片以及將文本從英文翻譯成中文等方面引起了不小的關(guān)注,但還不能理解語言的含義,Socher 的研究證明了神經(jīng)網(wǎng)絡(luò)通過上下文和詞匯間關(guān)系建模可以解決這些問題,這也為 Socher 贏得了在普林斯頓大學(xué)工作的機(jī)會(huì),不過學(xué)術(shù)界終究是沒待太久,最終 Socher 決定通過創(chuàng)業(yè)繼續(xù)自己的研究。
Socher 當(dāng)時(shí)創(chuàng)辦了一家名為 MetaMind 的公司,通過神經(jīng)網(wǎng)絡(luò)來為其他公司執(zhí)行任務(wù),從輿情分析再到醫(yī)學(xué)檢測(cè),這項(xiàng)技術(shù)設(shè)計(jì)的非常簡(jiǎn)單,不需要開發(fā)人員就可以使用,如果想要執(zhí)行復(fù)雜的機(jī)器學(xué)習(xí)任務(wù),只需要提出問題就可以了,Socher 在 2015 年的采訪中表示 MetaMind 和搜索引擎的區(qū)別是前者給出了答案,后者只返回了一堆鏈接。
這項(xiàng)技術(shù)在當(dāng)時(shí)吸引到了 OpenAI 的第一位風(fēng)險(xiǎn)投資人旗下的 Khosla Venture 以及 Marc Benioff 的注意,兩方共同投資了 MetaMind 800 萬美元的種子資金,Richard Socher 從 CEO 轉(zhuǎn)任 CTO。
2016 年,這家公司被 Salesforce 以 3300 萬美元收購,成了今天 Salesforce Einstein ,用于幫助銷售人員跟蹤銷售機(jī)會(huì);以及 Wave(現(xiàn)稱為 Einstein Analytics)、Salesforce 的基于云的分析軟件等產(chǎn)品。
Socher 也因此加入 Salesforce 擔(dān)任首席科學(xué)家,與此同時(shí),Socher 身為斯坦福大學(xué)兼職教授的索切爾先生提倡一種以研究為導(dǎo)向的文化,強(qiáng)調(diào)發(fā)表研究論文;根據(jù) Salesforce 統(tǒng)計(jì),在 Socher 領(lǐng)導(dǎo)下的 17 個(gè)月內(nèi),Salesforce Research 發(fā)表了 20 篇研究論文。因此,Socher 的加入為 Salesforce 培養(yǎng)了大批 AI 人才。
在 Salesforce 時(shí)期,大公司內(nèi)部的成熟管理模式帶給 Socher 良好的市場(chǎng)營銷和更好管理經(jīng)驗(yàn),這讓 Socher 意識(shí)到隨著公司的成長(zhǎng),設(shè)立專門的研究團(tuán)隊(duì)是有道理的,現(xiàn)有的公司以此有更大的概率把握未來的科技發(fā)展方向,并在某些情況下,實(shí)現(xiàn)這些預(yù)見,而對(duì)于一個(gè)小型創(chuàng)業(yè)公司,則可能過于奢侈,創(chuàng)業(yè)公司需要更多的關(guān)注如何“活在當(dāng)下”你必須在相對(duì)短的時(shí)間內(nèi)推出一些可以交付的產(chǎn)品。
同時(shí),Benioff 不僅扮演著 Socher 的老板,更是一位創(chuàng)業(yè)導(dǎo)師,這讓 Socher 學(xué)會(huì)譬如在一些重大決策時(shí),需要多聽取意見等經(jīng)驗(yàn)教訓(xùn),在 Socher 看來 Benioff 打造了一家了不起的公司,他不僅關(guān)心客戶,也關(guān)心整個(gè)地球、生態(tài)系統(tǒng)、當(dāng)?shù)貙W(xué)校、環(huán)境等等方方面面。
隨著當(dāng)初公司被收購,Socher 也因此獲得了大量現(xiàn)金,一邊是買了一塊價(jià)值 300 萬美元的牧場(chǎng)開始享受生活,一邊則是做起了天使投資,包括他于 2015 年在斯坦福大學(xué)教授 CS224 學(xué)生們所創(chuàng)辦的項(xiàng)目,其中之一就有我們熟知的 HuggingFace,當(dāng)時(shí) Julien Chaumond 通過這項(xiàng)課程的學(xué)習(xí)小組和朋友 Thomas Wolf 在 2017 年 3 月創(chuàng)立了 HuggingFace,而 Socher 通過 Wolf 接觸了這個(gè)項(xiàng)目并在 2018 年 5 月投資了種子資金,而上月底 HuggingFace 剛完成 D 輪融資,估值已經(jīng)達(dá)到了 45 億美元。
02從 LLMs 到搜索2.0
一直以來,Socher 都是單一大模型的支持者,今天 You 在這方面也取得了一些進(jìn)展,但是在兩三年前,市場(chǎng)主流的觀點(diǎn)仍然還停留在每個(gè)任務(wù)都需要建立獨(dú)立模型,比如那時(shí)會(huì)有一個(gè)情感分析模型分析推文積極或者消極,摘要模型進(jìn)行摘要,翻譯模型進(jìn)行翻譯,問答模型完成問答,Socher 認(rèn)為大模型的訓(xùn)練應(yīng)該像維基百科一樣,通過人們不斷的增加內(nèi)容,將這個(gè)詞典變得更好,而不是每個(gè)相邀構(gòu)建詞典的人都從頭開始構(gòu)建詞典公司。
之所以當(dāng)時(shí)的學(xué)術(shù)界和工業(yè)界都認(rèn)為需要獨(dú)立的模型去完成不同的任務(wù),而不是由一個(gè)統(tǒng)一的大模型去完成,原因在于這中間需要讓 LLMs 來融入世界知識(shí),還需要具有注意力機(jī)制、更快的 GPU 和硬件等多種因素平衡才能讓模型正常工作,而在 10~20 年前市場(chǎng)上只有非常小的模型時(shí),要實(shí)現(xiàn)今天的效果幾乎是不可能的。
2020 年,已經(jīng)在 NLP 領(lǐng)域工作了十年的 Socher 依然有個(gè)想法困擾著他,也就是目前仍然沒有看到有人將 AI 應(yīng)用到有史以來最大的商業(yè)模式 ——“在線搜索”中,于是 Socher 拉來了在 Salesforce 的伙伴 Bryan McCann 一起創(chuàng)辦新項(xiàng)目,當(dāng) Benioff 看到了 Socher 遞來的辭職信,失望的同時(shí)也知道擋是擋不住了,不如順?biāo)饲椋贿吿统隽俗约翰亓?24 年的頂流域名 You.com ,另一邊在 2021 年領(lǐng)投了 You.com 的種子輪。
2022 年,You 當(dāng)時(shí)的用戶規(guī)模達(dá)到數(shù)十萬,當(dāng)年 6 月份的注冊(cè)量就達(dá)到 70% 的增速,而獨(dú)立搜索量則每月增長(zhǎng) 30%,雖然和 Google 以及 Bing 之類的頂級(jí)搜索引擎相比猶如小巫見大巫,不過 Socher 在早期非常在意用戶的留存情況,而將 You 設(shè)置為默認(rèn)搜索引擎的人中有 50% 的用戶仍然會(huì)繼續(xù)使用。
今年上半年在 Google 匆忙的完成發(fā)布會(huì)后,Socher 表示 Google 以及 Bing 這類傳統(tǒng)搜索引擎領(lǐng)域的主要參與者正在面臨典型的創(chuàng)新者窘境,拿 Google 來說,其通過用戶的隱私在搜索結(jié)果頁面展示更多廣告,每年賺取 1500 億美元,Google 每年還要像 Apple 支付 150 億美元作為默認(rèn)搜索引擎的費(fèi)用,這足矣說明其壟斷地位。
Sicher 認(rèn)為生成式 AI 的出現(xiàn)并不等于帶來更多的盈利,而是會(huì)減少廣告的展示次數(shù),比如原先一個(gè)頁面 6 個(gè)廣告,現(xiàn)在用戶只會(huì)看 1 個(gè)廣告,相當(dāng)于每天減少 5 億美元的收入,用戶并不想看到那么多廣告,但實(shí)際上會(huì)看到一堆帶有廣告的 SEO 網(wǎng)站,對(duì)于通過廣告變現(xiàn)的搜索引擎來說,微軟也差不多,只不過這塊業(yè)務(wù)占比并不大,微軟也愿意保持一定虧損來換取更好的市場(chǎng)份額,而融入新的 AI 功能則可以換取更大的市場(chǎng)份額。
當(dāng)被媒體問及如何看待生成式 AI 在搜索領(lǐng)域的商業(yè)化時(shí),Socher 認(rèn)為在聊天中添加個(gè)性化的廣告,就像是 DuckDuckGo 可能做的事情,這取決于用戶的 Query,今天我們看到有很多網(wǎng)友沉浸在 reddit、tiktok 以及 chatgpt 上,這說明用戶依然在找一些其他內(nèi)容,但這些內(nèi)容和渠道并不足以替代 Google 這樣的搜索引擎,這就是為什么 Socher 覺得 You 會(huì)有機(jī)會(huì),試想一下當(dāng)一個(gè)聊天機(jī)器人只給你答案,而不是將流量分配給個(gè)人、雜志或者出版商時(shí)會(huì)發(fā)生什么?Socher 認(rèn)為的搜索2.0 將是這些內(nèi)容提供方在搜索引擎上有一個(gè)類似“應(yīng)用”的位置,當(dāng)用戶喜歡它,它就會(huì)在聊天中不斷出現(xiàn)。
03You 的產(chǎn)品組合與商業(yè)化
You.com 除了搜索引擎,也提供其它的工具和服務(wù),類似 OpenAI,你還能看到 You 版的寫作工具、圖像生成工具、代碼生成工具以及開放平臺(tái)等方面:
-
搜索功能
You.com 的搜索引擎從微軟 Bing 獲取搜索結(jié)果,同時(shí)也擁有自己的網(wǎng)絡(luò)爬蟲,被稱為 YouBot,用戶可以通過插件設(shè)置 You.com 為默認(rèn)的搜索引擎,并在搜索結(jié)果頁面上獲取相關(guān)信息;
-
YouChat 聊天工具
YouChat 是一款由人工智能驅(qū)動(dòng)的會(huì)話式搜索助手。它能夠回答問題、提出想法、翻譯文本、總結(jié)文章、撰寫電子郵件和編寫代碼片段,可以與其他平臺(tái)(如 Reddit、TikTok、Stack Overflow 和 Wikipedia)結(jié)合使用;
-
YouWrite 寫作工具
YouWrite 是一款A(yù)I寫作工具,旨在幫助作家、作者和博客作者克服寫作障礙,提高寫作技能。它可以幫助創(chuàng)建各種類型的書面內(nèi)容,如電子郵件、博客文章、小說、散文和社交媒體帖子,YouWrite 使用 OpenAI 的 GPT 語言模型,根據(jù)文本類型、目標(biāo)受眾和所需音調(diào)等信息生成內(nèi)容;
-
YouImagine 圖像生成工具
YouImagine 通過AI生成圖像,使用穩(wěn)定擴(kuò)散等技術(shù),允許用戶使用文本描述來生成AI生成的圖像;
-
YouCode 代碼生成工具
YouCode 類似于編程資源網(wǎng)站,如 Stack Overflow 和 GitHub,它為開發(fā)人員提供搜索功能,可以找到編碼問題的解決方案、生成代碼片段、訪問相關(guān)文檔和學(xué)術(shù)出版物等;
-
OnePlatform 開放平臺(tái)
You.com 的開放搜索平臺(tái)允許其他人創(chuàng)建定制應(yīng)用程序,稱為“搜索應(yīng)用”,來定制搜索結(jié)果頁面的體驗(yàn);用戶可以通過點(diǎn)贊或點(diǎn)踩影響應(yīng)用程序的排名,并可以阻止某些應(yīng)用程序出現(xiàn)在搜索結(jié)果中。該平臺(tái)目前提供了 200 多個(gè)第一方應(yīng)用程序,可以在搜索結(jié)果頁面上獲取摘要信息或完成任務(wù)。
對(duì)于開放平臺(tái),Socher 希望長(zhǎng)遠(yuǎn)來說有更多優(yōu)質(zhì)的第三方貢獻(xiàn)應(yīng)用以及內(nèi)容,如果用戶從應(yīng)用或者內(nèi)容中提取了好的上下文,且 You 能夠商業(yè)化,那么這部分利潤也可以與應(yīng)用或者內(nèi)容提供商共享。
這也是 You 比較有意思的地方,它實(shí)際也是一個(gè)社交媒體搜索引擎,畢竟 Google 和Bing 都沒有提供能夠抓取世界上最受歡迎的社交網(wǎng)站的搜索類別,而You 融合了 TikTok、Twitter、Facebook、Instagram、Reddit、YouTube、Quora、Twitch 上的內(nèi)容,你可能會(huì)找到更多最新信息。
對(duì)于想要體驗(yàn) You 的用戶來說,你需要在 You.com 上創(chuàng)建賬戶,AI 會(huì)根據(jù)你的使用偏好改進(jìn)搜索結(jié)果,將信息減少到最相關(guān),而不同于傳統(tǒng)的搜索引擎想要讓你不斷刷內(nèi)容看廣告,而 You 上的搜索結(jié)果會(huì)以“應(yīng)用”的形式呈現(xiàn),主打讓用戶可以一目了然的找到答案,或者直接從結(jié)果中完成下一步的操作。
You.com 目前的收入主要來自三個(gè)方面:
-
推廣鏈接(Affiliate Links):You.com 通過引入用戶點(diǎn)擊特定鏈接并購買商品的方式獲取收入,當(dāng)用戶通過 You.com 的搜索結(jié)果點(diǎn)擊某個(gè)商品鏈接并最終購買該商品時(shí),You.com 可以獲得與該銷售額相關(guān)的傭金。這種盈利模式是通過推動(dòng)用戶購買來賺取傭金的方式;
-
SaaS訂閱:You.com 提供一個(gè)可選的月度訂閱計(jì)劃,用戶可以選擇支付訂閱費(fèi)用來獲得其提供的寫作工具,這意味著用戶可以付費(fèi)使用特定的寫作工具,從而為公司帶來穩(wěn)定的收入來源;
-
廣告展示:You.com 通過在搜索結(jié)果頁面上展示例如沃爾瑪?shù)膹V告,從中獲取一部分廣告費(fèi)用作為收入,這種模式類似于在用戶的購物搜索結(jié)果中顯示廣告,從中獲得收益;
04如何看待應(yīng)用層的含金量?
生成式 AI 的應(yīng)用層含金量有多少?Socher 認(rèn)為確實(shí)存在一些價(jià)值很薄的公司,幾乎沒有護(hù)城河,但實(shí)際上又有很多人并不了解建立一個(gè)可行的業(yè)務(wù)所需要的整體要素有哪些,某些情況下這容易被低估。
Socher 以 Instagram 舉了個(gè)例子,Instagram 的護(hù)城河是什么?顯然不是 Instagram 的 AI 和軟件工程有多厲害,如果按今天生成式 AI 的邏輯去套,可能小扎連 LLMs 都沒加上, 看起來只是一個(gè)簡(jiǎn)單的照片分享軟件,然后帶了一些濾鏡功能,而實(shí)際上 Instagram 的護(hù)城河在 AI Infra 之外,它有強(qiáng)大的分發(fā)、合伙伙伴以及渠道等等。
Socher 認(rèn)為 LLMs 就像你的大嘴巴叔叔,它記不得你所有的往事和細(xì)節(jié),有時(shí)候還會(huì)夸大其詞,所以你需要給“他”提供更客觀、更新的事實(shí),以便“他”對(duì)正確的事情進(jìn)行推理,雖然 You 的搜索引擎用到了 Bing 的搜索結(jié)果,其它工具用到了 GPT 的 API,但說是完全套殼且價(jià)值很薄,Socher 認(rèn)為這么想就太膚淺了
站在一家創(chuàng)業(yè)公司的角度,Socher 表示在 LLMs 出現(xiàn)以前,創(chuàng)業(yè)公司是無法構(gòu)建一個(gè)可以理解多種不同語言的搜索引擎的,而現(xiàn)在基于市場(chǎng)上的 LLMs 已經(jīng)可以快速構(gòu)建 80% 的解決方案,然后在 MVP 的基礎(chǔ)上添加更多的功能。
Socher 認(rèn)為在某種程度上 LLMs 可以視為數(shù)據(jù)庫,用哪種數(shù)據(jù)庫都可以,這個(gè)不是最主要的,關(guān)鍵是如何使用數(shù)據(jù)庫,如何調(diào)優(yōu),如何對(duì)訓(xùn)練數(shù)據(jù)微調(diào),如何檢索事實(shí)并對(duì)所有這些事進(jìn)行合理的推理,如何多次思考得出結(jié)論,這些過程中的細(xì)節(jié)會(huì)越來越重要。
因此,在 Socher 看來,在不同模型之間切換,更重要的是如何整合多個(gè)不同的模型,比如有的基礎(chǔ)模型適合處理自然語言表述,有的垂直模型適合財(cái)務(wù)預(yù)測(cè),關(guān)鍵是如何讓這些模型絲滑配合,在該問的場(chǎng)景給到用戶匹配的結(jié)果,目前 You 也在用不同模型廠商提供的模型,但在生產(chǎn)中也會(huì)用自己的 LLMs,所以并沒有哪家模型廠商占據(jù)主導(dǎo)地位。
對(duì)于 AGI 方面的看法,Socher 認(rèn)為目前人們的擔(dān)心過多了,從本質(zhì)上講,目前的 AI 僅限于如何預(yù)測(cè)下一個(gè) token,但是一個(gè)智能體要被認(rèn)為是智能,它需要有自己的目標(biāo),而我們今天能看到的“智能”,如果不能在一個(gè)人類社會(huì)框架之中,為企業(yè)帶來效益,為政府帶來更好的經(jīng)濟(jì),那么就沒有人會(huì)去想這些事情,就更沒有人來讓 AI 設(shè)定自己的目標(biāo)
對(duì)于 AI 的未來,Socher 比較樂觀,比較有趣的觀點(diǎn)是 AI 對(duì)許多工作會(huì)有實(shí)質(zhì)性的影響,隨著更多的工作數(shù)字化和自動(dòng)化,物理任務(wù)會(huì)越來越貴,比如建造房屋的木工成本會(huì)越來越高,這會(huì)成為新的瓶頸。
本文為專欄作者授權(quán)微新創(chuàng)想發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表微新創(chuàng)想立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問,請(qǐng)聯(lián)系http://www.i0562.net/。