在OpenAI的下一個(gè)主要方向上創(chuàng)業(yè),前哈佛計(jì)算機(jī)教授獲硅谷頂級(jí)VC投資
編者按:本文來(lái)自微信公眾號(hào) 阿爾法公社(ID:alphastartups),微新創(chuàng)想經(jīng)授權(quán)轉(zhuǎn)載
什么是目前生成式AI最火的應(yīng)用形態(tài)?可能是各種Copilot,各種類ChatGPT的服務(wù),而AI Agent也肯定是其中之一。
OpenAI聯(lián)合創(chuàng)始人Andrej Karpathy曾在Twitter上表示:“提示工程(prompt engineering)的下一個(gè)前沿是AutoGPT(Agent)”
在亞馬遜云的Amazon Bedrock平臺(tái)發(fā)布會(huì)上,最閃亮的產(chǎn)品是Amazon Bedrock Agents,開發(fā)者可以基于它輕松創(chuàng)建各種生成式AI應(yīng)用,來(lái)完成復(fù)雜任務(wù)。
那AI Agent是什么?可以把它理解成能自主理解、規(guī)劃、執(zhí)行復(fù)雜任務(wù)的人工智能系統(tǒng)。AI Agent可以在沒有人類控制的情況下獨(dú)立運(yùn)行,通過接入API,AI Agent甚至可以瀏覽網(wǎng)頁(yè)、使用應(yīng)用程序、讀寫文件、使用信用卡付款等。
一家叫Fixie的初創(chuàng)公司在AI Agent領(lǐng)域頗有建樹。它由連續(xù)創(chuàng)業(yè)者,前哈佛計(jì)算機(jī)教授創(chuàng)立,在今年早些時(shí)候獲得了Redpoint領(lǐng)投,Madrona Venture和來(lái)自Google、Amazon和Apple等公司的現(xiàn)任和前任高管參與的1700萬(wàn)美元種子輪融資。
前哈佛教授與谷歌、蘋果專家組團(tuán)創(chuàng)業(yè),硅谷頂級(jí)投資機(jī)構(gòu)追著投
Fixie由來(lái)自Google和Apple的資深工程師、產(chǎn)品負(fù)責(zé)人和AI專家創(chuàng)立。它的主要?jiǎng)?chuàng)始人Matt Welsh(現(xiàn)擔(dān)任首席架構(gòu)師)是連續(xù)創(chuàng)業(yè)者,曾是哈佛大學(xué)計(jì)算機(jī)教授,也在Google和Apple擔(dān)任過技術(shù)主管。
Fixie的其他幾位聯(lián)合創(chuàng)始人,CEO Zach Koch曾是Shopify的產(chǎn)品總監(jiān)并在Google的Chrome和Android團(tuán)隊(duì)擔(dān)任過產(chǎn)品負(fù)責(zé)人;CTO Justin Uberti曾是Google的Stadia、Duo和Hangouts Video團(tuán)隊(duì)負(fù)責(zé)人,也是WebRTC的發(fā)明者之一;首席AI科學(xué)家Hessam Bagherinezhad曾是Apple的AI/ML領(lǐng)導(dǎo)者,整個(gè)創(chuàng)始團(tuán)隊(duì)可謂相當(dāng)豪華。
Fixie的創(chuàng)始人們認(rèn)為大語(yǔ)言模型的價(jià)值不僅僅是補(bǔ)全文本,它真正的用武之地是鏈接外部API和數(shù)據(jù)源,進(jìn)入企業(yè)的業(yè)務(wù)流程并自動(dòng)化解決問題。
Fixie是一個(gè)基于云的平臺(tái),開發(fā)者不僅可以在這個(gè)平臺(tái)上構(gòu)建與外部系統(tǒng)、數(shù)據(jù)和工具互動(dòng)的Agent,F(xiàn)ixie還會(huì)幫助開發(fā)者解決API接入和數(shù)據(jù)托管等一系列問題。
Madrona是第三次投資Matt Welsh參與創(chuàng)立的企業(yè)(前兩次是Xnor和OctoML),它們認(rèn)為Fixie的團(tuán)隊(duì)具有樂觀主義,對(duì)客戶的深度理解和關(guān)懷,而且有超高的人才密度。
Redpoint的董事總經(jīng)理Erica Brescia表示:“現(xiàn)有的大語(yǔ)言模型非常強(qiáng)大,而且不斷地進(jìn)化,但它真正產(chǎn)生價(jià)值的地方是與企業(yè)內(nèi)部數(shù)據(jù)和系統(tǒng)結(jié)合起來(lái),從根本上改善企業(yè)的運(yùn)營(yíng)方式。Fixie將真正做到這一點(diǎn)—自動(dòng)化手動(dòng)工作,讓人們專注于更高價(jià)值的任務(wù)。
我們相信Fixie將成為構(gòu)建基于大模型的應(yīng)用程序的標(biāo)準(zhǔn),這些應(yīng)用程序?qū)⒋龠M(jìn)企業(yè)中每個(gè)角色的工作流程—最終解鎖巨大的生產(chǎn)力增長(zhǎng)。”
搭建一個(gè)人人都可以構(gòu)建Agent的平臺(tái),GPT-4、開源模型隨便選
AI Agent可以做到很多復(fù)雜的任務(wù),而且對(duì)于開發(fā)者,構(gòu)建一個(gè)單獨(dú)的Agent并不算困難,但是對(duì)于企業(yè),他們需要一種方式來(lái)定義、構(gòu)建、測(cè)試、部署、共享、保護(hù)、管理和監(jiān)控他們的Agent。
Fixie的創(chuàng)立就是為了幫助企業(yè)應(yīng)用開發(fā)者克服這些挑戰(zhàn)。Fixie平臺(tái)是一個(gè)基于云的PaaS服務(wù),企業(yè)應(yīng)用開發(fā)者可以輕松地創(chuàng)建在這個(gè)平臺(tái)上構(gòu)建基于各種大模型的Agent,這些Agent可以回答關(guān)于私有數(shù)據(jù)源的問題,從歷史客戶支持對(duì)話中獲取信息,以及通過傳統(tǒng)API與現(xiàn)有的企業(yè)資源進(jìn)行交互。這個(gè)平臺(tái)開源了它的SDK和示例代碼,開發(fā)者可以在Fixie的GitHub Repo上獲取。
Agent的內(nèi)在原理
大模型具有通過示例學(xué)習(xí)新技能的能力,術(shù)語(yǔ)叫做少示例學(xué)習(xí)(Few-shot learning),通過少示例學(xué)習(xí),開發(fā)者只要提供一些如何執(zhí)行新任務(wù)的示例(例如發(fā)電子郵件、操作商用軟件、聯(lián)網(wǎng)),大模型就可以學(xué)會(huì)這些任務(wù)。
一個(gè)單獨(dú)的Agent由一個(gè)基礎(chǔ)提示、一組少示例和quote函數(shù)組成。基礎(chǔ)提示為提示底層大語(yǔ)言模型如何與外部世界互動(dòng)設(shè)定了舞臺(tái);少示例通過示例教導(dǎo)大語(yǔ)言模型如何處理傳入的查詢,向quote函數(shù)尋求幫助,以及如何將返回值融入其回復(fù)。
Fixie平臺(tái)的價(jià)值在哪里?
Fixie內(nèi)置了超過30個(gè)Agent,它們可以訪問各種系統(tǒng)和工具,包括數(shù)據(jù)庫(kù)、復(fù)雜的API(如GitHub)、生產(chǎn)力工具(如Google Calendar)以及Web搜索和Twitter等公共數(shù)據(jù)源。Fixie Agent SDK使構(gòu)建自己的Agent變得非常簡(jiǎn)單,Agent構(gòu)建好后,可以一鍵部署到云端,開發(fā)者也可以構(gòu)建他們自己的Agent并提供給別人使用。之后,平臺(tái)的功能還將進(jìn)一步擴(kuò)展。
在Fixie平臺(tái),每個(gè)Agent都可以使用自定義的大模型,除了默認(rèn)支持的GPT-4外,還可以與商用或開源模型集成,包括AI21的Jurassic-2、GPT-NeoX或Cohere的Command。Agent可以生成和處理任意模態(tài)的媒體,比如使用Stable Diffusion生成圖像并以各種方式操作它們。
Fixie對(duì)于ChatGPT的插件系統(tǒng)也有比較好的支持:用戶可以構(gòu)建一個(gè)調(diào)用ChatGPT插件的Fixie Agent,或構(gòu)建一個(gè)調(diào)用Fixi Agent的ChatGPT插件。
Agent的使用示例
企業(yè)客戶可以將Fixie構(gòu)建的Agent用到客戶支持、業(yè)務(wù)自動(dòng)化、業(yè)務(wù)智能、內(nèi)容生成、CRM自動(dòng)化等領(lǐng)域。
例如,使用Fixie,企業(yè)客戶可以構(gòu)建一個(gè)Agent,將客戶票據(jù)作為輸入,并將查找客戶的訂單歷史、發(fā)出退貨標(biāo)簽和生成票據(jù)的草稿回復(fù)的過程自動(dòng)化。
Fixie提供了核心平臺(tái),企業(yè)客戶可以非常輕松地構(gòu)建與平臺(tái)集成的,私有的高度定制代理。而不是使用垂直集成的“客戶票據(jù)AI”產(chǎn)品,使用Fixie,企業(yè)客戶可以自定義大模型與其私有的數(shù)據(jù)和系統(tǒng)的每個(gè)方面的集成。
Fixie此前舉辦了一次黑客馬拉松,在這次活動(dòng)上,有團(tuán)隊(duì)構(gòu)建了一個(gè)電子郵件助理Agent,它可以幫助用戶的Gmail收件箱進(jìn)行排序并生成寫新電子郵件的提示,用戶可以根據(jù)提示輕松的寫好新郵件。
另一個(gè)參賽者構(gòu)建了一個(gè)電影場(chǎng)景的Agent,這個(gè)Agent可以與Spotify API結(jié)合進(jìn)行搜索,根據(jù)電影場(chǎng)景的文本描述找到電影中的特定歌曲。還有一個(gè)參賽團(tuán)隊(duì)構(gòu)建了基于YouTube,為用戶推薦特定主題的Agent。
OpenAI將Agent視為下一個(gè)主要方向,那創(chuàng)業(yè)公司還有機(jī)會(huì)么?
Agent代表了構(gòu)建軟件的基礎(chǔ)性轉(zhuǎn)變,它是一種新的軟件形態(tài)。以前的大型軟件,每一個(gè)功能都需要投入不少研發(fā)力量去開發(fā)維護(hù),而一個(gè)Agent,只要它的基礎(chǔ)大模型能力升級(jí),或者花較少的成本把模型進(jìn)行微調(diào),能力就可以迭代升級(jí)。
開發(fā)者可以構(gòu)建一個(gè)Agent解決一個(gè)單點(diǎn)問題,也可以用幾個(gè)Agent組合起來(lái)協(xié)作解決更復(fù)雜的問題。
對(duì)于創(chuàng)業(yè)者,可以構(gòu)建單個(gè)的Agent并不斷迭代,例如BabyAGI,也可以像Fixie一樣構(gòu)建一個(gè)平臺(tái),讓企業(yè)和開發(fā)者可以自由的開發(fā)Agent。
在文章一開頭,我們就提到了亞馬遜云對(duì)Agent的重視和投入,那么,面對(duì)科技巨頭,創(chuàng)業(yè)者在這個(gè)方向還有機(jī)會(huì)么?
先說(shuō)一個(gè)”壞消息“,生成式AI的領(lǐng)頭羊OpenAI對(duì)Agent也十分重視。
“如果一篇論文提出了某種不同的模型訓(xùn)練方法,OpenAI內(nèi)部會(huì)嗤之以鼻,認(rèn)為都是我們玩剩下的。但是當(dāng)新的AI Agents論文出來(lái)的時(shí)候,我們會(huì)十分認(rèn)真且興奮地討論。” OpenAI聯(lián)合創(chuàng)始人Andrej Karpathy在一次OpenAI的黑客馬拉松上發(fā)表觀點(diǎn)。
OpenAI聯(lián)合創(chuàng)始人兼CEO Sam Altman也曾在多個(gè)場(chǎng)合表示,構(gòu)建龐大AI模型的時(shí)代已經(jīng)結(jié)束,AI Agent才是挑戰(zhàn)。
外媒《The Information》指出,Sam Altman曾在5月私下告訴部分開發(fā)者,OpenAI希望將ChatGPT打造成個(gè)人工作助手,并有知情人士指出,OpenAI一直在關(guān)注如何使用聊天機(jī)器人來(lái)創(chuàng)建自主的AI Agent,相關(guān)功能很有可能部署在ChatGPT中。
那么好消息是,在同一場(chǎng)黑客馬拉松上,Andrej Karpathy還說(shuō)了這樣的話:”普通人、創(chuàng)業(yè)者和極客在構(gòu)建AI Agent方面相比OpenAI這樣的公司更有優(yōu)勢(shì)。“
盡管有業(yè)內(nèi)專家表示,想要實(shí)現(xiàn)可用的AI Agent,還需要大幅提高大模型的能力,但是能夠找到適合Agent的應(yīng)用場(chǎng)景,有創(chuàng)新能力創(chuàng)業(yè)者,顯然應(yīng)該行動(dòng)起來(lái)了。
本文為專欄作者授權(quán)微新創(chuàng)想發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表微新創(chuàng)想立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問,請(qǐng)聯(lián)系http://www.i0562.net/。