在OpenAI的下一個主要方向上創業,前哈佛計算機教授獲硅谷頂級VC投資
編者按:本文來自微信公眾號 阿爾法公社(ID:alphastartups),微新創想經授權轉載
什么是目前生成式AI最火的應用形態?可能是各種Copilot,各種類ChatGPT的服務,而AI Agent也肯定是其中之一。
OpenAI聯合創始人Andrej Karpathy曾在Twitter上表示:“提示工程(prompt engineering)的下一個前沿是AutoGPT(Agent)”
在亞馬遜云的Amazon Bedrock平臺發布會上,最閃亮的產品是Amazon Bedrock Agents,開發者可以基于它輕松創建各種生成式AI應用,來完成復雜任務。
那AI Agent是什么?可以把它理解成能自主理解、規劃、執行復雜任務的人工智能系統。AI Agent可以在沒有人類控制的情況下獨立運行,通過接入API,AI Agent甚至可以瀏覽網頁、使用應用程序、讀寫文件、使用信用卡付款等。
一家叫Fixie的初創公司在AI Agent領域頗有建樹。它由連續創業者,前哈佛計算機教授創立,在今年早些時候獲得了Redpoint領投,Madrona Venture和來自Google、Amazon和Apple等公司的現任和前任高管參與的1700萬美元種子輪融資。
前哈佛教授與谷歌、蘋果專家組團創業,硅谷頂級投資機構追著投
Fixie由來自Google和Apple的資深工程師、產品負責人和AI專家創立。它的主要創始人Matt Welsh(現擔任首席架構師)是連續創業者,曾是哈佛大學計算機教授,也在Google和Apple擔任過技術主管。
Fixie的其他幾位聯合創始人,CEO Zach Koch曾是Shopify的產品總監并在Google的Chrome和Android團隊擔任過產品負責人;CTO Justin Uberti曾是Google的Stadia、Duo和Hangouts Video團隊負責人,也是WebRTC的發明者之一;首席AI科學家Hessam Bagherinezhad曾是Apple的AI/ML領導者,整個創始團隊可謂相當豪華。
Fixie的創始人們認為大語言模型的價值不僅僅是補全文本,它真正的用武之地是鏈接外部API和數據源,進入企業的業務流程并自動化解決問題。
Fixie是一個基于云的平臺,開發者不僅可以在這個平臺上構建與外部系統、數據和工具互動的Agent,Fixie還會幫助開發者解決API接入和數據托管等一系列問題。
Madrona是第三次投資Matt Welsh參與創立的企業(前兩次是Xnor和OctoML),它們認為Fixie的團隊具有樂觀主義,對客戶的深度理解和關懷,而且有超高的人才密度。
Redpoint的董事總經理Erica Brescia表示:“現有的大語言模型非常強大,而且不斷地進化,但它真正產生價值的地方是與企業內部數據和系統結合起來,從根本上改善企業的運營方式。Fixie將真正做到這一點—自動化手動工作,讓人們專注于更高價值的任務。
我們相信Fixie將成為構建基于大模型的應用程序的標準,這些應用程序將促進企業中每個角色的工作流程—最終解鎖巨大的生產力增長。”
搭建一個人人都可以構建Agent的平臺,GPT-4、開源模型隨便選
AI Agent可以做到很多復雜的任務,而且對于開發者,構建一個單獨的Agent并不算困難,但是對于企業,他們需要一種方式來定義、構建、測試、部署、共享、保護、管理和監控他們的Agent。
Fixie的創立就是為了幫助企業應用開發者克服這些挑戰。Fixie平臺是一個基于云的PaaS服務,企業應用開發者可以輕松地創建在這個平臺上構建基于各種大模型的Agent,這些Agent可以回答關于私有數據源的問題,從歷史客戶支持對話中獲取信息,以及通過傳統API與現有的企業資源進行交互。這個平臺開源了它的SDK和示例代碼,開發者可以在Fixie的GitHub Repo上獲取。
Agent的內在原理
大模型具有通過示例學習新技能的能力,術語叫做少示例學習(Few-shot learning),通過少示例學習,開發者只要提供一些如何執行新任務的示例(例如發電子郵件、操作商用軟件、聯網),大模型就可以學會這些任務。
一個單獨的Agent由一個基礎提示、一組少示例和quote函數組成。基礎提示為提示底層大語言模型如何與外部世界互動設定了舞臺;少示例通過示例教導大語言模型如何處理傳入的查詢,向quote函數尋求幫助,以及如何將返回值融入其回復。
Fixie平臺的價值在哪里?
Fixie內置了超過30個Agent,它們可以訪問各種系統和工具,包括數據庫、復雜的API(如GitHub)、生產力工具(如Google Calendar)以及Web搜索和Twitter等公共數據源。Fixie Agent SDK使構建自己的Agent變得非常簡單,Agent構建好后,可以一鍵部署到云端,開發者也可以構建他們自己的Agent并提供給別人使用。之后,平臺的功能還將進一步擴展。
在Fixie平臺,每個Agent都可以使用自定義的大模型,除了默認支持的GPT-4外,還可以與商用或開源模型集成,包括AI21的Jurassic-2、GPT-NeoX或Cohere的Command。Agent可以生成和處理任意模態的媒體,比如使用Stable Diffusion生成圖像并以各種方式操作它們。
Fixie對于ChatGPT的插件系統也有比較好的支持:用戶可以構建一個調用ChatGPT插件的Fixie Agent,或構建一個調用Fixi Agent的ChatGPT插件。
Agent的使用示例
企業客戶可以將Fixie構建的Agent用到客戶支持、業務自動化、業務智能、內容生成、CRM自動化等領域。
例如,使用Fixie,企業客戶可以構建一個Agent,將客戶票據作為輸入,并將查找客戶的訂單歷史、發出退貨標簽和生成票據的草稿回復的過程自動化。
Fixie提供了核心平臺,企業客戶可以非常輕松地構建與平臺集成的,私有的高度定制代理。而不是使用垂直集成的“客戶票據AI”產品,使用Fixie,企業客戶可以自定義大模型與其私有的數據和系統的每個方面的集成。
Fixie此前舉辦了一次黑客馬拉松,在這次活動上,有團隊構建了一個電子郵件助理Agent,它可以幫助用戶的Gmail收件箱進行排序并生成寫新電子郵件的提示,用戶可以根據提示輕松的寫好新郵件。
另一個參賽者構建了一個電影場景的Agent,這個Agent可以與Spotify API結合進行搜索,根據電影場景的文本描述找到電影中的特定歌曲。還有一個參賽團隊構建了基于YouTube,為用戶推薦特定主題的Agent。
OpenAI將Agent視為下一個主要方向,那創業公司還有機會么?
Agent代表了構建軟件的基礎性轉變,它是一種新的軟件形態。以前的大型軟件,每一個功能都需要投入不少研發力量去開發維護,而一個Agent,只要它的基礎大模型能力升級,或者花較少的成本把模型進行微調,能力就可以迭代升級。
開發者可以構建一個Agent解決一個單點問題,也可以用幾個Agent組合起來協作解決更復雜的問題。
對于創業者,可以構建單個的Agent并不斷迭代,例如BabyAGI,也可以像Fixie一樣構建一個平臺,讓企業和開發者可以自由的開發Agent。
在文章一開頭,我們就提到了亞馬遜云對Agent的重視和投入,那么,面對科技巨頭,創業者在這個方向還有機會么?
先說一個”壞消息“,生成式AI的領頭羊OpenAI對Agent也十分重視。
“如果一篇論文提出了某種不同的模型訓練方法,OpenAI內部會嗤之以鼻,認為都是我們玩剩下的。但是當新的AI Agents論文出來的時候,我們會十分認真且興奮地討論。” OpenAI聯合創始人Andrej Karpathy在一次OpenAI的黑客馬拉松上發表觀點。
OpenAI聯合創始人兼CEO Sam Altman也曾在多個場合表示,構建龐大AI模型的時代已經結束,AI Agent才是挑戰。
外媒《The Information》指出,Sam Altman曾在5月私下告訴部分開發者,OpenAI希望將ChatGPT打造成個人工作助手,并有知情人士指出,OpenAI一直在關注如何使用聊天機器人來創建自主的AI Agent,相關功能很有可能部署在ChatGPT中。
那么好消息是,在同一場黑客馬拉松上,Andrej Karpathy還說了這樣的話:”普通人、創業者和極客在構建AI Agent方面相比OpenAI這樣的公司更有優勢。“
盡管有業內專家表示,想要實現可用的AI Agent,還需要大幅提高大模型的能力,但是能夠找到適合Agent的應用場景,有創新能力創業者,顯然應該行動起來了。
本文為專欄作者授權微新創想發表,版權歸原作者所有。文章系作者個人觀點,不代表微新創想立場,轉載請聯系原作者。如有任何疑問,請聯系http://www.i0562.net/。