連獲硅谷頂級(jí)VC兩輪融資,Replicate指數(shù)級(jí)降低AI模型部署和使用成本
連續(xù)創(chuàng)業(yè)者與資深人工智能專(zhuān)家聯(lián)手,讓普通軟件工程師也能玩轉(zhuǎn)大模型
編者按:本文來(lái)自微信公眾號(hào) 阿爾法公社(ID:alphastartups),作者:阿爾法公社,微新創(chuàng)想經(jīng)授權(quán)發(fā)布。
上周,Meta發(fā)布了大語(yǔ)言模型Llama 2,它的能力相比前作增長(zhǎng)不少,但其最大的意義在于開(kāi)源和開(kāi)放商用,這讓有志于在自己業(yè)務(wù)中使用生成式AI能力的創(chuàng)業(yè)者們節(jié)省了99%的大語(yǔ)言模型訓(xùn)練算力時(shí)長(zhǎng)成本。他們只需花費(fèi)1%的算力時(shí)長(zhǎng),就可以在開(kāi)源可商用的大語(yǔ)言模型上微調(diào)出符合自己行業(yè)需求的模型。這從根本上降低了大模型創(chuàng)業(yè)的準(zhǔn)入門(mén)檻。
在生成式AI創(chuàng)業(yè)從基礎(chǔ)大模型轉(zhuǎn)向垂直應(yīng)用的趨勢(shì)下,有不少創(chuàng)業(yè)公司致力于幫助應(yīng)用側(cè)的客戶(hù)和用戶(hù)以盡量低的成本使用大語(yǔ)言模型的能力,Replicate就是這個(gè)方向上的一家典型公司。它打造了一個(gè)開(kāi)源的AI模型托管云平臺(tái),幫助中小企業(yè)實(shí)現(xiàn)模型的快速交付,用戶(hù)可以在平臺(tái)上部署,微調(diào)AI模型,還能根據(jù)業(yè)務(wù)量快速擴(kuò)展自己的模型。
Replicate在2023年2月和7月分別完成了兩輪融資,2月,它獲得由a16z領(lǐng)投的1250萬(wàn)美元A輪融資,7月,又獲得3200萬(wàn)美元的新融資(投資者未披露),它的其他投資者還包括紅杉資本,Y Combinator以及Andrej Karpathy(OpenAI科學(xué)家),Richard Socher(You.com創(chuàng)始人),Solomon Hykes(Docker創(chuàng)始人),Thomas Dohmke(GitHub CEO)等,可以看出,這家公司受到了硅谷頂級(jí)投資機(jī)構(gòu)和企業(yè)家們的集體青睞。
連續(xù)創(chuàng)業(yè)者與資深人工智能專(zhuān)家聯(lián)手,讓普通軟件工程師也能玩轉(zhuǎn)大模型
在計(jì)算領(lǐng)域,其實(shí)很少有新的基礎(chǔ)構(gòu)件,應(yīng)用程序本質(zhì)上都是網(wǎng)絡(luò)、存儲(chǔ)和計(jì)算的某種組合。但是像Stable Diffusion和ChatGPT這樣的視覺(jué)或語(yǔ)言大模型卻真的代表了一個(gè)全新的基礎(chǔ)構(gòu)件。將這些大模型整合到軟件中,開(kāi)發(fā)者可以實(shí)現(xiàn)包括文本,視覺(jué),語(yǔ)音等多模態(tài)內(nèi)容的生成,這在以前是不能實(shí)現(xiàn)的。這種轉(zhuǎn)變的級(jí)別不僅是將軟件從PC轉(zhuǎn)移到移動(dòng)設(shè)備(iPhone帶來(lái)的轉(zhuǎn)變),而是代表一種全新類(lèi)型的軟件。
大模型的能力毋庸置疑的強(qiáng)大,但是普通軟件開(kāi)發(fā)者將AI大規(guī)模運(yùn)行到生產(chǎn)環(huán)境中時(shí),仍面臨一系列難題:如何托管模型,模型出問(wèn)題時(shí)該怎么辦,以及如何隨著時(shí)間推移構(gòu)建模型的差異化——針對(duì)大模型的清晰抽象和簡(jiǎn)單工具還沒(méi)有誕生。
Replicate的兩位聯(lián)合創(chuàng)始人Ben Firshman和Andreas Jansson,從頭像就可看出他們的極客范兒。
Replicate的兩位聯(lián)合創(chuàng)始人Ben Firshman(CEO)和Andreas Jansson(CTO)想要解決這個(gè)問(wèn)題,而他們也有經(jīng)驗(yàn)和技術(shù)基因去解決它。
Ben Firshman是一位連續(xù)創(chuàng)業(yè)者,Replicate是他第4次創(chuàng)業(yè),他在Docker擔(dān)任產(chǎn)品總監(jiān)時(shí)設(shè)計(jì)了Docker Compose,現(xiàn)在這個(gè)工具被數(shù)百萬(wàn)開(kāi)發(fā)者使用,他對(duì)開(kāi)發(fā)者體驗(yàn)有著超乎尋常的理解力。
Andreas Jansson曾擔(dān)任Spotify的高級(jí)機(jī)器學(xué)習(xí)工程師,他具備大規(guī)模部署AI模型的經(jīng)驗(yàn),并從0設(shè)計(jì)過(guò)創(chuàng)新的AI工具。
“對(duì)于軟件工程師,AI目前還太難用,你必須對(duì)AI具有非常深刻的認(rèn)識(shí)。整個(gè)軟件行業(yè)都受到了機(jī)器學(xué)習(xí)專(zhuān)家短缺的阻礙(約3000萬(wàn)軟件工程師對(duì)比約50萬(wàn)機(jī)器學(xué)習(xí)工程師)。我們讓軟件工程師可以在沒(méi)有任何經(jīng)驗(yàn)的情況下,只需幾行代碼就可以使用AI的能力,這樣他們就可以構(gòu)建帶有AI的產(chǎn)品,并將其應(yīng)用到業(yè)務(wù)上。”Firshman在談到創(chuàng)業(yè)初衷時(shí)這樣說(shuō)。
Replicate的種子輪和A輪投資人,紅杉資本合伙人Stephanie Zhan則表示:“Replicate提供了一種簡(jiǎn)單、快速的方式,讓任何人都可以在云上運(yùn)行生成式AI模型。開(kāi)發(fā)者不必為GPU煩惱,也不必為昂貴的AWS付費(fèi),他們只需要一行代碼就可以在云中部署AI模型,按秒計(jì)費(fèi)。
除了在開(kāi)源生態(tài)系統(tǒng)中使用最好的模型,Replicate的平臺(tái)還允許公司運(yùn)行自己的定制模型,它會(huì)自動(dòng)打包、優(yōu)化并部署這些模型——將過(guò)程從幾周縮短到幾分鐘,并減少對(duì)基礎(chǔ)設(shè)施團(tuán)隊(duì)幫助的需求。
我們很高興能通過(guò)這輪A輪融資深化與Ben和Andreas的合作,AI將是下一個(gè)十年最重要的主題——由數(shù)據(jù)規(guī)模、生成式AI模型的新技術(shù)突破和計(jì)算的進(jìn)步推動(dòng)——而在這個(gè)軟件2.0世界的基礎(chǔ)設(shè)施堆棧被編寫(xiě)的過(guò)程中,我們相信Replicate將扮演一個(gè)基礎(chǔ)的角色。”
一個(gè)云平臺(tái),讓AI模型部署時(shí)間從幾周降到幾分鐘
Replicate的核心產(chǎn)品理念是,所有開(kāi)源AI模型都應(yīng)該能在一個(gè)地方找到,并且易于使用。開(kāi)發(fā)者應(yīng)該能在沒(méi)有任何機(jī)器學(xué)習(xí)工作、托管設(shè)置的情況下,立即啟動(dòng)并運(yùn)行大語(yǔ)言模型。將幾個(gè)模型組合成一個(gè)管道應(yīng)該很容易。并且,當(dāng)應(yīng)用程序規(guī)模擴(kuò)大時(shí),開(kāi)發(fā)者應(yīng)該能夠使用簡(jiǎn)單的工具進(jìn)行微調(diào)并托管自己的模型。
Replicate的產(chǎn)品是一個(gè)開(kāi)源的AI模型托管云平臺(tái),它的幾個(gè)主要功能是:
現(xiàn)有大模型的整合與引入
企業(yè)用戶(hù)可以使用幾行代碼就在平臺(tái)上運(yùn)行機(jī)器學(xué)習(xí)模型,而無(wú)需了解任何機(jī)器學(xué)習(xí)的工作原理。
針對(duì)需求相對(duì)簡(jiǎn)單的用戶(hù),Replicate提供了上千個(gè)不同的AI模型在線(xiàn)使用或者簡(jiǎn)便地導(dǎo)入到自己的程序中,包括語(yǔ)言模型、視頻創(chuàng)作與編輯、超分辨率、圖像修復(fù)、圖片轉(zhuǎn)文字、文字轉(zhuǎn)圖像等六大功能,最火爆的模型已經(jīng)被在線(xiàn)使用了超過(guò)9000萬(wàn)次。
針對(duì)需求更高的深度用戶(hù),他們可以借助Replicate的模型庫(kù)以及Next.js和Vercel等工具開(kāi)發(fā)自己的項(xiàng)目。截止目前,已經(jīng)有很多AI工程師使用Replicate來(lái)制作自己的項(xiàng)目,例如將開(kāi)源基礎(chǔ)大模型進(jìn)行特定方向的微調(diào)(目前開(kāi)發(fā)者們已經(jīng)能在Replicate平臺(tái)上微調(diào) Llama 2大模型),其中優(yōu)秀項(xiàng)目包括roomGPT、 Scribble Diffusion等。
幫助用戶(hù)部署人工智能大模型
部署人工智能大模型模型的傳統(tǒng)方法是,開(kāi)發(fā)人員必須先將模型及其支撐組件手動(dòng)打包到軟件容器中,然后再部署。Replicate 開(kāi)發(fā)了一種名為Cog的開(kāi)源工具,簡(jiǎn)化了這項(xiàng)任務(wù)。
Cog目前內(nèi)嵌在Replicate的云平臺(tái)中,用戶(hù)可以通過(guò)比以往更少的定制化工作來(lái)配置容器。用戶(hù)在云平臺(tái)僅通過(guò)幾行代碼就能運(yùn)行特定的AI模型,整個(gè)過(guò)程只需要幾分鐘,與以前的部署方法相比是指數(shù)級(jí)的下降。
Replicate不僅提供了云平臺(tái),還給出了非常詳細(xì)的模型部署教程。目前,cog在GitHub上獲得了超過(guò)5200顆星。
幫助快速擴(kuò)展人工智能模型規(guī)模
對(duì)于中小企業(yè),大規(guī)模部署機(jī)器學(xué)習(xí)模型不止會(huì)遇到cog解決的部署問(wèn)題,同樣關(guān)鍵的問(wèn)題是如何擴(kuò)大其規(guī)模以達(dá)到商用標(biāo)準(zhǔn)。在擴(kuò)大規(guī)模的時(shí)候,要處理的問(wèn)題涵蓋API服務(wù)器、依賴(lài)關(guān)系、模型權(quán)重、CUDA、GPU、批處理等。
當(dāng)用戶(hù)在Replicate平臺(tái)上部署機(jī)器學(xué)習(xí)模型,平臺(tái)可以從硬件和軟件兩個(gè)層面幫助其擴(kuò)展規(guī)模。
軟件上,用戶(hù)既可以使用現(xiàn)成的開(kāi)源模型,也可以大規(guī)模部署自定義私有模型——只要使用Cog定義的模型,Replicate都可以自動(dòng)為其生成可擴(kuò)展的API服務(wù)器,并部署在大型GPU集群上。
當(dāng)用戶(hù)部署的模型獲得大量流量時(shí),Replicate會(huì)自動(dòng)擴(kuò)展模型以滿(mǎn)足需求。如果部署的模型沒(méi)有獲得任何流量,replicate就會(huì)將規(guī)模縮減至零,并且不會(huì)向用戶(hù)收取任何費(fèi)用。
硬件上,Replicate目前提供七種不同級(jí)別的硬件設(shè)施以供用戶(hù)部署其模型,平臺(tái)會(huì)以秒級(jí)別的精度計(jì)算用戶(hù)的部署時(shí)間并計(jì)費(fèi),價(jià)格區(qū)間在0.0002美元/秒至0.00471美元/秒之間。同時(shí),平臺(tái)還支持對(duì)于合規(guī)性、安全性或?qū)LA(服務(wù)等級(jí)協(xié)議)有特定需求的企業(yè)級(jí)客戶(hù)提供定制軟硬件解決方案。
更低的進(jìn)入門(mén)檻讓AI應(yīng)用創(chuàng)業(yè)迎來(lái)春天
我們?cè)?jīng)說(shuō)過(guò),得人才者得模型,得模型者得天下, 現(xiàn)在再加一句,產(chǎn)品致勝。把模型訓(xùn)練、服務(wù)產(chǎn)品化, 靠產(chǎn)品化實(shí)現(xiàn)規(guī)模化、低成本,是AIGC創(chuàng)業(yè)的王道。
此前,Llama 2幫助創(chuàng)業(yè)者節(jié)省了99%的訓(xùn)練模型算力時(shí)長(zhǎng),Replicate這樣的創(chuàng)業(yè)公司又幫助創(chuàng)業(yè)者把模型部署的時(shí)間成本降低了99%,再加上99%的企業(yè)需要第三方模型服務(wù),這些都是創(chuàng)業(yè)的機(jī)會(huì)。
當(dāng)然,Replicate并不是唯一幫助企業(yè)降低AI使用準(zhǔn)入門(mén)檻的,像Hugging Face(它已經(jīng)是估值20億美元的獨(dú)角獸)和OctoML等公司也在做類(lèi)似的事。而且不知是巧合還是必然,這三家公司都來(lái)自開(kāi)源社區(qū)。這些來(lái)自開(kāi)源社區(qū)的創(chuàng)業(yè)者,更理解開(kāi)發(fā)者們的痛點(diǎn),也更具有開(kāi)源精神,能夠打造真正符合開(kāi)發(fā)者需求的產(chǎn)品和平臺(tái)。
隨著Llama 2對(duì)于開(kāi)發(fā)和商用的開(kāi)源,利用AI大模型的能力做垂直應(yīng)用的公司將如雨后春筍般涌現(xiàn)出來(lái),而幫助它們降低使用AI大模型能力門(mén)檻的公司,使這些AI應(yīng)用創(chuàng)業(yè)公司們更早迎來(lái)春天。
本文為專(zhuān)欄作者授權(quán)微新創(chuàng)想發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表微新創(chuàng)想立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問(wèn),請(qǐng)聯(lián)系http://www.i0562.net/。