連獲硅谷頂級(jí)VC兩輪融資，Replicate指數(shù)級(jí)降低AI模型部署和使用成本

由微新創(chuàng)想 · 2023年 7月 29日

連續(xù)創(chuàng)業(yè)者與資深人工智能專(zhuān)家聯(lián)手，讓普通軟件工程師也能玩轉(zhuǎn)大模型

編者按：本文來(lái)自微信公眾號(hào) 阿爾法公社（ID：alphastartups），作者：阿爾法公社，微新創(chuàng)想經(jīng)授權(quán)發(fā)布。

上周，Meta發(fā)布了大語(yǔ)言模型Llama 2，它的能力相比前作增長(zhǎng)不少，但其最大的意義在于開(kāi)源和開(kāi)放商用，這讓有志于在自己業(yè)務(wù)中使用生成式AI能力的創(chuàng)業(yè)者們節(jié)省了99%的大語(yǔ)言模型訓(xùn)練算力時(shí)長(zhǎng)成本。他們只需花費(fèi)1%的算力時(shí)長(zhǎng)，就可以在開(kāi)源可商用的大語(yǔ)言模型上微調(diào)出符合自己行業(yè)需求的模型。這從根本上降低了大模型創(chuàng)業(yè)的準(zhǔn)入門(mén)檻。

連獲硅谷頂級(jí)VC兩輪融資，Replicate指數(shù)級(jí)降低AI模型部署和使用成本插圖

在生成式AI創(chuàng)業(yè)從基礎(chǔ)大模型轉(zhuǎn)向垂直應(yīng)用的趨勢(shì)下，有不少創(chuàng)業(yè)公司致力于幫助應(yīng)用側(cè)的客戶(hù)和用戶(hù)以盡量低的成本使用大語(yǔ)言模型的能力，Replicate就是這個(gè)方向上的一家典型公司。它打造了一個(gè)開(kāi)源的AI模型托管云平臺(tái)，幫助中小企業(yè)實(shí)現(xiàn)模型的快速交付，用戶(hù)可以在平臺(tái)上部署，微調(diào)AI模型，還能根據(jù)業(yè)務(wù)量快速擴(kuò)展自己的模型。

Replicate在2023年2月和7月分別完成了兩輪融資，2月，它獲得由a16z領(lǐng)投的1250萬(wàn)美元A輪融資，7月，又獲得3200萬(wàn)美元的新融資（投資者未披露），它的其他投資者還包括紅杉資本，Y Combinator以及Andrej Karpathy（OpenAI科學(xué)家），Richard Socher（You.com創(chuàng)始人），Solomon Hykes（Docker創(chuàng)始人），Thomas Dohmke（GitHub CEO）等，可以看出，這家公司受到了硅谷頂級(jí)投資機(jī)構(gòu)和企業(yè)家們的集體青睞。

連續(xù)創(chuàng)業(yè)者與資深人工智能專(zhuān)家聯(lián)手，讓普通軟件工程師也能玩轉(zhuǎn)大模型

在計(jì)算領(lǐng)域，其實(shí)很少有新的基礎(chǔ)構(gòu)件，應(yīng)用程序本質(zhì)上都是網(wǎng)絡(luò)、存儲(chǔ)和計(jì)算的某種組合。但是像Stable Diffusion和ChatGPT這樣的視覺(jué)或語(yǔ)言大模型卻真的代表了一個(gè)全新的基礎(chǔ)構(gòu)件。將這些大模型整合到軟件中，開(kāi)發(fā)者可以實(shí)現(xiàn)包括文本，視覺(jué)，語(yǔ)音等多模態(tài)內(nèi)容的生成，這在以前是不能實(shí)現(xiàn)的。這種轉(zhuǎn)變的級(jí)別不僅是將軟件從PC轉(zhuǎn)移到移動(dòng)設(shè)備（iPhone帶來(lái)的轉(zhuǎn)變），而是代表一種全新類(lèi)型的軟件。

大模型的能力毋庸置疑的強(qiáng)大，但是普通軟件開(kāi)發(fā)者將AI大規(guī)模運(yùn)行到生產(chǎn)環(huán)境中時(shí)，仍面臨一系列難題：如何托管模型，模型出問(wèn)題時(shí)該怎么辦，以及如何隨著時(shí)間推移構(gòu)建模型的差異化——針對(duì)大模型的清晰抽象和簡(jiǎn)單工具還沒(méi)有誕生。

連獲硅谷頂級(jí)VC兩輪融資，Replicate指數(shù)級(jí)降低AI模型部署和使用成本插圖1

Replicate的兩位聯(lián)合創(chuàng)始人Ben Firshman和Andreas Jansson，從頭像就可看出他們的極客范兒。

Replicate的兩位聯(lián)合創(chuàng)始人Ben Firshman（CEO）和Andreas Jansson（CTO）想要解決這個(gè)問(wèn)題，而他們也有經(jīng)驗(yàn)和技術(shù)基因去解決它。

Ben Firshman是一位連續(xù)創(chuàng)業(yè)者，Replicate是他第4次創(chuàng)業(yè)，他在Docker擔(dān)任產(chǎn)品總監(jiān)時(shí)設(shè)計(jì)了Docker Compose，現(xiàn)在這個(gè)工具被數(shù)百萬(wàn)開(kāi)發(fā)者使用，他對(duì)開(kāi)發(fā)者體驗(yàn)有著超乎尋常的理解力。

Andreas Jansson曾擔(dān)任Spotify的高級(jí)機(jī)器學(xué)習(xí)工程師，他具備大規(guī)模部署AI模型的經(jīng)驗(yàn)，并從0設(shè)計(jì)過(guò)創(chuàng)新的AI工具。

“對(duì)于軟件工程師，AI目前還太難用，你必須對(duì)AI具有非常深刻的認(rèn)識(shí)。整個(gè)軟件行業(yè)都受到了機(jī)器學(xué)習(xí)專(zhuān)家短缺的阻礙（約3000萬(wàn)軟件工程師對(duì)比約50萬(wàn)機(jī)器學(xué)習(xí)工程師）。我們讓軟件工程師可以在沒(méi)有任何經(jīng)驗(yàn)的情況下，只需幾行代碼就可以使用AI的能力，這樣他們就可以構(gòu)建帶有AI的產(chǎn)品，并將其應(yīng)用到業(yè)務(wù)上。”Firshman在談到創(chuàng)業(yè)初衷時(shí)這樣說(shuō)。

Replicate的種子輪和A輪投資人，紅杉資本合伙人Stephanie Zhan則表示：“Replicate提供了一種簡(jiǎn)單、快速的方式，讓任何人都可以在云上運(yùn)行生成式AI模型。開(kāi)發(fā)者不必為GPU煩惱，也不必為昂貴的AWS付費(fèi)，他們只需要一行代碼就可以在云中部署AI模型，按秒計(jì)費(fèi)。

除了在開(kāi)源生態(tài)系統(tǒng)中使用最好的模型，Replicate的平臺(tái)還允許公司運(yùn)行自己的定制模型，它會(huì)自動(dòng)打包、優(yōu)化并部署這些模型——將過(guò)程從幾周縮短到幾分鐘，并減少對(duì)基礎(chǔ)設(shè)施團(tuán)隊(duì)幫助的需求。

我們很高興能通過(guò)這輪A輪融資深化與Ben和Andreas的合作，AI將是下一個(gè)十年最重要的主題——由數(shù)據(jù)規(guī)模、生成式AI模型的新技術(shù)突破和計(jì)算的進(jìn)步推動(dòng)——而在這個(gè)軟件2.0世界的基礎(chǔ)設(shè)施堆棧被編寫(xiě)的過(guò)程中，我們相信Replicate將扮演一個(gè)基礎(chǔ)的角色。”

一個(gè)云平臺(tái)，讓AI模型部署時(shí)間從幾周降到幾分鐘

Replicate的核心產(chǎn)品理念是，所有開(kāi)源AI模型都應(yīng)該能在一個(gè)地方找到，并且易于使用。開(kāi)發(fā)者應(yīng)該能在沒(méi)有任何機(jī)器學(xué)習(xí)工作、托管設(shè)置的情況下，立即啟動(dòng)并運(yùn)行大語(yǔ)言模型。將幾個(gè)模型組合成一個(gè)管道應(yīng)該很容易。并且，當(dāng)應(yīng)用程序規(guī)模擴(kuò)大時(shí)，開(kāi)發(fā)者應(yīng)該能夠使用簡(jiǎn)單的工具進(jìn)行微調(diào)并托管自己的模型。

Replicate的產(chǎn)品是一個(gè)開(kāi)源的AI模型托管云平臺(tái)，它的幾個(gè)主要功能是：

現(xiàn)有大模型的整合與引入

企業(yè)用戶(hù)可以使用幾行代碼就在平臺(tái)上運(yùn)行機(jī)器學(xué)習(xí)模型，而無(wú)需了解任何機(jī)器學(xué)習(xí)的工作原理。

針對(duì)需求相對(duì)簡(jiǎn)單的用戶(hù)，Replicate提供了上千個(gè)不同的AI模型在線(xiàn)使用或者簡(jiǎn)便地導(dǎo)入到自己的程序中，包括語(yǔ)言模型、視頻創(chuàng)作與編輯、超分辨率、圖像修復(fù)、圖片轉(zhuǎn)文字、文字轉(zhuǎn)圖像等六大功能，最火爆的模型已經(jīng)被在線(xiàn)使用了超過(guò)9000萬(wàn)次。

連獲硅谷頂級(jí)VC兩輪融資，Replicate指數(shù)級(jí)降低AI模型部署和使用成本插圖2

針對(duì)需求更高的深度用戶(hù)，他們可以借助Replicate的模型庫(kù)以及Next.js和Vercel等工具開(kāi)發(fā)自己的項(xiàng)目。截止目前，已經(jīng)有很多AI工程師使用Replicate來(lái)制作自己的項(xiàng)目，例如將開(kāi)源基礎(chǔ)大模型進(jìn)行特定方向的微調(diào)（目前開(kāi)發(fā)者們已經(jīng)能在Replicate平臺(tái)上微調(diào) Llama 2大模型），其中優(yōu)秀項(xiàng)目包括roomGPT、 Scribble Diffusion等。

幫助用戶(hù)部署人工智能大模型

部署人工智能大模型模型的傳統(tǒng)方法是，開(kāi)發(fā)人員必須先將模型及其支撐組件手動(dòng)打包到軟件容器中，然后再部署。Replicate 開(kāi)發(fā)了一種名為Cog的開(kāi)源工具，簡(jiǎn)化了這項(xiàng)任務(wù)。

Cog目前內(nèi)嵌在Replicate的云平臺(tái)中，用戶(hù)可以通過(guò)比以往更少的定制化工作來(lái)配置容器。用戶(hù)在云平臺(tái)僅通過(guò)幾行代碼就能運(yùn)行特定的AI模型，整個(gè)過(guò)程只需要幾分鐘，與以前的部署方法相比是指數(shù)級(jí)的下降。

Replicate不僅提供了云平臺(tái)，還給出了非常詳細(xì)的模型部署教程。目前，cog在GitHub上獲得了超過(guò)5200顆星。

幫助快速擴(kuò)展人工智能模型規(guī)模

對(duì)于中小企業(yè)，大規(guī)模部署機(jī)器學(xué)習(xí)模型不止會(huì)遇到cog解決的部署問(wèn)題，同樣關(guān)鍵的問(wèn)題是如何擴(kuò)大其規(guī)模以達(dá)到商用標(biāo)準(zhǔn)。在擴(kuò)大規(guī)模的時(shí)候，要處理的問(wèn)題涵蓋API服務(wù)器、依賴(lài)關(guān)系、模型權(quán)重、CUDA、GPU、批處理等。

當(dāng)用戶(hù)在Replicate平臺(tái)上部署機(jī)器學(xué)習(xí)模型，平臺(tái)可以從硬件和軟件兩個(gè)層面幫助其擴(kuò)展規(guī)模。

軟件上，用戶(hù)既可以使用現(xiàn)成的開(kāi)源模型，也可以大規(guī)模部署自定義私有模型——只要使用Cog定義的模型，Replicate都可以自動(dòng)為其生成可擴(kuò)展的API服務(wù)器，并部署在大型GPU集群上。

當(dāng)用戶(hù)部署的模型獲得大量流量時(shí)，Replicate會(huì)自動(dòng)擴(kuò)展模型以滿(mǎn)足需求。如果部署的模型沒(méi)有獲得任何流量，replicate就會(huì)將規(guī)模縮減至零，并且不會(huì)向用戶(hù)收取任何費(fèi)用。

硬件上，Replicate目前提供七種不同級(jí)別的硬件設(shè)施以供用戶(hù)部署其模型，平臺(tái)會(huì)以秒級(jí)別的精度計(jì)算用戶(hù)的部署時(shí)間并計(jì)費(fèi)，價(jià)格區(qū)間在0.0002美元/秒至0.00471美元/秒之間。同時(shí)，平臺(tái)還支持對(duì)于合規(guī)性、安全性或?qū)LA（服務(wù)等級(jí)協(xié)議）有特定需求的企業(yè)級(jí)客戶(hù)提供定制軟硬件解決方案。

更低的進(jìn)入門(mén)檻讓AI應(yīng)用創(chuàng)業(yè)迎來(lái)春天

我們?cè)?jīng)說(shuō)過(guò)，得人才者得模型，得模型者得天下，現(xiàn)在再加一句，產(chǎn)品致勝。把模型訓(xùn)練、服務(wù)產(chǎn)品化，靠產(chǎn)品化實(shí)現(xiàn)規(guī)模化、低成本，是AIGC創(chuàng)業(yè)的王道。

此前，Llama 2幫助創(chuàng)業(yè)者節(jié)省了99%的訓(xùn)練模型算力時(shí)長(zhǎng)，Replicate這樣的創(chuàng)業(yè)公司又幫助創(chuàng)業(yè)者把模型部署的時(shí)間成本降低了99%，再加上99%的企業(yè)需要第三方模型服務(wù)，這些都是創(chuàng)業(yè)的機(jī)會(huì)。

當(dāng)然，Replicate并不是唯一幫助企業(yè)降低AI使用準(zhǔn)入門(mén)檻的，像Hugging Face（它已經(jīng)是估值20億美元的獨(dú)角獸）和OctoML等公司也在做類(lèi)似的事。而且不知是巧合還是必然，這三家公司都來(lái)自開(kāi)源社區(qū)。這些來(lái)自開(kāi)源社區(qū)的創(chuàng)業(yè)者，更理解開(kāi)發(fā)者們的痛點(diǎn)，也更具有開(kāi)源精神，能夠打造真正符合開(kāi)發(fā)者需求的產(chǎn)品和平臺(tái)。

隨著Llama 2對(duì)于開(kāi)發(fā)和商用的開(kāi)源，利用AI大模型的能力做垂直應(yīng)用的公司將如雨后春筍般涌現(xiàn)出來(lái)，而幫助它們降低使用AI大模型能力門(mén)檻的公司，使這些AI應(yīng)用創(chuàng)業(yè)公司們更早迎來(lái)春天。

本文為專(zhuān)欄作者授權(quán)微新創(chuàng)想發(fā)表，版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn)，不代表微新創(chuàng)想立場(chǎng)，轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問(wèn)，請(qǐng)聯(lián)系http://www.i0562.net/。

人人人免费人人专区人人,欧美精品不卡,欧美大片无尺码在线观看,久久精品小视频,成人免费黄色大片,欧美+亚洲+精品+三区

連獲硅谷頂級(jí)VC兩輪融資，Replicate指數(shù)級(jí)降低AI模型部署和使用成本

連續(xù)創(chuàng)業(yè)者與資深人工智能專(zhuān)家聯(lián)手，讓普通軟件工程師也能玩轉(zhuǎn)大模型

一個(gè)云平臺(tái)，讓AI模型部署時(shí)間從幾周降到幾分鐘

更低的進(jìn)入門(mén)檻讓AI應(yīng)用創(chuàng)業(yè)迎來(lái)春天

您可能還喜歡...

發(fā)表回復(fù) 取消回復(fù)

熱門(mén)文章

熱門(mén)文章

人人人免费人人专区人人,欧美精品不卡,欧美大片无尺码在线观看,久久精品小视频,成人免费黄色大片,欧美+亚洲+精品+三区

連獲硅谷頂級(jí)VC兩輪融資，Replicate指數(shù)級(jí)降低AI模型部署和使用成本

連續(xù)創(chuàng)業(yè)者與資深人工智能專(zhuān)家聯(lián)手，讓普通軟件工程師也能玩轉(zhuǎn)大模型

一個(gè)云平臺(tái)，讓AI模型部署時(shí)間從幾周降到幾分鐘

更低的進(jìn)入門(mén)檻讓AI應(yīng)用創(chuàng)業(yè)迎來(lái)春天

您可能還喜歡...

谷歌 DeepMind 聯(lián)合創(chuàng)始人呼吁美國(guó)應(yīng)該利用芯片領(lǐng)先地位來(lái)執(zhí)行最低人工智能標(biāo)準(zhǔn)

“小猿學(xué)練機(jī)”驚艷亮相，猿輔導(dǎo)AI技術(shù)助力孩子快樂(lè)學(xué)習(xí)

NASA將運(yùn)用人工智能搜尋外星生命和UFO存在

發(fā)表回復(fù) 取消回復(fù)

熱門(mén)文章

熱門(mén)文章