人人人免费人人专区人人,欧美精品不卡,欧美大片无尺码在线观看,久久精品小视频,成人免费黄色大片,欧美+亚洲+精品+三区

最年少Transformer論文作者如何與非典型華人創(chuàng)業(yè)者聯(lián)合打造20億美元的AI獨(dú)角獸?

編者按:本文來自微信公眾號(hào) 適道(ID:survivalbiz),作者:白石,微新創(chuàng)想經(jīng)授權(quán)轉(zhuǎn)載。

導(dǎo)讀:

1. 20歲的少年參與了開創(chuàng)生成式AI時(shí)代的重要論文

2. 喜歡玩技術(shù)的華人創(chuàng)業(yè)者與天才少年聯(lián)合創(chuàng)立Cohere

3. AI會(huì)帶來哪些風(fēng)險(xiǎn),它未來最大的機(jī)會(huì)是什么?

基礎(chǔ)大模型領(lǐng)域的全球競(jìng)爭(zhēng)仍在進(jìn)行,融資百億美元的OpenAI毫無疑問是領(lǐng)跑者之一,它的殺手級(jí)應(yīng)用ChatGPT擁有數(shù)億活躍用戶,想要與它正面競(jìng)爭(zhēng)無疑是困難的。

而一家估值20億美元的AI獨(dú)角獸在基礎(chǔ)大模型的競(jìng)爭(zhēng)中找到了一條差異化的路線,成為大模型創(chuàng)業(yè)混戰(zhàn)中的一股清流。

這家獨(dú)角獸就是Cohere,它由《Attention is All You Need》這篇開創(chuàng)性論文最年輕的作者Aidan Gomez與他的兩位多倫多大學(xué)校友Ivan Zhang和Nick Frosst聯(lián)合創(chuàng)立。

Cohere的三位聯(lián)合創(chuàng)始人:Ivan Zhang、Aidan Gomez、Nick Frosst

Cohere近期獲得了2.7億美元的C輪融資,累計(jì)融資額超過4.3億美元,估值超過21億美元。它的投資者名單中包括Salesforce、NVIDIA、Oracle這樣的企業(yè)巨頭,Tiger Global和Index Ventures等頂級(jí)投資機(jī)構(gòu),以及Geoffrey Hinton(深度學(xué)習(xí)三巨頭,圖靈獎(jiǎng)獲得者)、李飛飛等知名AI大牛。它的合作者還包括Amazon、麥肯錫等。

為何說Cohere是大模型創(chuàng)業(yè)混戰(zhàn)中的一股清流?

在產(chǎn)品上,它專注于服務(wù)企業(yè)級(jí)客戶,以強(qiáng)大的大模型Command為基礎(chǔ),提供企業(yè)級(jí)別的文字處理,知識(shí)問答等功能,并且模型可微調(diào)、可定制。此外,它還推出了企業(yè)級(jí)的知識(shí)助手Coral。

在安全性上,為了打消企業(yè)客戶的疑慮,它的產(chǎn)品可以多云和本地部署,并且擁有高度的數(shù)據(jù)隱私性。

在融資策略上,它更傾向于拿與自己產(chǎn)業(yè)鏈相關(guān)的大企業(yè)的錢,借助巨頭的力量發(fā)展自己,但是卻不與巨頭綁定(參考OpenAI與微軟的關(guān)系)。

作為知名AI獨(dú)角獸,Cohere的產(chǎn)品和企業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì)已經(jīng)被研究透徹,我們嘗試從創(chuàng)業(yè)者角度切入,以Cohere的兩位創(chuàng)始人Aidan Gomez與Ivan Zhang的多個(gè)訪談為材料,整理出Cohere從0到1的發(fā)展歷程,以及Aidan與Ivan兩位創(chuàng)業(yè)者對(duì)企業(yè)與AI的諸多真知灼見。

注:本文材料來源于Cohere的投資人、Madrona合伙人Jon Turow,Weights&Bias的創(chuàng)始人Lukas Biewald,知名媒體人Steven Marsh與Cohere的兩位聯(lián)合創(chuàng)始人Aidan Gomez及Ivan Zhang的對(duì)談。

1、20歲的少年參與了開創(chuàng)生成式AI時(shí)代的重要論文

Aidan Gomez是大語言模型領(lǐng)域開創(chuàng)性論文《Attention is All You Need》最年輕的作者。當(dāng)時(shí)他從多倫多大學(xué)去Google Brain實(shí)習(xí),還是大約19或20歲的本科生,這是他在美國科技界的第一次經(jīng)歷。

Aidan Gomez在多倫多大學(xué)

他在谷歌的實(shí)習(xí)導(dǎo)師是Lukasz Kaiser,也是《Attention is All You Need》的主要作者之一。當(dāng)時(shí)他們一起打造了一個(gè)訓(xùn)練大型神經(jīng)網(wǎng)絡(luò)的軟件平臺(tái)Tensor,同時(shí)他們也在訓(xùn)練一個(gè)AI模型。他們的想法是,訓(xùn)練一個(gè)能從數(shù)據(jù)集中學(xué)會(huì)做許多事情的巨大AI模型,訓(xùn)練它要用到多種模態(tài)的數(shù)據(jù)集,包括圖片、文本、甚至視頻。

當(dāng)時(shí)Aidan和Noam Shazeer(也是Transformer的論文作者)是“同桌”,Noam也在研究大語言模型,只是他研究的算法是RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))。Noam的目標(biāo)是找到一種比RNN更簡(jiǎn)單、更精煉、更具可擴(kuò)展性的新架構(gòu)。

于是Lukasz、Aidan與Noam一拍即合,打算一起做這項(xiàng)研究,這時(shí)他們又發(fā)現(xiàn)Google Brain的translate組的Niki Parmar, Jakob Uszkoreit, Ashish Vaswani與自己有相近的想法,兩個(gè)小組合并后,大家齊心協(xié)力地研究,最后那篇《Attention is All You Need》就誕生了。

論文的投稿是在一個(gè)凌晨,當(dāng)時(shí)辦公室只有Aidan和Ashish兩個(gè)人。稿子投出去后,他們就沉浸在了興奮中。Ashish已經(jīng)預(yù)見到這篇論文可能產(chǎn)生巨大的影響,而年輕的Aidan還是第一次投稿重要論文,還不知道這篇論文的重要性。就像他接受紐約客專欄作家Steven Marsh訪談時(shí)說的那樣:“我不認(rèn)為任何人預(yù)見到了它在未來會(huì)變成什么樣。 ”

而他真正對(duì)Transformer模型的實(shí)際影響感到震撼,是在實(shí)習(xí)結(jié)束回到多倫多大學(xué)以后。

“當(dāng)時(shí),我在多倫多大學(xué)進(jìn)行夏季研究,然后收到了Lukasz的郵件,主題是《看看這個(gè)》。郵件內(nèi)容是一個(gè)關(guān)于日本朋克搖滾樂隊(duì)的故事,故事記載了他們?cè)趺唇M隊(duì),怎么發(fā)專輯,然后又遺憾解散的過程。在郵件的最后,Lukasz寫道:‘我輸入的唯一的詞是transformer,模型自動(dòng)生成了故事。’

看了這篇機(jī)器生成的文本,我覺得這會(huì)掀起一場(chǎng)產(chǎn)品革命。因?yàn)檫@是第一次,一個(gè)非人類的系統(tǒng)以一種像我們?nèi)祟愐粯右巳雱俚姆绞绞褂谜Z言。” Aidan對(duì)Steven Marsh說。

大模型的進(jìn)化樹

當(dāng)《Attention is All You Need》和Transformer誕生之后,這個(gè)創(chuàng)新的模型迅速被AI社區(qū)采納,成為了新的技術(shù)標(biāo)準(zhǔn)。它在AI研究者中間掀起了熱潮,不斷有基于Transformer的強(qiáng)大模型出現(xiàn),例如BERT,例如GPT。而在2022年底,ChatGPT正式打開了生成式AI的熱潮。

2、喜歡玩技術(shù)的華人創(chuàng)業(yè)者與天才少年聯(lián)合創(chuàng)立Cohere

Cohere的聯(lián)合創(chuàng)始人Ivan Zhang是一個(gè)非典型AI研究者,但卻是一個(gè)典型的創(chuàng)業(yè)者。他與Aidan是多倫多大學(xué)的校友,后來輟學(xué)與Aidan一起創(chuàng)業(yè)。“我是一個(gè)創(chuàng)造者,我不太喜歡坐在教室里單純地吸收大量信息,我需要親自動(dòng)手,邊‘玩技術(shù)’邊學(xué)習(xí),這是我最好的學(xué)習(xí)方式。” 他這么向Cohere的投資人Jon Turow介紹自己。

Cohere的聯(lián)合創(chuàng)始人Ivan Zhang

從研究者到創(chuàng)業(yè)者,從ToC轉(zhuǎn)型ToB

2017年,從多倫多大學(xué)輟學(xué)后,Ivan在一家創(chuàng)業(yè)公司做后端工程師,他正是在這時(shí)認(rèn)識(shí)了Aidan Gomez。當(dāng)時(shí)Aidan想做一個(gè)獨(dú)立的AI研究小組,進(jìn)行興趣主導(dǎo)的AI研究,驗(yàn)證自己的創(chuàng)新想法,于是他們一起做了FOR.ai 。現(xiàn)在這個(gè)組織仍在運(yùn)行,叫做Cohere For AI,由多位AI領(lǐng)域的研究科學(xué)家組成,主要做AI的基礎(chǔ)研究。

2019年,Ivan向Aidan提議:“我們?yōu)槭裁床灰黄鹱鲆恍┬聳|西?”,于是他們從FOR.ai獨(dú)立出來,開始進(jìn)行更正式的創(chuàng)業(yè)。在這個(gè)階段,他們已經(jīng)有了創(chuàng)業(yè)經(jīng)驗(yàn),懂得一個(gè)組織正確的運(yùn)行方式,也認(rèn)識(shí)了不少AI領(lǐng)域的創(chuàng)始人。

在Cohere的創(chuàng)業(yè)初期,他們的第一個(gè)想法是打造一個(gè)AI基礎(chǔ)平臺(tái),讓開發(fā)者上傳AI模型,然后平臺(tái)會(huì)壓縮模型的尺寸,使模型更高效。但是在那個(gè)時(shí)間點(diǎn),生成式AI的熱潮并沒有到來,這個(gè)市場(chǎng)還太小。

作為論文作者的Aidan觀察到Transformer模型在AI社區(qū)內(nèi)的蓬勃發(fā)展,看到它解決了各種各樣和文本處理相關(guān)的問題,看到了開發(fā)者們對(duì)這個(gè)架構(gòu)的改進(jìn)。正好那時(shí)OpenAI的GPT-2發(fā)布,Transformer模型的參數(shù)突破10億,這也讓Aidan進(jìn)一步意識(shí)到了模型規(guī)模的重要性,以及這個(gè)模型架構(gòu)真正的潛力。

于是,幾位創(chuàng)始人將Cohere的方向從一個(gè)模型壓縮平臺(tái),往基礎(chǔ)大模型及服務(wù)轉(zhuǎn)型。

“當(dāng)體驗(yàn)了GPT-2后,我們發(fā)現(xiàn)它很酷,但是我們還不確定可以用GPT這類的AI基礎(chǔ)模型搭建什么服務(wù)。我們先嘗試做了Cohere的第一個(gè)項(xiàng)目,它是一個(gè)文本自動(dòng)完成工具,形式是Chrome瀏覽器的擴(kuò)展。用戶只要在文本框中輸入一段文字,它可以自動(dòng)續(xù)寫完成。我們最初打算利用廣告來賺錢。(注:這是一個(gè)ToC的商業(yè)模式)。但是我們顯然低估了打造消費(fèi)者產(chǎn)品的難度,這個(gè)產(chǎn)品的體驗(yàn)并不好,也沒有獲得很多用戶,我們明白自己在這個(gè)方向沒有競(jìng)爭(zhēng)優(yōu)勢(shì)。

于是我們決定拆除前端的界面,只提供后端的模型的能力,從ToC轉(zhuǎn)向ToB,做企業(yè)級(jí)的API服務(wù)。當(dāng)時(shí),99%的NLP用例需要單詞嵌入,也需要對(duì)模型進(jìn)行微調(diào),所以我們?cè)趲讉€(gè)月內(nèi),打造了一個(gè)帶有AI生成能力,并可以對(duì)模型進(jìn)行嵌入和微調(diào)的API平臺(tái)。” Ivan向Jon Turow分享Cohere轉(zhuǎn)型背后的思考。

對(duì)于Cohere為什么轉(zhuǎn)向ToB,以及公司使命的內(nèi)核,Aidan Gomez進(jìn)行了清晰的表述:“我們就是想讓AI大模型被更多人使用。當(dāng)時(shí),開發(fā)者和企業(yè)想要利用AI大模型的能力,無論是技術(shù)還是算力上都面臨很多阻礙。我們存在的意義就是消除人們使用AI大模型的障礙,讓不熟悉AI的開發(fā)者,以及普通的企業(yè),都能方便地使用AI的能力。

因?yàn)樯墒紸I特有的對(duì)話式互動(dòng)對(duì)于終端用戶來說是最好的體驗(yàn)。以我自己為例,當(dāng)我想開一個(gè)銀行賬戶時(shí),如果一家銀行能有一個(gè)24小時(shí)與我對(duì)話互動(dòng)、并且高效解決問題的移動(dòng)App,那會(huì)對(duì)我吸引力大增。

Cohere就是要做到這一點(diǎn),幫助所有類型的企業(yè)和組織用上生成式AI的力量,增強(qiáng)他們的競(jìng)爭(zhēng)優(yōu)勢(shì)。

Cohere允許企業(yè)客戶用自己的數(shù)據(jù)微調(diào)模型

企業(yè)在采用AI能力時(shí),還會(huì)對(duì)兩個(gè)問題產(chǎn)生疑問,就是模型的托管和數(shù)據(jù)的隱私。我們是支持多云托管的,企業(yè)可以選擇適合自己的云服務(wù),也可以在本地的服務(wù)器中部署。我們也十分重視數(shù)據(jù)隱私,當(dāng)企業(yè)用自己的數(shù)據(jù)進(jìn)行模型微調(diào)時(shí),無論是部署在云中,還是部署在本地服務(wù)器,我們都不會(huì)看到他們的數(shù)據(jù),這是我們的一個(gè)核心特性。”

不拘一格的人才策略,塑造了Cohere的高創(chuàng)造力

Cohere能夠在早期迅速轉(zhuǎn)向,找到自己正確的位置,離不開Ivan和Aidan從FOR.ai 開始積累的人才觀和創(chuàng)業(yè)哲學(xué)。Ivan在與Jon Turow對(duì)談時(shí)分享了他們的人才招聘哲學(xué)和創(chuàng)業(yè)文化:“我們的招聘方式與眾不同。在FOR.ai創(chuàng)業(yè)的時(shí)候,我們就確立了一個(gè)原則:我們尋找的是來自不同背景,但是對(duì)AI非常感興趣并希望產(chǎn)生巨大影響的人。

你不需要具有在Meta AI,DeepMind或Google工作過的完美背景,但是一定要對(duì)自己專注的領(lǐng)域有非常高的興趣和熱情。而且你不光會(huì)寫論文,還要有實(shí)際動(dòng)手的能力。我們把這種招聘方式帶到了Cohere,構(gòu)建了非常強(qiáng)大的早期團(tuán)隊(duì)。

在公司文化上,我們喜歡在技術(shù)方面進(jìn)行很多探索,‘玩技術(shù)’,然后獲得突破。雖然我們都會(huì)寫論文,但不是‘書呆子’,我們對(duì)自己應(yīng)該要做什么非常清楚,而且會(huì)花很多的時(shí)間在工程實(shí)踐而不僅是算法探索上,這讓我們打造的產(chǎn)品能夠真正為人們帶來價(jià)值。”

現(xiàn)在OpenAI占據(jù)了生成式AI的C位,那么已經(jīng)擁有數(shù)億活躍用戶的ChatGPT,會(huì)不會(huì)幫助OpenAI進(jìn)行壟斷,其他的公司是否還有機(jī)會(huì)?Aidan Gomez有自己的看法:“我絕不認(rèn)為大模型領(lǐng)域會(huì)形成壟斷。我認(rèn)為每個(gè)公司都有自己的風(fēng)格、方向和自己的優(yōu)勢(shì),在市場(chǎng)上都會(huì)找到自己的位置。消費(fèi)者和企業(yè)客戶會(huì)選擇他們認(rèn)為最好的伙伴,最值得信任的公司,以及最能幫他們成功的平臺(tái)。

對(duì)于Cohere這樣的基礎(chǔ)模型公司,我們面對(duì)的最終狀態(tài),很可能不是贏家通吃,而是一個(gè)多元化的市場(chǎng)格局。我們會(huì)有憑借自己的優(yōu)勢(shì)去贏得自己比賽的勝利。我們會(huì)用各種方法幫助客戶,讓他們用上最好的AI能力。我們的焦點(diǎn)是讓AI模型通過提示,微調(diào)在內(nèi)的各種方法,幫助特定客戶,獲得最大的價(jià)值。”

3、AI會(huì)帶來哪些風(fēng)險(xiǎn),它未來最大的機(jī)會(huì)是什么?

生成式AI的爆發(fā),在受到歡迎的同時(shí),也引發(fā)了不少擔(dān)憂。在公眾層面,人們擔(dān)憂AI是否會(huì)發(fā)展太快,能力太強(qiáng),從而“搶奪”人類的工作機(jī)會(huì);在現(xiàn)實(shí)的使用層面,則有不少人擔(dān)憂AI模型的安全性和可控性。

對(duì)此話題,Aidan Gomez和Ivan Zhang也發(fā)表了自己的看法。

AI可能“污染”社交媒體

Aidan Gomez的觀點(diǎn)更偏向社會(huì)性,他表示,AI生成的內(nèi)容對(duì)社交媒體的“污染”值得擔(dān)憂:“與其擔(dān)憂非人類智慧代替人類這類可能還有很多年才會(huì)發(fā)生的事,我們更應(yīng)該關(guān)注當(dāng)前的現(xiàn)實(shí)風(fēng)險(xiǎn)。

例如,非常有可能有AI生成數(shù)百萬個(gè)機(jī)器人,無縫地進(jìn)入我們的社交媒體和公共對(duì)話,然后推動(dòng)某一個(gè)觀點(diǎn)(無論這個(gè)觀點(diǎn)是有益的,還是有害的)。這可能會(huì)在一些能對(duì)社會(huì)產(chǎn)生重大影響的公共議題上產(chǎn)生無法預(yù)料的影響。

所以我們必須權(quán)衡這個(gè)事情的風(fēng)險(xiǎn),最好有具體的政策來減輕這種風(fēng)險(xiǎn)。例如,人們有權(quán)知道,我們正在閱讀的媒體內(nèi)容或者營銷內(nèi)容,到底是人類創(chuàng)作的還是機(jī)器合成的。”

而Ivan Zhang的觀點(diǎn)則相對(duì)現(xiàn)實(shí),他認(rèn)為AI面臨兩大挑戰(zhàn):“對(duì)于AI面臨的挑戰(zhàn),我們從客戶中獲取的信息首先是怎么評(píng)估生成式AI模型的能力。要準(zhǔn)確地比較兩個(gè)AI模型的能力并不容易,而且在文本生成方面,這種比較很可能是主觀的。這對(duì)生成式AI在商業(yè)方面的采用會(huì)產(chǎn)生一定的阻礙。

另一個(gè)挑戰(zhàn)就是數(shù)據(jù)隱私問題,在使用開源或閉源的大模型進(jìn)行商用時(shí),你有時(shí)候會(huì)使用一些敏感的數(shù)據(jù),這又會(huì)產(chǎn)生合規(guī)的問題。比如用AI輔助你寫作一封敏感的電子郵件時(shí),你是不是會(huì)擔(dān)心自己輸進(jìn)模型的敏感數(shù)據(jù)被濫用?當(dāng)然,這種擔(dān)心成為了我們的機(jī)會(huì),我們正在與Oracle合作解決這個(gè)問題。”

具身智能未來是AI的大機(jī)會(huì)

Aidan Gomez和Ivan Zhang既是AI專家,也是企業(yè)家,對(duì)于AI在未來有哪些新的方向和機(jī)會(huì),他們的觀點(diǎn)也值得關(guān)注。

首先,他們?cè)诓煌膱?chǎng)合都提到了同一個(gè)技術(shù),那就是具身智能,也就是將生成式AI的能力注入到有形的機(jī)器中。

Aidan這么對(duì)Lukas Biewald表述:“我認(rèn)為將生成式AI用到機(jī)器人技術(shù)和實(shí)體化方面真的太酷了,而且這個(gè)方向有非常強(qiáng)烈的需求。我們都想象過機(jī)器人具有高智能和靈活的身體會(huì)怎么樣——它一定會(huì)產(chǎn)生巨大的變革。但是這個(gè)方向確實(shí)還有很長的路要走,我也希望自己在這個(gè)方向產(chǎn)生影響,并試著去做一些相關(guān)的事情。”

Ivan也認(rèn)為具身智能絕對(duì)是AI下一階段的大機(jī)會(huì):“我認(rèn)為最大的機(jī)會(huì)是能影響實(shí)體的‘行動(dòng)模型’,將AI與工程及實(shí)體的產(chǎn)品結(jié)合起來,將會(huì)非常令人興奮,也一定會(huì)有不少企業(yè)對(duì)它們感興趣。但是,這項(xiàng)技術(shù)要走向?qū)嶓w化,模型的準(zhǔn)確性還需要進(jìn)一步的提高。”

此外,Aidan也對(duì)AI的智能發(fā)展和未來應(yīng)用做了更長遠(yuǎn)的想象:“現(xiàn)在AI模型的構(gòu)建依賴于人類,為了讓AI更加智能,我們會(huì)用人類的各種高階知識(shí)來訓(xùn)練它。打個(gè)比方,就像讓一個(gè)非常聰明的人,去教一個(gè)還不那么聰明的AI。那么未來如果AI模型變得非常聰明,人類的知識(shí)已經(jīng)被他全部學(xué)會(huì)了,就會(huì)面臨一個(gè)臨界點(diǎn)——人類已經(jīng)沒什么能教給AI了。

我最感興趣的是,如果AI突破了這個(gè)臨界點(diǎn),會(huì)發(fā)生什么?如果一群已經(jīng)學(xué)完了人類已有知識(shí)的AI在一起交談、探索、學(xué)習(xí),會(huì)不會(huì)產(chǎn)生新的知識(shí)?

也許當(dāng)這個(gè)時(shí)候來臨,我們?nèi)祟悤?huì)向AI學(xué)習(xí)新知識(shí),AI會(huì)帶著人類一起在新的知識(shí)海洋里遨游。”

本文為專欄作者授權(quán)微新創(chuàng)想發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表微新創(chuàng)想立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問,請(qǐng)聯(lián)系http://www.i0562.net/。

您可能還喜歡...

發(fā)表回復(fù)

您的郵箱地址不會(huì)被公開。 必填項(xiàng)已用 * 標(biāo)注