Midjourney遇勁敵!谷歌AI繪畫4大牛創(chuàng)業(yè),免費(fèi)試玩Imagen技術(shù),拿下1.2億天使融資
聲明:本文來自于微信公眾號 量子位 (ID:QbitAI),作者:夢晨 ,授權(quán)微新創(chuàng)想轉(zhuǎn)載發(fā)布。
AI繪畫王座上的MidJourney,終于迎來強(qiáng)勁對手。
最新挑戰(zhàn)者Ideogram橫空出世,開局就靠免費(fèi)注冊吸引眾多目光。
最矚目的特性:在圖中精準(zhǔn)生成文字,英偉達(dá)科學(xué)家范麟熙直接毫不客氣地用它畫了一個(gè)“It’s over, Midjourney”。
背后公司Ideogram AI,谷歌AI繪畫4大牛集體離職的創(chuàng)業(yè)項(xiàng)目,坐標(biāo)多倫多,帶著1650萬美元(約1.2億人民幣)種子輪融資席卷而來。
創(chuàng)始團(tuán)隊(duì)中前4人都是谷歌文生圖研究Imagen論文作者,組成一個(gè)擴(kuò)散模型頂級研究團(tuán)隊(duì)。
谷歌藏著掖著這么久都不給大家玩的先進(jìn)研究成果,終于被他們給開放出來。
Ideogram AI種子輪融資由a16z和Index Ventures領(lǐng)投。
個(gè)人投資者中也不乏知名人物,如OpenAI創(chuàng)始成員Andrej Karpathy,強(qiáng)化學(xué)習(xí)大牛Pieter Abbeel,Node.js創(chuàng)始人Ryan Dahl、GitHub聯(lián)合創(chuàng)始人Tom Preston-Werner等。
甚至團(tuán)隊(duì)的老上司,前谷歌大腦掌門人Jeff Dean也有參與。
別看創(chuàng)始團(tuán)隊(duì)都是技術(shù)出身,Ideogram AI在宣傳造勢方面也一點(diǎn)不含糊,直接在?上號召大家刷二創(chuàng)tag,開啟了一波病毒營銷。
AI學(xué)會精準(zhǔn)畫出文字
讓AI精準(zhǔn)畫出文字,一直是個(gè)難題。雖然SDXL和Midjourney新出的局部重繪功能有所改善,但網(wǎng)友反饋成功率一直不太高,需要反復(fù)嘗試。
Ideogram一搞定這個(gè)痛點(diǎn),直接被網(wǎng)友們玩出花了。
讓文字出現(xiàn)在指示牌上、同時(shí)適應(yīng)環(huán)境光影,沒問題。
做一個(gè)咖啡拉花也沒問題;抽象風(fēng)格的海報(bào),也可以搞出風(fēng)格合適的字體;一句話直出品牌logo更是生產(chǎn)力屬性拉滿。
從網(wǎng)友們分享的提示詞中也可以看出,增加畫文字成功概率的“咒語”也很簡單,就一個(gè)單詞:
typography(印刷排版)
不過很可惜的是,它還不太能掌握中文。
拋開文字,Ideogram的圖像生成能力,出圖質(zhì)量可以比肩MidJourney和Stable Diffusion。
如果與Imagen使用完全相同的技術(shù),那么使用谷歌T5而不是OpenAI CLIP作為語言編碼模型,意味著Ideogram對提示詞里空間關(guān)系描述的理解還要更強(qiáng)。
有人成功用它生成一組風(fēng)格一致的圖像。
再結(jié)合視頻生成工具Pika Labs直接搞出電影預(yù)告片風(fēng)格的短片。
擴(kuò)散模型頂級研究團(tuán)隊(duì)
Ideogram AI創(chuàng)始團(tuán)隊(duì)共7人,其中4人都是谷歌Imagen的合著者。
其中共同一作Mohammad Norouzi任CEO,他在多倫多大學(xué)計(jì)算機(jī)科學(xué)博士就讀期間拿到了谷歌ML博士獎(jiǎng)學(xué)金。
畢業(yè)后他加入谷歌大腦工作了7年,除了生成模型之外也是也是谷歌神經(jīng)機(jī)器翻譯團(tuán)隊(duì)的原始成員,Hinton團(tuán)隊(duì)自監(jiān)督對比學(xué)習(xí)框架SimCLR的合著者。
共同一作William Chan(陳俊樂)任新公司CTO,他先后就讀于加拿大滑鐵盧大學(xué)、卡內(nèi)基梅隆大學(xué)。
他2012年加入谷歌時(shí)先做的機(jī)器學(xué)習(xí)廣告工程,后轉(zhuǎn)到谷歌大腦作NLP研究。
第三位共同一作Chitwan Saharia本科畢業(yè)于孟買理工學(xué)院,2019年加入谷歌,現(xiàn)在是Ideogram的聯(lián)合創(chuàng)始人。
第四位聯(lián)創(chuàng)Jonathan Ho博士畢業(yè)于UC伯克利,曾在OpenAI工作一年,后加入谷歌。
他除了是Imagen論文的核心貢獻(xiàn)者,還是去噪擴(kuò)散模型奠基之作《Denoising Diffusion Probabilistic Models》的一作,這篇論文合著者中的Pieter Abbeel也是Ideogram AI的投資人。
創(chuàng)始團(tuán)隊(duì)中的另外三人,Shayaan Abdullah曾是Twitter的機(jī)器學(xué)習(xí)工程師,于今年4月離職,后加入Ideogram AI。
Jacob Lu為軟件工程師,加入Ideogram之前曾在亞馬遜等公司任職;Jenny Lei是軟件工程實(shí)習(xí)生,加入Ideogram AI之前曾在谷歌實(shí)習(xí)。
還要做視頻生成
Ideogram AI的四位聯(lián)創(chuàng)在谷歌期間,還完成了視頻生成的后續(xù)工作Imagen Video。
在一年前就已經(jīng)實(shí)現(xiàn)了生成1280*768分辨率、每秒24幀的高清視頻片段。
實(shí)際上在今年3月,量子位就曾從投資市場獲悉他們的天使輪估值達(dá)到1億美元,更多VC想給錢而趕不上、投不進(jìn),以及他們創(chuàng)業(yè)方向的更多消息:
不僅做圖像生成,將來還要做視頻生成。
無論Imagen還是Imagen Video,谷歌出于安全、倫理等方面考慮都未曾放出試玩、API或開源代碼。
研究成果無法轉(zhuǎn)化為應(yīng)用,是近年來不少從谷歌離職創(chuàng)業(yè)者遇到的共同問題。
如大模型那邊的Transformer八位作者中,Cohere創(chuàng)始人Aidan Gomez就曾表示離開的原因是“我在谷歌沒有看到大模型發(fā)揮它真正的力量”。
Ashish Vaswani與Niki Parmar離開谷歌創(chuàng)辦Adept AI與Essential AI的原因也是“谷歌希望用Transformer優(yōu)化現(xiàn)有產(chǎn)品,而我們希望創(chuàng)造新產(chǎn)品”。
后來這些研究者所擔(dān)心的事也確確實(shí)實(shí)發(fā)生了:
盡管2021年5月(比ChatGPT訓(xùn)練數(shù)據(jù)截止日期還早)谷歌就已經(jīng)開發(fā)出了LaMDA對話大模型與聊天機(jī)器人,但在推出產(chǎn)品方面有太多顧慮,最終18個(gè)月后被隔壁ChatGPT一手直接面對公眾開放搶盡了風(fēng)頭。
……
吸取了這些教訓(xùn),新成立的Ideogram AI也拿出一副盡量開放、先把用戶吸引進(jìn)來玩的架勢。
最初宣布了1000人測試名額,但沒一會就滿了。
今天似乎又開放了一些名額,量子位上午注冊時(shí)并沒有遇到排隊(duì)。
總之名額應(yīng)該還是有限的,感興趣的朋友抓緊了。
試玩地址:
https://ideogram.ai
參考鏈接:
[1]https://ideogram.ai/launch
[2]https://x.com/ideogram_ai/status/1694024927853129757
[3]https://x.com/DrJimFan/status/1694358069638275463
[4]https://x.com/WilliamLamkin/status/1694535089575637048
—完—