每周AI大事件 | GPT-4變蠢、馬斯克成立AI公司 xAI、京東推言犀大模型
歡迎來到站長之家的[每周AI大事件],這里記錄了過去一周值得關(guān)注的AI領(lǐng)域熱點(diǎn)內(nèi)容,幫助大家更好地了解人工智能領(lǐng)域的動(dòng)態(tài)和發(fā)展風(fēng)向。
Part1動(dòng)態(tài)
[國內(nèi)要聞]
《生成式人工智能服務(wù)管理暫行辦法》于2023年8月15日起施行。辦法提出了生成式人工智能服務(wù)的總體要求,包括堅(jiān)持發(fā)展和安全并重、促進(jìn)創(chuàng)新和依法治理相結(jié)合的原則。辦法還明確了生成式人工智能服務(wù)的技術(shù)發(fā)展和治理方面的措施,包括鼓勵(lì)創(chuàng)新應(yīng)用、推動(dòng)基礎(chǔ)技術(shù)自主創(chuàng)新、提高訓(xùn)練數(shù)據(jù)質(zhì)量等。
2.中科院ChipGPT攻克AI芯片設(shè)計(jì) 代碼量減少近10倍
中科院計(jì)算所的 ChipGPT項(xiàng)目引起了人們的關(guān)注,ChipGPT 的者指出,與傳統(tǒng)的敏捷方法相比,使用大語言模型的芯片自動(dòng)設(shè)計(jì)方法可以減少代碼量5.32-9.25倍,并且在面積優(yōu)化方面取得了47% 的提升。這意味著利用大語言模型可以顯著加速芯片開發(fā),并且可以實(shí)現(xiàn)設(shè)計(jì)的優(yōu)化。
京東正式推出京東言犀大模型,同時(shí)發(fā)布言犀AI開發(fā)計(jì)算平臺(tái)。該平臺(tái)已經(jīng)啟動(dòng)預(yù)約注冊(cè),預(yù)計(jì)8月正式上線。
4.機(jī)器人接入大模型無需訓(xùn)練即可完成復(fù)雜指令
李飛飛團(tuán)隊(duì)的最新成果是一項(xiàng)名為 VoxPoser 的具身智能技術(shù),可以使機(jī)器人直接聽懂人類的自然語言指令并完成復(fù)雜任務(wù),無需額外的數(shù)據(jù)和訓(xùn)練。
快手方面透露,他們目前正在進(jìn)行智能問答產(chǎn)品的內(nèi)測(cè),為用戶在搜索場(chǎng)景中提供智能問答和文本創(chuàng)作等新功能。這是短視頻直播行業(yè)首個(gè)基于大語言模型的應(yīng)用產(chǎn)品。
僅在2023年上半年,涉及生成式AI大模型及其落地應(yīng)用的企業(yè)的融資就有51筆,投融資金額超過人民幣1000億元。其中,單筆過億元融資就有18筆。
7.北京將發(fā)4000萬元算力券 支持大模型企業(yè)
北京市經(jīng)濟(jì)和信息化局計(jì)劃通過算力券等形式,支持模型伙伴和模型觀察員,以降低企業(yè)的訓(xùn)練成本并提高算力的匹配效率。首期的算力券預(yù)計(jì)將資助不低于4000萬元的模型伙伴企業(yè)。
8.藍(lán)色光標(biāo):出海廣告主AI營銷工具初代模型將于下半年推出
藍(lán)色光標(biāo)在互動(dòng)平臺(tái)表示,藍(lán)色光標(biāo)針對(duì)出海廣告主的AI營銷工具(垂直行業(yè)模型)初代模型將于下半年推出并試運(yùn)行。
9.中科創(chuàng)達(dá)與北京智源人工智能研究院成立AI大模型實(shí)驗(yàn)室
中科創(chuàng)達(dá)宣布與北京智源人工智能研究院共同成立”魔方未來聯(lián)合實(shí)驗(yàn)室“。基于該實(shí)驗(yàn)室,雙方將在大模型開發(fā)與應(yīng)用創(chuàng)新等方面展開戰(zhàn)略合作,通過優(yōu)勢(shì)資源共享與互補(bǔ),共同推進(jìn)大模型技術(shù)創(chuàng)新與成果轉(zhuǎn)化,促進(jìn)人工智能技術(shù)在智能汽車、智能機(jī)器人、智慧工業(yè)、智能物聯(lián)網(wǎng)等領(lǐng)域的應(yīng)用落地。
[國際要聞]
1.谷歌更新Bard功能:支持中文對(duì)話、朗讀內(nèi)容
谷歌的 AI 聊天機(jī)器人 Bard 更新了一些新功能,包括支持40種新語言和能夠朗讀內(nèi)容的能力。用戶現(xiàn)在可以用阿拉伯語、中文、德語、印地語和西班牙語等近四十種語言與 AI 進(jìn)行對(duì)話。Bard 還增加了固定和重命名對(duì)話的選項(xiàng),并具有豐富的控制選項(xiàng)和多模態(tài)功能。這些改進(jìn)提升了 Bard 在語言能力、語音回應(yīng)、控制選項(xiàng)和多模態(tài)功能等方面的表現(xiàn)。
馬斯克在推特上宣布,他的人工智能公司 x.AI 正式成立,目標(biāo)是理解“宇宙的真實(shí)本質(zhì)”。xAI 與推特當(dāng)前母公司X公司(在架構(gòu)上)相互獨(dú)立,但將與X公司及特斯拉密切合作。這家公司的高管團(tuán)隊(duì)將由馬斯克帶領(lǐng),成員來自曾工作于 Google、DeepMind、微軟、特斯拉等公司的高管,曾負(fù)責(zé) AlphaCode、ChatGPT 等項(xiàng)目。
Meta 即將發(fā)布其人工智能模型的商業(yè)版本,使初創(chuàng)企業(yè)和企業(yè)能夠在該技術(shù)基礎(chǔ)上構(gòu)建定制軟件。Meta 表示其 LLMs 是「開源」的,這意味著新模型的細(xì)節(jié)將公開發(fā)布。
4.Adobe Firefly Web 服務(wù)現(xiàn)已在全球推出
Adobe 今天宣布其 Firefly Web 服務(wù)現(xiàn)已在全球推出,支持100種語言的文本提示。除了擴(kuò)大訪問范圍,該公司還表示,F(xiàn)irefly 在網(wǎng)絡(luò)和 Photoshop 上已經(jīng)生成了超過10億個(gè)資源。該公司稱這些發(fā)布是「Adobe 歷史上最成功的兩個(gè)測(cè)試版本之一」。
GPT-4的所有細(xì)節(jié)揭示,包括 GPT-4的架構(gòu)、訓(xùn)練和推理的基礎(chǔ)設(shè)施、參數(shù)量、訓(xùn)練數(shù)據(jù)集、token 數(shù)、成本、混合專家模型(Mixture of Experts,MoE)等非常具體的參數(shù)和信息。
6.Netflix開發(fā)新的AI技術(shù)實(shí)時(shí)替換視頻背景
Netflix的研究人員表示,他們可能已經(jīng)讓無處不在的綠幕過時(shí)了。Maganta Green Screen (MGS)是一項(xiàng)在影視行業(yè)中應(yīng)用人工智能的創(chuàng)新進(jìn)展,它利用人工智能的力量增強(qiáng)視覺效果,使其在實(shí)時(shí)中更加逼真和精確。
特斯拉將其最新的人形機(jī)器人Optimus擎天柱的模型引入了北美門店,為消費(fèi)者帶來了一個(gè)全新的科技體驗(yàn)。此次門店中展示的機(jī)器人并不能真正的運(yùn)行,只是為了展示公司未來的美好愿景,希望借助人們對(duì)機(jī)器人的好奇心,進(jìn)一步提升其汽車產(chǎn)品的關(guān)注度。
8.AI檢測(cè)工具容易誤判非英語寫作為機(jī)器生成
一項(xiàng)研究顯示,超過一半的時(shí)間里,AI檢測(cè)器錯(cuò)誤地將非英語母語者的寫作判斷為機(jī)器生成。這種錯(cuò)誤分類可能對(duì)求職者、學(xué)生和其他經(jīng)常根據(jù)寫作能力評(píng)估的人造成困擾。
最新報(bào)告指出,由于來自美國超大云端服務(wù)供應(yīng)商的訂單增加,特別是微軟,再加上沙特阿拉伯新增的人工智能(AI)需求,因此調(diào)高今年 AI 服務(wù)器出貨量年增率上看70%。
10.谷歌被指控竊取數(shù)百萬用戶數(shù)據(jù)訓(xùn)練人工智能工具
谷歌面臨一項(xiàng)廣泛的侵權(quán)訴訟,指控這家科技巨頭未經(jīng)用戶同意,竊取了數(shù)百萬用戶的數(shù)據(jù),并違反版權(quán)法來訓(xùn)練和開發(fā)其人工智能產(chǎn)品。
11.OpenAI被知名作家起訴侵犯版權(quán)
據(jù)外媒報(bào)道,美國喜劇演員兼作家Sarah Silverman以及作家Christopher Golden和Richard Kadrey近日在美國地方法院起訴OpenAI和Meta ,指控其侵犯版權(quán)。他們稱,OpenAI和Meta使用了他們的書籍作為訓(xùn)練數(shù)據(jù),而沒有得到他們的同意。
12.Edge 瀏覽器內(nèi)的 Bing Chat 將具備聊天記錄功能
微軟廣告和網(wǎng)絡(luò)服務(wù)首席執(zhí)行官 Mikhail Parakhin 在回答網(wǎng)友的提問時(shí)表示,微軟 Edge 瀏覽器內(nèi)的 Bing Chat 將支持聊天記錄功能。
13.微軟必應(yīng)吸引近15億用戶使用 Bing AI
Bing AI 是當(dāng)今最受認(rèn)可的人工智能工具之一,與 ChatGPT 的受歡迎程度不相上下。根據(jù)最新的統(tǒng)計(jì)數(shù)據(jù),僅在2023年,就有近15億用戶訪問了 Bing,而這一年還遠(yuǎn)未結(jié)束。
14.YouTube推出AI生成的測(cè)驗(yàn)功能
YouTube正在其移動(dòng)應(yīng)用程序上嘗試使用人工智能生成的測(cè)驗(yàn),旨在幫助觀眾更多了解教育視頻中涉及的主題。該功能還將幫助視頻分享平臺(tái)更好地了解每個(gè)視頻對(duì)某一主題的覆蓋程度。這一AI生成的測(cè)驗(yàn)功能已經(jīng)全球范圍內(nèi)向部分觀看教育視頻的用戶推出。
Part2產(chǎn)品
商湯大模型團(tuán)隊(duì)提出的文生圖大模型 RAPHAEL,可以生成具有高度藝術(shù)風(fēng)格或者攝影風(fēng)格的圖片,速度極快。RAPHAEL 通過 Space-MoE、Time-MoE 和 Edge-supervised learning 三個(gè)組件實(shí)現(xiàn)。
谷歌最近發(fā)布了 MediaPipe Diffusion 插件,這是一個(gè)可在移動(dòng)設(shè)備上運(yùn)行的低成本可控文本到圖像生成解決方案。該插件可以提取條件圖像中的特征,并將其注入到擴(kuò)散模型的編碼器中,以實(shí)現(xiàn)對(duì)圖像生成過程的控制。與 ControlNet 相比,MediaPipe Diffusion 插件的推理效率提高了20+ 倍,在 v100上運(yùn)行甚至可以提速高達(dá)100倍。
上海交通大學(xué)在2023世界人工智能大會(huì)上發(fā)布了“白玉蘭科學(xué)大模型1.0版”。“白玉蘭科學(xué)大模型1.0版”包括三個(gè)領(lǐng)域模型,其中化學(xué)合成(BAI-Chem)代表了以分子結(jié)構(gòu)為中心的學(xué)科方向,神經(jīng)流體(BAI-NeuroFluid)代表了以動(dòng)力學(xué)為中心的學(xué)科方向,科學(xué)評(píng)測(cè)基準(zhǔn)(BAI-SciEval)是一個(gè)跨學(xué)科、跨模態(tài)的基礎(chǔ)模型。
4.清華&中國氣象局大模型登Natur 精確預(yù)測(cè)極端天氣
清華大學(xué)與中國氣象局合作開發(fā)的大模型「NowcastNet」成功解決了極端降水天氣臨近預(yù)報(bào)的世界級(jí)難題。該模型能夠在公里尺度下預(yù)報(bào)0-3小時(shí)的極端降水,包括短時(shí)強(qiáng)降水、暴風(fēng)雨、暴雪、冰雹等。
5.百川開源最強(qiáng)中英文百億參數(shù)模型!超越LLaMA
百川智能正式發(fā)布了參數(shù)量130億的通用大語言模型 Baichuan-13B、對(duì)話模型Baichuan-13B-Chat及其INT4/INT8兩個(gè)量化版本,成為中國開源大模型領(lǐng)域的重要里程碑。
6.文生視頻 AI Pika Labs:做廣告、電影都不在話下
一款名為 Pika Labs 的文生視頻 AI火了。該 AI 能夠生成非常流暢的視頻,甚至可以用于廣告和電影制作。從Pika Labs生成的一些視頻片段來看,整體的表現(xiàn)十分出色。Pika Labs 的 AI 在時(shí)間一致性和轉(zhuǎn)場(chǎng)方面表現(xiàn)出色,生成的視頻效果非常流暢。
7.ChatGPT上線GPT-4以來最強(qiáng)應(yīng)用“代碼解釋器”
OpenAI 為其語言模型 ChatGPT 引入了一項(xiàng)名為“代碼解釋器”的新功能。該功能可以讓用戶擁有更好的交互編程體驗(yàn)和強(qiáng)大的數(shù)據(jù)可視化能力。用戶可以在其 ChatGPT 配置文件中啟用代碼解釋器選項(xiàng),并將其用于數(shù)據(jù)分析、圖表創(chuàng)建、文件編輯和數(shù)學(xué)計(jì)算等任務(wù)。代碼解釋器被認(rèn)為是 OpenAI GPT-4最強(qiáng)大的功能之一。
8.ChatGPT神器Code Interpreter終于開放
OpenAI 已正式推出 Code Interpreter,這是其針對(duì) ChatGPT Plus 用戶的官方插件。Code Interpreter 允許用戶直接在 ChatGPT 界面中編寫和執(zhí)行 Python 代碼,從而實(shí)現(xiàn)數(shù)據(jù)分析、創(chuàng)建圖表、編輯文件等任務(wù)。這項(xiàng)新功能受到了早期采用者的好評(píng),他們稱贊其實(shí)用性和自動(dòng)執(zhí)行復(fù)雜任務(wù)的能力。Code Interpreter 通過提供用于用代碼解決問題的通用工具箱并將大型語言模型集成到 AI 工作流程中,解決了 ChatGPT 早期版本的局限性。
Part3觀點(diǎn)
1.AMD CEO:人工智能將主導(dǎo)芯片設(shè)計(jì)行業(yè)
AMD 首席執(zhí)行官蘇姿豐強(qiáng)調(diào),AI 是芯片設(shè)計(jì)的方式,尤其是在測(cè)試和驗(yàn)證方面,并將 AI 確定為未來的首要戰(zhàn)略重點(diǎn)。
2.斯坦福大學(xué):大多數(shù)大語言模型不符合歐盟AI法案
斯坦福大學(xué)著名的以人為中心的人工智能研究所 (HAI) 表示,對(duì)10個(gè)主要基礎(chǔ)模型的調(diào)查顯示,它們“基本上不”遵守歐盟的人工智能法案。得分最高的基礎(chǔ)模型是Bloom。緊隨其后的是 EleutherAI 的GPT-NeoX和 Google 的PaLM2。OpenAI 的 GPT-4排名第四,Cohere 的Command躋身前五。
報(bào)告顯示,高技能職業(yè)可能最易受人工智能(AI)影響,當(dāng)然AI當(dāng)前對(duì)就業(yè)的影響尚未完全顯現(xiàn)。研究進(jìn)一步將"高技能白領(lǐng)工作"定義為最易受AI影響的職業(yè),包括:商務(wù)專業(yè)人員、經(jīng)理、首席執(zhí)行官和科學(xué)工程專業(yè)人員被列為最主要受AI能力影響的職業(yè)。
4.比爾·蓋茨:人類已準(zhǔn)備好應(yīng)對(duì)人工智能帶來的重大風(fēng)險(xiǎn)
比爾蓋茨表示,人類已經(jīng)準(zhǔn)備好處理人工智能帶來的重大風(fēng)險(xiǎn)。盡管他無法回答人工智能可能導(dǎo)致的滅絕威脅,但他對(duì)能夠應(yīng)對(duì)人工智能帶來的風(fēng)險(xiǎn)持樂觀態(tài)度。
5.騰訊張立軍:游戲已成為推動(dòng)芯片、AI等技術(shù)發(fā)展的強(qiáng)大驅(qū)動(dòng)力
騰訊公司副總裁、華東總部總經(jīng)理張立軍表示,在過去半個(gè)多世紀(jì)里,游戲與前沿科技一直處于一種緊密的共生關(guān)系之中。在用戶不斷提升的體驗(yàn)需求驅(qū)動(dòng)下,游戲總能及時(shí)地?fù)肀Ш蛻?yīng)用最前沿的科技成果,反過來,游戲也成為推動(dòng)芯片、AI 等技術(shù)發(fā)展的強(qiáng)大驅(qū)動(dòng)力。
6.迪士尼米奇配音演員:AI永遠(yuǎn)無法捕捉米奇老鼠的精髓
AI是當(dāng)今好萊塢正在關(guān)注的一個(gè)話題,推動(dòng)人工智能的技術(shù)確實(shí)很了不起,但根據(jù)迪士尼吉祥物米老鼠的配音演員艾萬的觀點(diǎn),它永遠(yuǎn)無法捕捉米奇老鼠的精髓。艾萬表示:“天哪,我得說,當(dāng)然有許多令人驚嘆的AI技術(shù)正在發(fā)展,非常令人印象深刻。但是我不認(rèn)為任何東西能夠取代角色的核心。”
Part4深度
1.GPT-4被曝“變蠢” OpenAI 偷偷搞“小動(dòng)作”?
近期,有用戶在 OpenAI 的在線開發(fā)者論壇中反映,GPT-4的質(zhì)量似乎有所下降,變得更 “蠢” 了。用戶指出,GPT-4在長篇內(nèi)容的分析和創(chuàng)作上退步明顯,并且寫作質(zhì)量下降。一些開發(fā)者也表示,GPT-4在邏輯能力、編碼能力等方面都出現(xiàn)了問題,出現(xiàn)了循環(huán)輸出代碼、錯(cuò)誤響應(yīng)等情況。有專家猜測(cè),OpenAI 可能在創(chuàng)建一些較小的 GPT-4模型,這些模型類似于大型模型,但運(yùn)行成本較低。
2.AI「入侵」內(nèi)容平臺(tái),創(chuàng)作者狂喜?
AI 在內(nèi)容平臺(tái)上的大規(guī)模應(yīng)用。知乎、百家號(hào)、網(wǎng)易號(hào)等平臺(tái)都推出了 AI 輔助創(chuàng)作的功能,包括 AI 筆記、AI 大綱、AI 標(biāo)題等。這些 AI 工具能夠幫助創(chuàng)作者提高創(chuàng)作效率,擴(kuò)大內(nèi)容池。然而,AIGC 的泛濫也帶來了一些風(fēng)險(xiǎn),如內(nèi)容質(zhì)量的下降和對(duì)人工創(chuàng)作者的沖擊。平臺(tái)和創(chuàng)作者都需要借助 AI 的力量不斷學(xué)習(xí)和進(jìn)步,以適應(yīng)這個(gè)時(shí)代的變化。
3.大模型加速涌向移動(dòng)端!ControlNet手機(jī)出圖只需12秒
隨著大模型技術(shù)的發(fā)展,移動(dòng)應(yīng)用的人機(jī)交互方式正發(fā)生革命性變化。高通公司在 CVPR2023上展示了搭載15億參數(shù)的 ControlNet 模型在手機(jī)端的運(yùn)行,僅需不到12秒就能完成出圖。高通 AI 負(fù)責(zé)人 Ziad Asghar 表示,將10億 + 參數(shù)的大模型部署到手機(jī)只需要不到一個(gè)月的時(shí)間。大模型的出現(xiàn)將使終端設(shè)備上的數(shù)字助手能夠通過自然語言指令完成各種操作,實(shí)現(xiàn)個(gè)性化的用戶體驗(yàn)。通過量化、編譯和硬件加速優(yōu)化等技術(shù),大模型在終端側(cè)的部署變得更加容易。這一變革不僅限于手機(jī),而是將重塑包括筆記本電腦、汽車、物聯(lián)網(wǎng)等終端設(shè)備上的所有移動(dòng)應(yīng)用。高通將領(lǐng)導(dǎo)這場(chǎng)變革,并成為推動(dòng)大模型落地的核心。
4.ChatGPT最強(qiáng)競(jìng)品Claude2重磅升級(jí) 第一手實(shí)測(cè)在此
Anthropic 發(fā)布了 Claude2,被稱為 GPT-4最強(qiáng)競(jìng)品,免費(fèi)且不需要排隊(duì)即可使用。用戶可以通過郵箱注冊(cè)登錄,并享受比 GPT-4便宜4-5倍的價(jià)格。Claude2支持上傳和分析長文檔,可以提取摘要并回答相關(guān)問題。用戶可以構(gòu)建自己的知識(shí)庫,實(shí)現(xiàn)更高效的學(xué)習(xí)和研究。此外,Claude2還有代碼解釋器和小學(xué)數(shù)學(xué)能力,對(duì)于程序員和學(xué)生來說非常實(shí)用。
ChatGPT 的受歡迎程度正在下降,網(wǎng)站流量出現(xiàn)負(fù)增長。受歡迎程度的下降也對(duì)股市產(chǎn)生了影響,許多人工智能概念股都出現(xiàn)了大幅下跌。然而,有跡象表明大型語言模型正在轉(zhuǎn)向 B2B 市場(chǎng),OpenAI 開放了 GPT-4API,百度和阿里巴巴等其他公司專注于為 B2B 應(yīng)用程序開發(fā)大型模型。盡管 ChatGPT 的受歡迎程度有所下降,但更多殺手級(jí)應(yīng)用程序正在開發(fā)中。
文章討論了人工智能開發(fā)中對(duì)情商 (EQ) 的日益關(guān)注及其潛在應(yīng)用。它提到了諸如Character.ai和Inflection AI的Pi之類的例子,它們優(yōu)先考慮EQ以提供與用戶更加個(gè)性化和同理心的互動(dòng)。文章強(qiáng)調(diào)了情感人工智能的獨(dú)特優(yōu)勢(shì),包括其理解人類情感和社交互動(dòng)的能力。像 Westlake Mindworks 這樣的公司,這些公司正在致力于開發(fā)具有長期記憶和高級(jí)情緒分析功能的人工智能。