每周AI大事件 | GPT-4變蠢、馬斯克成立AI公司 xAI、京東推言犀大模型
歡迎來到站長之家的[每周AI大事件],這里記錄了過去一周值得關注的AI領域熱點內容,幫助大家更好地了解人工智能領域的動態和發展風向。
Part1動態
[國內要聞]
《生成式人工智能服務管理暫行辦法》于2023年8月15日起施行。辦法提出了生成式人工智能服務的總體要求,包括堅持發展和安全并重、促進創新和依法治理相結合的原則。辦法還明確了生成式人工智能服務的技術發展和治理方面的措施,包括鼓勵創新應用、推動基礎技術自主創新、提高訓練數據質量等。
2.中科院ChipGPT攻克AI芯片設計 代碼量減少近10倍
中科院計算所的 ChipGPT項目引起了人們的關注,ChipGPT 的者指出,與傳統的敏捷方法相比,使用大語言模型的芯片自動設計方法可以減少代碼量5.32-9.25倍,并且在面積優化方面取得了47% 的提升。這意味著利用大語言模型可以顯著加速芯片開發,并且可以實現設計的優化。
京東正式推出京東言犀大模型,同時發布言犀AI開發計算平臺。該平臺已經啟動預約注冊,預計8月正式上線。
李飛飛團隊的最新成果是一項名為 VoxPoser 的具身智能技術,可以使機器人直接聽懂人類的自然語言指令并完成復雜任務,無需額外的數據和訓練。
快手方面透露,他們目前正在進行智能問答產品的內測,為用戶在搜索場景中提供智能問答和文本創作等新功能。這是短視頻直播行業首個基于大語言模型的應用產品。
僅在2023年上半年,涉及生成式AI大模型及其落地應用的企業的融資就有51筆,投融資金額超過人民幣1000億元。其中,單筆過億元融資就有18筆。
北京市經濟和信息化局計劃通過算力券等形式,支持模型伙伴和模型觀察員,以降低企業的訓練成本并提高算力的匹配效率。首期的算力券預計將資助不低于4000萬元的模型伙伴企業。
藍色光標在互動平臺表示,藍色光標針對出海廣告主的AI營銷工具(垂直行業模型)初代模型將于下半年推出并試運行。
中科創達宣布與北京智源人工智能研究院共同成立”魔方未來聯合實驗室“。基于該實驗室,雙方將在大模型開發與應用創新等方面展開戰略合作,通過優勢資源共享與互補,共同推進大模型技術創新與成果轉化,促進人工智能技術在智能汽車、智能機器人、智慧工業、智能物聯網等領域的應用落地。
[國際要聞]
谷歌的 AI 聊天機器人 Bard 更新了一些新功能,包括支持40種新語言和能夠朗讀內容的能力。用戶現在可以用阿拉伯語、中文、德語、印地語和西班牙語等近四十種語言與 AI 進行對話。Bard 還增加了固定和重命名對話的選項,并具有豐富的控制選項和多模態功能。這些改進提升了 Bard 在語言能力、語音回應、控制選項和多模態功能等方面的表現。
馬斯克在推特上宣布,他的人工智能公司 x.AI 正式成立,目標是理解“宇宙的真實本質”。xAI 與推特當前母公司X公司(在架構上)相互獨立,但將與X公司及特斯拉密切合作。這家公司的高管團隊將由馬斯克帶領,成員來自曾工作于 Google、DeepMind、微軟、特斯拉等公司的高管,曾負責 AlphaCode、ChatGPT 等項目。
Meta 即將發布其人工智能模型的商業版本,使初創企業和企業能夠在該技術基礎上構建定制軟件。Meta 表示其 LLMs 是「開源」的,這意味著新模型的細節將公開發布。
Adobe 今天宣布其 Firefly Web 服務現已在全球推出,支持100種語言的文本提示。除了擴大訪問范圍,該公司還表示,Firefly 在網絡和 Photoshop 上已經生成了超過10億個資源。該公司稱這些發布是「Adobe 歷史上最成功的兩個測試版本之一」。
GPT-4的所有細節揭示,包括 GPT-4的架構、訓練和推理的基礎設施、參數量、訓練數據集、token 數、成本、混合專家模型(Mixture of Experts,MoE)等非常具體的參數和信息。
Netflix的研究人員表示,他們可能已經讓無處不在的綠幕過時了。Maganta Green Screen (MGS)是一項在影視行業中應用人工智能的創新進展,它利用人工智能的力量增強視覺效果,使其在實時中更加逼真和精確。
特斯拉將其最新的人形機器人Optimus擎天柱的模型引入了北美門店,為消費者帶來了一個全新的科技體驗。此次門店中展示的機器人并不能真正的運行,只是為了展示公司未來的美好愿景,希望借助人們對機器人的好奇心,進一步提升其汽車產品的關注度。
一項研究顯示,超過一半的時間里,AI檢測器錯誤地將非英語母語者的寫作判斷為機器生成。這種錯誤分類可能對求職者、學生和其他經常根據寫作能力評估的人造成困擾。
最新報告指出,由于來自美國超大云端服務供應商的訂單增加,特別是微軟,再加上沙特阿拉伯新增的人工智能(AI)需求,因此調高今年 AI 服務器出貨量年增率上看70%。
谷歌面臨一項廣泛的侵權訴訟,指控這家科技巨頭未經用戶同意,竊取了數百萬用戶的數據,并違反版權法來訓練和開發其人工智能產品。
11.OpenAI被知名作家起訴侵犯版權
據外媒報道,美國喜劇演員兼作家Sarah Silverman以及作家Christopher Golden和Richard Kadrey近日在美國地方法院起訴OpenAI和Meta ,指控其侵犯版權。他們稱,OpenAI和Meta使用了他們的書籍作為訓練數據,而沒有得到他們的同意。
12.Edge 瀏覽器內的 Bing Chat 將具備聊天記錄功能
微軟廣告和網絡服務首席執行官 Mikhail Parakhin 在回答網友的提問時表示,微軟 Edge 瀏覽器內的 Bing Chat 將支持聊天記錄功能。
Bing AI 是當今最受認可的人工智能工具之一,與 ChatGPT 的受歡迎程度不相上下。根據最新的統計數據,僅在2023年,就有近15億用戶訪問了 Bing,而這一年還遠未結束。
YouTube正在其移動應用程序上嘗試使用人工智能生成的測驗,旨在幫助觀眾更多了解教育視頻中涉及的主題。該功能還將幫助視頻分享平臺更好地了解每個視頻對某一主題的覆蓋程度。這一AI生成的測驗功能已經全球范圍內向部分觀看教育視頻的用戶推出。
Part2產品
商湯大模型團隊提出的文生圖大模型 RAPHAEL,可以生成具有高度藝術風格或者攝影風格的圖片,速度極快。RAPHAEL 通過 Space-MoE、Time-MoE 和 Edge-supervised learning 三個組件實現。
谷歌最近發布了 MediaPipe Diffusion 插件,這是一個可在移動設備上運行的低成本可控文本到圖像生成解決方案。該插件可以提取條件圖像中的特征,并將其注入到擴散模型的編碼器中,以實現對圖像生成過程的控制。與 ControlNet 相比,MediaPipe Diffusion 插件的推理效率提高了20+ 倍,在 v100上運行甚至可以提速高達100倍。
上海交通大學在2023世界人工智能大會上發布了“白玉蘭科學大模型1.0版”。“白玉蘭科學大模型1.0版”包括三個領域模型,其中化學合成(BAI-Chem)代表了以分子結構為中心的學科方向,神經流體(BAI-NeuroFluid)代表了以動力學為中心的學科方向,科學評測基準(BAI-SciEval)是一個跨學科、跨模態的基礎模型。
清華大學與中國氣象局合作開發的大模型「NowcastNet」成功解決了極端降水天氣臨近預報的世界級難題。該模型能夠在公里尺度下預報0-3小時的極端降水,包括短時強降水、暴風雨、暴雪、冰雹等。
百川智能正式發布了參數量130億的通用大語言模型 Baichuan-13B、對話模型Baichuan-13B-Chat及其INT4/INT8兩個量化版本,成為中國開源大模型領域的重要里程碑。
6.文生視頻 AI Pika Labs:做廣告、電影都不在話下
一款名為 Pika Labs 的文生視頻 AI火了。該 AI 能夠生成非常流暢的視頻,甚至可以用于廣告和電影制作。從Pika Labs生成的一些視頻片段來看,整體的表現十分出色。Pika Labs 的 AI 在時間一致性和轉場方面表現出色,生成的視頻效果非常流暢。
OpenAI 為其語言模型 ChatGPT 引入了一項名為“代碼解釋器”的新功能。該功能可以讓用戶擁有更好的交互編程體驗和強大的數據可視化能力。用戶可以在其 ChatGPT 配置文件中啟用代碼解釋器選項,并將其用于數據分析、圖表創建、文件編輯和數學計算等任務。代碼解釋器被認為是 OpenAI GPT-4最強大的功能之一。
8.ChatGPT神器Code Interpreter終于開放
OpenAI 已正式推出 Code Interpreter,這是其針對 ChatGPT Plus 用戶的官方插件。Code Interpreter 允許用戶直接在 ChatGPT 界面中編寫和執行 Python 代碼,從而實現數據分析、創建圖表、編輯文件等任務。這項新功能受到了早期采用者的好評,他們稱贊其實用性和自動執行復雜任務的能力。Code Interpreter 通過提供用于用代碼解決問題的通用工具箱并將大型語言模型集成到 AI 工作流程中,解決了 ChatGPT 早期版本的局限性。
Part3觀點
AMD 首席執行官蘇姿豐強調,AI 是芯片設計的方式,尤其是在測試和驗證方面,并將 AI 確定為未來的首要戰略重點。
斯坦福大學著名的以人為中心的人工智能研究所 (HAI) 表示,對10個主要基礎模型的調查顯示,它們“基本上不”遵守歐盟的人工智能法案。得分最高的基礎模型是Bloom。緊隨其后的是 EleutherAI 的GPT-NeoX和 Google 的PaLM2。OpenAI 的 GPT-4排名第四,Cohere 的Command躋身前五。
報告顯示,高技能職業可能最易受人工智能(AI)影響,當然AI當前對就業的影響尚未完全顯現。研究進一步將"高技能白領工作"定義為最易受AI影響的職業,包括:商務專業人員、經理、首席執行官和科學工程專業人員被列為最主要受AI能力影響的職業。
比爾蓋茨表示,人類已經準備好處理人工智能帶來的重大風險。盡管他無法回答人工智能可能導致的滅絕威脅,但他對能夠應對人工智能帶來的風險持樂觀態度。
5.騰訊張立軍:游戲已成為推動芯片、AI等技術發展的強大驅動力
騰訊公司副總裁、華東總部總經理張立軍表示,在過去半個多世紀里,游戲與前沿科技一直處于一種緊密的共生關系之中。在用戶不斷提升的體驗需求驅動下,游戲總能及時地擁抱和應用最前沿的科技成果,反過來,游戲也成為推動芯片、AI 等技術發展的強大驅動力。
AI是當今好萊塢正在關注的一個話題,推動人工智能的技術確實很了不起,但根據迪士尼吉祥物米老鼠的配音演員艾萬的觀點,它永遠無法捕捉米奇老鼠的精髓。艾萬表示:“天哪,我得說,當然有許多令人驚嘆的AI技術正在發展,非常令人印象深刻。但是我不認為任何東西能夠取代角色的核心。”
Part4深度
1.GPT-4被曝“變蠢” OpenAI 偷偷搞“小動作”?
近期,有用戶在 OpenAI 的在線開發者論壇中反映,GPT-4的質量似乎有所下降,變得更 “蠢” 了。用戶指出,GPT-4在長篇內容的分析和創作上退步明顯,并且寫作質量下降。一些開發者也表示,GPT-4在邏輯能力、編碼能力等方面都出現了問題,出現了循環輸出代碼、錯誤響應等情況。有專家猜測,OpenAI 可能在創建一些較小的 GPT-4模型,這些模型類似于大型模型,但運行成本較低。
AI 在內容平臺上的大規模應用。知乎、百家號、網易號等平臺都推出了 AI 輔助創作的功能,包括 AI 筆記、AI 大綱、AI 標題等。這些 AI 工具能夠幫助創作者提高創作效率,擴大內容池。然而,AIGC 的泛濫也帶來了一些風險,如內容質量的下降和對人工創作者的沖擊。平臺和創作者都需要借助 AI 的力量不斷學習和進步,以適應這個時代的變化。
3.大模型加速涌向移動端!ControlNet手機出圖只需12秒
隨著大模型技術的發展,移動應用的人機交互方式正發生革命性變化。高通公司在 CVPR2023上展示了搭載15億參數的 ControlNet 模型在手機端的運行,僅需不到12秒就能完成出圖。高通 AI 負責人 Ziad Asghar 表示,將10億 + 參數的大模型部署到手機只需要不到一個月的時間。大模型的出現將使終端設備上的數字助手能夠通過自然語言指令完成各種操作,實現個性化的用戶體驗。通過量化、編譯和硬件加速優化等技術,大模型在終端側的部署變得更加容易。這一變革不僅限于手機,而是將重塑包括筆記本電腦、汽車、物聯網等終端設備上的所有移動應用。高通將領導這場變革,并成為推動大模型落地的核心。
4.ChatGPT最強競品Claude2重磅升級 第一手實測在此
Anthropic 發布了 Claude2,被稱為 GPT-4最強競品,免費且不需要排隊即可使用。用戶可以通過郵箱注冊登錄,并享受比 GPT-4便宜4-5倍的價格。Claude2支持上傳和分析長文檔,可以提取摘要并回答相關問題。用戶可以構建自己的知識庫,實現更高效的學習和研究。此外,Claude2還有代碼解釋器和小學數學能力,對于程序員和學生來說非常實用。
ChatGPT 的受歡迎程度正在下降,網站流量出現負增長。受歡迎程度的下降也對股市產生了影響,許多人工智能概念股都出現了大幅下跌。然而,有跡象表明大型語言模型正在轉向 B2B 市場,OpenAI 開放了 GPT-4API,百度和阿里巴巴等其他公司專注于為 B2B 應用程序開發大型模型。盡管 ChatGPT 的受歡迎程度有所下降,但更多殺手級應用程序正在開發中。
文章討論了人工智能開發中對情商 (EQ) 的日益關注及其潛在應用。它提到了諸如Character.ai和Inflection AI的Pi之類的例子,它們優先考慮EQ以提供與用戶更加個性化和同理心的互動。文章強調了情感人工智能的獨特優勢,包括其理解人類情感和社交互動的能力。像 Westlake Mindworks 這樣的公司,這些公司正在致力于開發具有長期記憶和高級情緒分析功能的人工智能。