每周AI大事件 | 人臉識別管理新規(guī)發(fā)布、英偉達推AI超級芯片GH200、ChatGPT自定義指令開放
歡迎來到微新創(chuàng)想的[每周AI大事件],這里記錄了過去一周值得關注的AI領域熱點內(nèi)容,幫助大家更好地了解人工智能領域的動態(tài)和發(fā)展風向。
Part1動態(tài)
[國內(nèi)要聞]
百度網(wǎng)盤推出了基于大模型的智能助理 “云一朵”,該助理可以幫助用戶快速搜索文件和視頻、總結知識、翻譯文檔等。它還能自動分析文檔并返回中文結果,快速查找圖片,并為視頻添加字幕和提取標題。這款智能助理基于百度網(wǎng)盤的大模型產(chǎn)品文心一言,旨在重塑網(wǎng)盤市場的新格局。
百度飛槳團隊推出基于文心大模型的通用圖像關鍵信息抽取工具 PP-ChatOCR。該工具結合了 OCR 文字識別和大模型技術,能夠在多種場景下提取圖像中的關鍵信息。使用 PP-ChatOCR 可以快速搭建通用的圖像關鍵信息抽取系統(tǒng),降低開發(fā)成本。
張勇表示,阿里云正在把促進大模型的生態(tài)繁榮作為首要目標,積極發(fā)展大模型的開源社區(qū)。目前,魔搭社區(qū)集聚了200多萬AI開發(fā)者、1000多個優(yōu)質(zhì)AI模型,模型累計下載總量超過4500萬。
昆侖萬維旗下子公司天工科技與 Meta 簽訂了一項合作協(xié)議,合作開發(fā)適用于 Meta Quest2及其迭代設備上的 StarMaker VR 版本。一旦開發(fā)獲得 Meta 的通過,StarMaker VR 版本將在 Oculus 官方商店上線,實現(xiàn)昆侖萬維在元宇宙領域的商業(yè)化突破。
5.清華團隊 AI 創(chuàng)企 “生數(shù)科技” 完成數(shù)千萬元天使 + 輪融資
北京生數(shù)科技有限公司完成了數(shù)千萬元天使輪融資,資金將用于算法研發(fā)、產(chǎn)品開發(fā)和團隊擴充。生數(shù)科技是生成式人工智能基礎設施及應用提供商,已實現(xiàn)了百億數(shù)據(jù)、數(shù)十億參數(shù)規(guī)模的模型內(nèi)測,并在多種模態(tài)任務中實現(xiàn)了國際領先的效果。
6.周鴻祎宣布360安全大模型將發(fā)布 已在內(nèi)部落地應用
360創(chuàng)始人周鴻祎宣布360安全大模型將發(fā)布,并已在內(nèi)部應用中落地。360安全大模型圍繞數(shù)字安全開展,已與360數(shù)字人結合應用于安全態(tài)勢分析和安全趨勢講解等實際業(yè)務中。
歐愛運營有限責任公司(OPENAI OPCO, LLC)近日在中國申請注冊2枚 “GPT-5” 商標,國際分類包括科學儀器、網(wǎng)站服務。
快手公布了他們在大型模型方面的最新進展。他們展示了一種全模態(tài)、大模型的 AIGC 解決方案,該解決方案基于他們自主研發(fā)的基座大模型,提供了文本生成、圖像生成、3D 生成、音樂生成以及視頻生成等技術能力。此外,他們還公布了數(shù)字人產(chǎn)品 “快手智播”。
9.閱文集團:推出大語言模型應用產(chǎn)品 “作家助手妙筆版”
閱文集團在上半年實現(xiàn)了32.8億元的收入,雖然同比下降了19.7%,但歸母凈利潤卻增長了64.8%。閱文集團表示,在2023年,他們看到了 AI 技術取得關鍵性突破的機遇,并推出了大型語言模型應用產(chǎn)品 “作家助手妙筆版”,為作家提供創(chuàng)作輔助和數(shù)據(jù)運營等服務。
B 站關聯(lián)公司上海幻電信息科技有限公司申請注冊 “bilibiliAI” 商標,該公司成立于2013年5月,經(jīng)營范圍包括企業(yè)形象策劃、動漫游戲開發(fā)、專業(yè)設計服務、信息咨詢服務等。
11.小米應用商店:AI 繪畫等深度合成服務需提供資質(zhì)
小米應用商店發(fā)布了關于深度合成服務資質(zhì)的要求,要求提供 AI 繪畫等深度合成服務的開發(fā)者提供相應的資質(zhì),包括互聯(lián)網(wǎng)信息服務算法備案、安全評估報告、全國互聯(lián)網(wǎng)安全管理服務平臺審批通過的截圖、軟件著作權證書或 APP 電子版權證書、ICP 證或 ICP 備案等。這一要求將于2023年8月15日正式生效實施。
12.薇婭公司發(fā)布 AI 數(shù)字人直播業(yè)務 直播成本降至數(shù)千元
薇婭公司旗下子公司謙語智能和羚客發(fā)布了 AI 數(shù)字人直播業(yè)務和一站式 AI 智能直播綜合平臺。謙語智能 CEO 陶亞表示,傳統(tǒng)的品牌直播間每月需要投入15-25萬元,而借助 AI 數(shù)字人直播,品牌方只需投入數(shù)千元,而且數(shù)據(jù)效果甚至優(yōu)于真人直播。
13.美圖旗下美顏相機推出 “AI 人像精修” 專區(qū) 涵蓋6大 AI 人像功能
美圖旗下美顏相機推出 “AI 人像精修” 專區(qū),該專區(qū)涵蓋了6大 AI 人像功能,包括 AI 去雙下巴、AI 表情、AI 換背景、AI 一鍵美顏、AI 頭發(fā)、AI 路人消除。這些功能針對用戶在日常生活中的痛點,旨在提供更好的人像拍照體驗。
14.字節(jié)跳動旗下飛書 AI 助手 “MY AI” 或?qū)⒂诮衲?月發(fā)布
核心要點總結:字節(jié)跳動旗下的飛書計劃于今年9月正式發(fā)布 AI 助手 “MY AI”。該智能 AI 助手將包括自動匯總會議紀要、創(chuàng)建報告、優(yōu)化和續(xù)寫文字內(nèi)容等功能。在飛書 app 中,MY AI 還可以通過對話形式,幫助用戶自動創(chuàng)建日程、搜索公司內(nèi)部知識庫等。該產(chǎn)品功能目前還在推進中,具體的公測及上線時間尚未確定。
中國電信在2023半年度業(yè)績會上公布了上半年的財務數(shù)據(jù),營收和凈利潤同比增長。董事長兼首席執(zhí)行官柯瑞文表示,中國電信將在通用大模型領域繼續(xù)取得新成果。他強調(diào)了通用大模型的重要性,指出最近發(fā)布的 TeleChat 是真正意義上的大模型。
16.王小川旗下百川智能 Baichuan-53B 大模型開啟內(nèi)測
百川智能發(fā)布了新一代大模型 Baichuan-53B,這是繼 baichuan-7B 和 baichuan-13B 之后的第三款大模型產(chǎn)品。Baichuan-53B 在知識問答、文學創(chuàng)作等方面表現(xiàn)優(yōu)異,展現(xiàn)出強大的商業(yè)文案創(chuàng)作、文學創(chuàng)作和中文理解能力。https://chat.baichuan-ai.com/home。
根據(jù)《人臉識別技術應用安全管理規(guī)定》,使用人臉識別技術需遵守法律法規(guī),只有在具有特定目的和充分必要性,并采取嚴格保護措施的情況下方可使用。同時,在公共場所使用人臉識別技術,或者存儲超過1萬人的人臉信息,需在30個工作日內(nèi)備案。規(guī)定還要求對人臉信息進行個人信息保護影響評估,并限制保存人臉原始圖像。此舉旨在規(guī)范人臉識別技術應用,保護個人信息權益及公共安全。
18.網(wǎng)易申請 “網(wǎng)易玉言” 大模型商標
網(wǎng)易申請注冊商標 “網(wǎng)易玉言”,該商標與網(wǎng)易伏羲實驗室推出的中文預訓練大模型相關。該大模型擁有110億參數(shù),由深層 Encoder 和淺層 Decoder 組成。目前,“玉言” 大模型已在網(wǎng)易集團內(nèi)的文字游戲、智能 NPC、文本輔助創(chuàng)作等業(yè)務場景取得了顯著的業(yè)務效果。
19.成都上半年人工智能產(chǎn)業(yè)規(guī)模達424億元 同比增長36.9%
成都市政府官網(wǎng)發(fā)布消息,成都布局人工智能產(chǎn)業(yè)由來已久,2022年全市人工智能產(chǎn)業(yè)規(guī)模為616億元,位列全國第7,產(chǎn)業(yè)增速位居全國第1,綜合實力排名全國第6。今年上半年產(chǎn)業(yè)規(guī)模達424億元,同比增長36.9%。
智源發(fā)布了最強開源可商用的中英文語義向量模型 BGE(BAAI General Embedding),其在中英文語義檢索精度和整體語義表征能力上均超過了社區(qū)中的其他同類模型。BGE 保持了同等參數(shù)量級模型中的最小向量維度,使用成本更低。C-MTEB 評測結果顯示,BGE 中文模型在檢索能力上領先于 OpenAI 的 Text Embedding002。
21.元象開源多語言大模型 XVERSE-13B 可免費商用
元象 XVERSE 公司開源了 XVERSE-13B,這是一個支持多語言的大語言模型,擁有百億參數(shù)。XVERSE-13B 可以用于文本生成、自動化寫作、數(shù)據(jù)分析和知識問答等方面。該模型采用了標準 Transformer 網(wǎng)絡結構,支持8K 的上下文長度,是同尺寸模型中最長的,適用于多輪對話、知識問答和摘要等多種需求。
根據(jù)天眼查 App 的信息顯示,美團旗下的天津三快科技有限公司已全資入股王慧文創(chuàng)辦的 AI 公司光年之外。光年之外成立于2018年,主要經(jīng)營技術服務和產(chǎn)品銷售等領域。
[國際要聞]
微軟研究院、香港大學和 SmartMore 的研究人員合作推出了一種名為 LISA(Large Language Instructed Segmentation Assistant)的大型語言模型分割推理助手。LISA 能夠通過復雜的查詢文本生成分割掩碼,具備復雜推理、世界知識、解釋性回答和多對話的能力。
2.蘋果正在開發(fā)自己的文本生成器 暫定名為 Apple GPT
根據(jù)報道,蘋果正在開發(fā)自己的文本生成器 Apple GPT,表明了對人工智能技術的興趣。蘋果正在與 OpenAI、亞馬遜和英偉達進行語言模型的測試,選擇富士康作為專用服務器的供應商。
3.英偉達為 GH200超級芯片帶來 HBM3e 解決生成式人工智能瓶頸
英偉達宣布對 GH200超級芯片進行了提升,加入了更強大的內(nèi)存功能。新版本的 GH200預計將于2024年第二季度開始生產(chǎn),并配備更快速的 HBM3e 處理器,可以滿足不斷增長的 AI 模型對內(nèi)存的需求。GH200還可以通過 NVIDIA NVLink 與其他 Superchip 連接,部署用于生成式人工智能的巨型模型。
4.英偉達 L40S GPU 將于今秋上市:AI 推理性能比 A100高1.2倍
英偉達最近發(fā)布了全新的 NVIDIA L40S GPU 和搭載該加速卡的 NVIDIA OVX 服務器系統(tǒng)。L40S GPU 是 L40的升級版,具備48GB GDDR6ECC 顯存,基于 Ada Lovelace 架構,包含第四代 Tensor Core 和 FP8轉(zhuǎn)換引擎,性能是上一代 GPU 的5倍。
5.OpenAI 宣布 ChatGPT 所有用戶已可使用自定義指令功能
OpenAI 宣布,現(xiàn)在所有 ChatGPT 用戶可以在歐盟和英國以外地區(qū)通過免費計劃使用自定義指令(Custom instructions)功能。這項功能允許用戶在每次對話中提供自定義請求或上下文,避免了重復進行調(diào)教的麻煩。
6.英偉達 AI Workbench 讓任何人都可以訓練生成式 AI 模型
英偉達推出了 AI Workbench,旨在使生成式人工智能的創(chuàng)建更加簡單和可管理。該工具允許開發(fā)者在英偉達的 AI 平臺上開發(fā)和部署各種模型,包括個人電腦和工作站。AI Workbench 提供了數(shù)十萬個預訓練模型供開發(fā)者使用,并簡化了定制這些模型的過程。
谷歌在其搜索平臺上引入了一個語法檢查器,通過 AI 技術分析短語和句子的構造,提供有用的建議。用戶可以通過輸入短語 “語法檢查”、“檢查語法” 或 “語法檢查器” 來激活該功能。當檢測到錯誤時,該語法檢查器會對句子進行更正,并突出顯示所做的修改。目前該工具在英文中可用,但不會檢查違反搜索政策的內(nèi)容。
8.亞馬遜平臺涌現(xiàn)大量 AI 生成的虛假旅行指南
亞馬遜平臺上出現(xiàn)了大量由人工智能生成的虛假旅行指南,聲稱是由著名作家撰寫。這些指南通常包含通用的旅行信息,價格低廉,并且?guī)в刑摷俚奈逍羌壴u論。
9.微軟宣布人工智能 Bing Chat 即將登陸第三方瀏覽器
微軟宣布其人工智能聊天機器人 Bing Chat 將很快在第三方瀏覽器上推出,包括 Web 和移動設備。這將使 Bing Chat 能夠在除了微軟平臺之外的其他平臺上進行競爭。雖然 Bing Chat 將在所有第三方瀏覽器上提供支持,但在微軟自家的 Edge 瀏覽器中將獲得最佳體驗。
10.網(wǎng)站可以阻止 OpenAI 網(wǎng)絡爬蟲 避免數(shù)據(jù)用于訓練 GPT 模型
OpenAI 現(xiàn)在允許網(wǎng)站屏蔽其網(wǎng)絡爬蟲,以幫助網(wǎng)站運營商防止其內(nèi)容被用于訓練 GPT 模型。網(wǎng)站可以通過在其 Robots.txt 文件中明確禁止 GPTBot 爬蟲程序的出現(xiàn),或者阻止其 IP 地址來實現(xiàn)屏蔽。
11.Zoom:其生成式 AI 工具不會擅自收集數(shù)據(jù)訓練
Zoom 更新了其服務條款,明確表示不會在未經(jīng)用戶同意的情況下使用用戶的音頻、視頻或聊天內(nèi)容來訓練其人工智能模型。雖然之前的政策中存在一些模糊性,但這次的更新為用戶提供了更加明確的保證。Zoom 在之前因關于以用戶數(shù)據(jù)訓練人工智能的政策引發(fā)爭議,而在本次更新后做出了澄清和承諾。
OpenAI Inc. 對一家擁有域名 www.open.ai 名為 “開放人工智能” 的公司提起了訴訟,指控其侵犯了 OpenAI 的商標并導致消費者混淆。OpenAI 稱開放人工智能公司及其總裁誤導消費者,讓他們誤認為兩家公司有關聯(lián)。
13.微軟 Edge新功能:Bing AI 幫你以不同風格重寫文本
微軟更新了桌面版 Microsoft Edge 瀏覽器,新增了使用 Bing AI 重寫文本的功能。用戶可以選擇不同的語氣、格式和長度來重寫文本,并通過 Bing AI 生成結果。這個功能在移動設備上的 SwiftKey 鍵盤應用中已經(jīng)引入。這個功能可以幫助用戶修改和改寫文本內(nèi)容,提供了一種方便快捷的方式。
14.微軟 Windows 停止支持 Cortana 并專注于生成式 AI
微軟宣布8月將停止支持 Windows 上的 Cortana,并將其重心轉(zhuǎn)向生成式 AI。Cortana 將不再作為獨立應用程序存在,但在 Outlook Mobile、Teams Mobile 和 Microsoft Teams 等應用中仍將提供支持。微軟計劃在 Windows11中引入新的 AI 功能,如語音訪問和 AI 驅(qū)動的 Bing。該決定反映了微軟對生成式 AI 的重視,他們希望通過創(chuàng)新和利用 AI 技術來改善服務并保持競爭優(yōu)勢。
蘋果正大力投資和研發(fā)人工智能應用,引發(fā)了對 AI 服務器和數(shù)據(jù)中心需求的增加。鴻海集團成為蘋果的獨家授權生產(chǎn) AI 服務器的供應商,并通過越南工廠出口,成為首家受益于蘋果 AI 商機的廠商。鴻海在全球服務器市場占據(jù)領先地位,與蘋果有多年的合作關系,成為蘋果的首選合作伙伴。
16.Brave 發(fā)布注重隱私保護圖像和視頻搜索功能
Brave 網(wǎng)絡瀏覽器的開發(fā)商 Brave Software 為了減少對「大型科技」競爭對手的依賴,該公司調(diào)整了其搜索引擎,使其能夠使用自己的圖像和視頻索引。該公司表示,Brave Search 的圖像和視頻結果將從其自己的索引中獲取。近年來,谷歌搜索因人工智能內(nèi)容生成導致搜索結果變得更糟。
17.OpenAI 將 GPT-4設置 ChatGPT Plus付費用戶的默認模型
OpenAI 最近為 ChatGPT 引入了幾個新功能,包括示例提示、建議回復和后續(xù)問題。另外,OpenAI 將 GPT-4設置為 ChatGPT Plus 付費用戶的默認模型,以提供更順暢、便利的體驗。用戶不再需要手動切換到最新或最先進的公開可用模型。
Part2產(chǎn)品
1.AI 編程工具 Replit Ghostwriter 開發(fā)者工具箱中的完美助手
Ghostwriter 是一款 AI 輔助工具,旨在幫助開發(fā)者更快速、高效地編寫代碼。它能夠自動化重復性的編碼任務,讓開發(fā)者專注于實現(xiàn)創(chuàng)意。Ghostwriter 支持16種語言,在 JavaScript 和 Python 上表現(xiàn)最好,可以自動補全代碼、解釋不懂的代碼、重構代碼等。Ghostwriter 在10天內(nèi)訓練出了一個大型編碼模型,可以識別20種語言。
2.有趣!這個 AI 模型可根據(jù) iPhone 照片生成詩歌
Pamera 是一款結合物體識別技術和 GPT-4模型的應用程序,可以根據(jù) iPhone 用戶的照片快速生成詩歌。這款應用程序以阿根廷作家博爾赫斯的風格生成詩歌,融合了超現(xiàn)實主義和神秘主義元素。
3.谷歌推出新工具 Poem Postcards 可讓人工智能生成詩歌明信片
谷歌推出了一種新工具 Poem Postcards,允許用戶根據(jù)藝術作品和主題選擇創(chuàng)建由人工智能生成的詩歌明信片。用戶可以從各種類型的詩歌中選擇生成的詩歌,AI 會根據(jù)用戶輸入的主題和封面畫作生成詩歌內(nèi)容。
4.AI 創(chuàng)意生成器 MemeCam:自動為圖片加上含梗量爆棚的文字
核心要點總結:MemeCam 是一款基于人工智能技術的創(chuàng)意生成器,旨在幫助用戶快速生成有趣的網(wǎng)絡梗圖。用戶可以通過上傳圖片或使用相機拍攝,MemeCam 利用 AI 算法進行圖像識別和語義理解,自動生成搞笑的文字和貼紙。用戶還可以對生成的文字和貼紙進行個性化編輯,包括字體、顏色和大小等。生成的 meme 圖片可以隨時預覽和保存,方便分享到社交媒體平臺或發(fā)送給朋友。
5.Stability AI 推代碼生成開源語言模型 StableCode
Stability AI 發(fā)布了開源語言模型 StableCode,用于代碼生成,支持多種編程語言。StableCode 有4K 和16K 版本,16K 版本的大上下文窗口對新手程序員特別有用。該模型通過指令模型和具體應用示例進行改進,用于解決復雜的編程任務。StableCode 提供了4K 和16K 兩個版本,更大的上下文窗口允許模型一次查看更多代碼來解決任務,從而可能生成更好的代碼。
6.比 Stable Diffusion 中文理解能力更強、更懂國人的文生圖模型是如何構建的?
該文介紹了網(wǎng)易伏羲基于原生中文語料數(shù)據(jù)及自有高質(zhì)量圖片數(shù)據(jù)構建的文生圖模型 “丹青”,并且解釋了丹青模型相較于其他文生圖模型的差異化優(yōu)勢在于對中文的理解能力更強,能更準確地理解和生成中華傳統(tǒng)美食、成語、俗語、詩句。丹青模型的構建主要包括建設高質(zhì)量的中文數(shù)據(jù)集、構建中文領域的優(yōu)質(zhì)理解模型、重構圖文生成算法以及引入專家和人類的反饋。
7.清華系面壁智能給大模型接入16000+ 真實 API,開源 ToolLLM 效果直逼 ChatGPT
面壁智能聯(lián)合來自清華大學、耶魯大學、人大、騰訊和知乎的研究人員推出了 ToolLLM 工具學習框架,加入了 OpenBMB 大模型工具體系。該框架解決了大型語言模型在使用外部工具(API)時的限制問題。作者構建了 ToolBench 數(shù)據(jù)集,其中包含16464個真實世界 API,該數(shù)據(jù)集可用于訓練模型。通過 ToolLLM 框架,可以提高開源語言模型在各種工具使用場景下的推理能力。作者還開發(fā)了 ToolEval 自動評估工具,評估了 ToolLLaMA 模型的工具使用能力。實驗結果顯示,ToolLLaMA 在 pass rate 和 win rate 方面表現(xiàn)優(yōu)于傳統(tǒng)方法,且在與 ChatGPT 相比中具有接近的性能。
8.RODES:超強 ChatGPT 提示詞框架 輕松搞定高質(zhì)量 AI 提示詞
本文介紹了一個名為 RODES 的提示詞框架,旨在幫助人們編寫高質(zhì)量的 AI 提示詞。RODES 框架基于帕累托原則,著重于關鍵要素,包括角色、目標、詳細信息、示例和感知檢查。
9.Lalamu Studio:用 AI 輕松創(chuàng)作對口型視頻
Lalamu Studio 是一款基于人工智能技術的創(chuàng)新軟件,通過使用 AI 輕松地創(chuàng)作口型同步視頻。用戶可以上傳視頻文件或使用內(nèi)置模板開始創(chuàng)作,并利用先進的人工智能算法自動調(diào)整嘴部動作以確保與音頻完美匹配。軟件還支持用戶上傳自己的音頻文件進行匹配,并提供了文本轉(zhuǎn)語音的功能,實現(xiàn)文本與口型的同步。
10.視頻也可以刪背景了!這款 AI 工具 Unscreen 可一鍵去除背景
Unscreen 是一款 AI 自動刪除視頻背景工具,可以幫你將視頻和 GIF 中的背景去除。該工具支持多種格式,無需手動操作即可自動分析和去除背景。不過,免費額度有限,注冊用戶可以無限剪輯視頻但無法導出,訂閱價格為4.99美元 / 分鐘。
11.代碼智能轉(zhuǎn)換工具 AI Code Convert 還可將自然語言轉(zhuǎn)換成代碼
AI Code Convert 是一個 AI 代碼翻譯工具,可以將代碼或自然語言轉(zhuǎn)換為編程語言。它利用人工智能技術,提供代碼轉(zhuǎn)換和自然語言轉(zhuǎn)換的功能。用戶可以將代碼從一種編程語言轉(zhuǎn)換成另一種,如從 Python 到 JavaScript,從 C++ 到 Java。此外,AI Code Convert 還可以將自然語言描述的需求轉(zhuǎn)換成代碼,提高開發(fā)效率。
神采 PromeAI 是一款功能強大的 AI 驅(qū)動設計助手,擁有豐富的可控制 AIGC 模型風格庫,能夠輕松創(chuàng)建令人驚嘆的 AI 藝術、圖像、圖形、視頻和動畫。該工具適用于業(yè)余愛好者、建筑師、室內(nèi)設計師、產(chǎn)品設計師以及游戲 / 動畫設計師等。其核心功能包括草圖渲染、照片轉(zhuǎn)線稿、涂抹替換、變化重繪、AI 超模、背景生成、尺寸外擴、文字效果和聊天機器人等。
Part3觀點
IBM 的研究表明,通過欺騙大型語言模型如 GPT-4,可以輕松生成惡意代碼或提供虛假安全建議。研究人員發(fā)現(xiàn),只需要英語基礎知識和對模型訓練數(shù)據(jù)的一些背景知識就能輕松欺騙 AI 聊天機器人。研究人員創(chuàng)建了一種游戲模式,讓用戶無法退出,從而讓機器人繼續(xù)提供虛假信息或生成惡意代碼。
2.Gartner 調(diào)查顯示,生成式 AI 已成為企業(yè)面臨的新興風險
根據(jù) Gartner 的調(diào)查,生成式 AI 的大規(guī)模可用性已成為企業(yè)風險管理人員最關注的問題之一。生成式 AI 帶來的潛在風險包括知識產(chǎn)權、數(shù)據(jù)隱私和網(wǎng)絡安全問題。
3.周鴻祎:發(fā)力垂直大模型走進千家萬戶 才能產(chǎn)生真正的價值
周鴻祎表示,他認為通用大模型在應用層面還有局限性,我們應該發(fā)力讓垂直大模型走進千家萬戶,這才能產(chǎn)生真正的價值。他還提出了 “安全即服務” 的概念,并發(fā)布了 “360安全云”。
4.經(jīng)濟學家預測未來幾年將有2000億美元投資于人工智能
高盛經(jīng)濟學家預測到2025年,全球?qū)θ斯ぶ悄芗夹g的投資可能達到約2000億美元,其中美國的投資可能達到1000億美元。預計人工智能將為工人帶來大幅提升的生產(chǎn)力,每年生產(chǎn)力可能提高1.5個百分點。
亞馬遜云服務(AWS)首席執(zhí)行官亞當?塞利普斯基表示,人工智能 (AI) 與云計算密不可分,沒有云就沒有 AI。目前只有10% 的潛在客戶已經(jīng)轉(zhuǎn)向了云計算,云計算市場還有巨大的增長空間。
6.王小川談王慧文做大模型:沒有技術背景做大模型壓力會大很多
王小川表示,做大模型比做搜索引擎時成就感更大,他認為自己更適合做大模型。他指出,做大模型需要大量的技術決策,沒有技術背景會面臨更大的壓力。然而,如果具備足夠的技術能力,做大模型反而是一件愉悅的事情。
7.專家稱:OpenAI 等 AI 公司尚未準備好進行首次公開募股
雖然 AI 公司在 IPO 市場興起,但專家表示,人工智能公司需要建立更多收入、證明盈利能力,并超越風險投資所帶來的價值。對于初創(chuàng)公司來說,首次公開募股可能為時過早,更有可能被大公司收購。科技公司一般需要有大約1億美元的收入,并且至少已經(jīng)運營10年才能準備上市。
8.全球75% 的組織計劃在工作設備上禁止 ChatGPT 和生成式 AI 應用
根據(jù) BlackBerry 發(fā)布的新調(diào)查,全球75% 的組織正在實施或考慮禁止 ChatGPT 和其他生成式 AI 應用在工作設備上的使用。禁令主要是出于對數(shù)據(jù)安全、隱私和企業(yè)聲譽的風險的考慮。
根據(jù)普渡大學的研究,OpenAI 的聊天機器人 ChatGPT 在軟件編程問題上的準確率不到五成。研究分析了 ChatGPT 對517個 Stack Overflow 的問題的回答,發(fā)現(xiàn)52% 的答案是錯誤的,77% 的答案是冗長的。盡管答案經(jīng)常錯誤,但由于 ChatGPT 的全面性和清晰的語言風格,仍然具有欺騙性。
10.亞馬遜云科技生成式 AI 全球副總裁:人工智能炒作周期還未達頂峰
亞馬遜云科技生成式 AI 全球副總裁 Vasi Philomin 表示,雖然人工智能存在炒作周期,但互聯(lián)網(wǎng)已經(jīng)對每個人的生活產(chǎn)生了巨大影響。他認為生成式人工智能將改變各行業(yè)的每個企業(yè),但需要時間。根據(jù)最新數(shù)據(jù),全球基礎設施服務市場在2022年增長了29.7%,亞馬遜以481億美元的收入和40% 的市場份額繼續(xù)領導全球市場。
11.研究發(fā)現(xiàn):大語言模型通過閱讀文檔學會使用工具
根據(jù)一項新的研究論文,語言模型可以通過閱讀工具和 API 文檔來學習使用工具,并在某些情況下甚至發(fā)明新的方法。與傳統(tǒng)的通過演示訓練的方法相比,僅使用文檔的模型在零樣本性能上表現(xiàn)相當或更好。研究團隊使用文檔和演示對多個模型進行了訓練,并發(fā)現(xiàn)僅使用文檔的模型在零樣本性能上與僅使用演示的模型相當甚至更好。
12.研究發(fā)現(xiàn):四分之一聽眾無法分辨出 AI 深度偽造語音
根據(jù)倫敦大學學院的研究發(fā)現(xiàn),人類只能在73% 的時間內(nèi)檢測到深度偽造語音,無論是英語還是普通話的聽眾識別準確率都是一樣的。研究人員生成了50個英語和普通話的深度偽造語音樣本,并向529名參與者播放,發(fā)現(xiàn)約四分之一的聽眾無法分辨出深度偽造的語音。
Part4深度
英偉達是 AI 芯片市場的中心,但目前面臨著43萬張芯片缺口的問題。其最新推出的 GH200超級 AI 芯片,配備了世界上第一款 HBM3e 內(nèi)存,提高了 AI 模型的運行速度。然而,由于合作伙伴 SK 海力士的產(chǎn)能問題,GH200的供應仍然存在不確定性。
2.拒絕007,AI 進軍直播界?美國游戲圈 UP 主正在利用 AI 取代自己
YouTube 游戲創(chuàng)作者 Kwebbelkop 遇到了關鍵人物問題,他無法度假或擁有屬于自己的時間,一旦他不出現(xiàn)在鏡頭前,他的視頻事業(yè)就會停滯不前。為了解決這個問題,Kwebbelkop 開始研究利用人工智能來取代自己的創(chuàng)作過程。他開發(fā)了一系列人工智能工具,包括能夠根據(jù) up 主的相似度進行訓練并創(chuàng)建新內(nèi)容的 AI 工具,以及通過簡單指令來簡化創(chuàng)作行為的工具。
3.《西部世界》真來了!斯坦福爆火「小鎮(zhèn)」開源,25個 AI 智能體戀愛交友
斯坦福25個 AI 智能體「小鎮(zhèn)」終于開源了,GitHub 狂攬1.4k 星,《西部世界》即將走進現(xiàn)實。這個虛擬城鎮(zhèn)中的25個 AI 智能體不僅能在這里上班、閑聊、社交、交友,甚至還能談戀愛,每個 Agent 都有自己的個性和背景故事。該項目的開源將為游戲領域帶來無限可能性,同時也引發(fā)了人們對于 AI 智能體的未來發(fā)展的討論。
有論文指出,盡管 GPT-4有顯著改進,但其推理能力仍然存疑。論文討論了推理的本質(zhì),并通過對 GPT-4的21個推理問題進行測試,得出結論 GPT-4在推理方面仍然存在內(nèi)在的不一致性和缺乏理解基礎性概念的問題。這一看法得到一些 AI 學者的認同,認為距離通用人工智能還有很長的距離。然而,也有人對這一觀點提出質(zhì)疑,認為作者在選擇模型和 Prompt 時存在問題。
5.AIGC 進入 iPhone 時刻!Hugging Face 接入最強超算,神秘顯卡勝過 A100
英偉達在 SIGGRAPH 會議上推出了一系列重磅更新,包括下一代 GH200超級芯片平臺、RTX 工作站、OVX 服務器等。GH200平臺具有連接多個 GPU 的能力,能處理復雜的生成式工作負載。RTX 工作站推出了四款新品,包括性能最強的 RTX6000。OVX 服務器搭載 L40S GPU,性能超過 A100。此外,英偉達還發(fā)布了 AI Workbench 和 ChatUSD 等工具,提供定制生成式 AI 應用的支持。同時,Hugging Face 接入英偉達超算,加速 AI 模型的訓練和微調(diào)。
美團以20.65億元全資收購了大模型創(chuàng)業(yè)公司光年之外,并將光年之外的全資股東變更為美團旗下天津三快科技有限公司。此舉可以讓美團更快切入大模型領域,降低自身在 AI 方面的研發(fā)成本和投資風險。光年之外作為一家備受看好的大模型公司,此前已完成了一輪融資,投前估值達到10億美元。美團入股光年之外,將為其在大模型領域的發(fā)展提供更多的人才和資金支持。同時,美團也投資了其他大模型公司,表明其對于 AI 領域的興趣和投資意向。
7.沸騰251天,訪談近百位從業(yè)者,關于大模型世界的5個現(xiàn)狀
大模型在商業(yè)世界的發(fā)展現(xiàn)狀涵蓋了巨頭的戰(zhàn)略布局、中間層的繁榮和開源項目的崛起。谷歌、蘋果、微軟和亞馬遜等巨頭都在利用大模型來鞏固自己在行業(yè)中的地位,各自追求不同的目標。中間層的公司如 Databricks 和 Scale AI 則發(fā)揮著關鍵的作用,將大模型應用到實際的商業(yè)場景中。
8.華為天才少年大模型創(chuàng)業(yè),原職級 P20,現(xiàn)主攻 AI 公文寫作
華為天才少年李博杰離職創(chuàng)業(yè),專注于大模型領域。李博杰曾是華為2012實驗室成員,職級為 P20。他的精力將聚焦于 AIGC 應用落地,主攻 AI 公文寫作和心理咨詢。李博杰在華為的職業(yè)生涯發(fā)展迅速,曾擔任助理首席專家。他表示離開華為是為了在大模型創(chuàng)業(yè)領域做出貢獻,認為在大公司中做螺絲釘無法有太大激勵,而自己是一只無法被關住的鳥兒。他希望知行合一,奔向大模型領域的創(chuàng)業(yè)道路。
AIGC(AI 生成內(nèi)容)技術在各個領域的應用正在迅速發(fā)展。在內(nèi)容創(chuàng)作方面,AIGC 可以幫助創(chuàng)作者捕捉靈感,提高創(chuàng)作效率,并解決創(chuàng)作者在素材積累方面的難題。然而,AIGC 也引發(fā)了一些爭議,擔心過于依賴 AI 技術會降低創(chuàng)作者的獨立思考和原創(chuàng)價值。在企業(yè)管理方面,AIGC 可以提高流程設計效率、優(yōu)化辦公協(xié)同過程,并降低人為錯誤。在品牌營銷方面,AIGC 可以提升個性化廣告投放和虛擬試妝體驗。
大模型技術成為近一年來最熱門的技術之一,引發(fā)了互聯(lián)網(wǎng)和科技公司的競爭。然而,智能手機廠商在大模型領域相對較為安靜。華為和小米等互聯(lián)網(wǎng)手機公司積極擁抱大模型,但以智能手機業(yè)務為主要收入來源的廠商對大模型的興趣較低。智能手機廠商面臨算力和數(shù)據(jù)方面的短板,缺乏足夠的資源來打造具有競爭力的大模型產(chǎn)品。然而,上游產(chǎn)業(yè)鏈的企業(yè)如高通和谷歌已經(jīng)開始推出支持大模型的技術,未來智能手機廠商可能會獲得現(xiàn)成的大模型產(chǎn)品。但大模型的入口屬性可能會顛覆智能手機廠商的入口優(yōu)勢,對智能手機生態(tài)產(chǎn)生負面影響。
大模型 “跑” 進手機,AI 的戰(zhàn)火已經(jīng)從 “云端” 燒至 “移動終端”。大模型在手機上的應用已經(jīng)不再新鮮,但下一步的目標是讓大模型直接在手機上運行。大模型的應用將給手機用戶帶來體驗上的提升,例如在智能助手、語音識別和信息處理方面的應用。手機廠商和科技巨頭正在加速推進在移動終端的輕量化部署 AI 大模型。為了在手機上運行大模型,需要升級手機系統(tǒng)和硬件,如增加內(nèi)存和存儲空間、改進任務調(diào)度和并發(fā)模型等。
中國的 AIGC 應用市場正在迅速發(fā)展,妙鴨相機是中國首款現(xiàn)象級 AIGC 應用之一。該應用在短短兩周內(nèi)在社交媒體上瘋狂傳播,用戶數(shù)量和評價都非常正面。然而,AIGC 應用的火爆程度通常持續(xù)時間很短。為了避免一地 “鴨毛”,妙鴨相機團隊開始思考如何構建新的護城河。他們明確定位自己為 “攝影美學服務” 產(chǎn)品,專注于滿足下沉城市和欠發(fā)達地區(qū)用戶對美的需求。
GPT-4是 OpenAI 的一款大型語言模型,雖然在自然語言理解與生成、邏輯推理、代碼生成等方面表現(xiàn)出色,但其輸出結果卻具有較大的不確定性。一位開發(fā)者通過分析發(fā)現(xiàn),這種隨機性可能是由 GPT-4中的稀疏 MoE(混合專家模型)引起的。稀疏 MoE 的特性導致模型在批次級別具有確定性,但在序列級別卻失去了確定性,從而使得生成結果變得不確定。
14.60小時完成、收益超1萬,用 AI 做的游戲憑啥賺到錢?
該文章介紹了一位抖音博主使用 AI 輔助開發(fā)的塔防小游戲《細胞防線》的制作過程和商業(yè)化成果。博主利用 AI 工具生成游戲代碼和美術畫面,總計耗時60個小時完成游戲制作。《細胞防線》上線 TapTap 游戲社區(qū)后,獲得了超過1萬的下載量和4萬多名用戶關注。通過廣告位的加入,博主每天能夠獲得約100元的廣告收入,累計收益達到一萬元左右。文章還介紹了其他游戲公司利用 AI 技術開發(fā)游戲的嘗試,展示了 AI 在游戲創(chuàng)作中的潛力和可能性。
文章討論了大模型領域的發(fā)展階段和應用趨勢。隨著越來越多的大模型落地,大模型行業(yè)可能進入應用驅(qū)動階段,百模大戰(zhàn)即將迎來一輪淘汰賽。大模型的發(fā)展經(jīng)歷了技術驅(qū)動階段和產(chǎn)品驅(qū)動階段,現(xiàn)在正進入用戶驅(qū)動階段。大公司和創(chuàng)業(yè)公司在應用層面的差別可能不大,而應用場景和用戶認可將決定大模型的商業(yè)化前景。此外,大模型的改變將涉及內(nèi)容創(chuàng)造方式的變革和交互設計的商業(yè)化機會。長期來看,大模型的商業(yè)化機會可能在 C 端用戶驅(qū)動階段。
16.Llama2等30+ 模型接入千帆大模型平臺,推理成本降50%
百度智能云千帆大模型平臺升級,接入了30+ 個大模型,包括 Llama2系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B 等。通過優(yōu)化模型吞吐和降低模型尺寸,推理成本最多可降低50%。千帆平臺提供完整的開發(fā)和應用工具鏈,降低了使用大模型的門檻。此次更新還新增了 Prompt 模板庫,用戶可以通過模板引導大模型輸出更好的內(nèi)容。千帆大模型平臺的目標是降低大模型的使用門檻,讓更多專業(yè)人士將精力聚焦到對場景的理解和應用之上。