AI視野:王小川發(fā)布新大模型Baichuan53B;必應(yīng)免費(fèi)向用戶(hù)提供DALL-E3;文心一言將再次升級(jí)
????大模型動(dòng)態(tài)
王小川發(fā)布新大模型Baichuan53B 宣布閉源商業(yè)化
王小川團(tuán)隊(duì)發(fā)布新的53B大模型,這是繼Baichuan-7B和Baichuan-13B之后他們的第三個(gè)大模型產(chǎn)品,但與前兩款不同,這次選擇閉源。
AiBase提要
?53B模型規(guī)模達(dá)到530億參數(shù),是王小川團(tuán)隊(duì)到目前為止參數(shù)量最大的模型
?53B模型結(jié)合了搜索技術(shù),增強(qiáng)了對(duì)抗生成和時(shí)效性等方面的能力
? 王小川表示商業(yè)化的時(shí)機(jī)已到,53B閉源有利于直接面向企業(yè)客戶(hù)商業(yè)化運(yùn)營(yíng)
開(kāi)放模型權(quán)重被指將導(dǎo)致AI失控,Meta遭舉牌抗議
AI領(lǐng)域開(kāi)源與閉源選擇存在分歧,但大模型時(shí)代開(kāi)源力量崛起,Meta因開(kāi)源陷入麻煩,抗議者質(zhì)疑開(kāi)放模型權(quán)重安全性,LeCun則表態(tài)開(kāi)源AI不可阻擋。
AiBase提要
? 開(kāi)源模型公開(kāi)權(quán)重可能被濫用,Meta遭抗議
? 開(kāi)源與閉源各有利弊,關(guān)鍵看使用
? 開(kāi)源促進(jìn)AI健康發(fā)展不可阻擋
港中大MathCoder模型挑戰(zhàn)GPT-4,數(shù)學(xué)題解得分超越后者
港中大開(kāi)發(fā)的 MathCoder 大模型在數(shù)學(xué)推理方面超過(guò)了 GPT-4,能夠無(wú)縫集成代碼解決數(shù)學(xué)問(wèn)題。
論文地址:https://browse.arxiv.org/pdf/2310.03731.pdf
AiBase提要:
1?? 港中大開(kāi)發(fā)的 MathCoder 大模型數(shù)學(xué)能力超過(guò) GPT-4。
2?? MathCoder 在 MATH 和 GSM8K 數(shù)據(jù)集上取得了優(yōu)秀成績(jī)。
3?? MathCoder 通過(guò)無(wú)縫集成代碼解決數(shù)學(xué)問(wèn)題。
???AI應(yīng)用
微軟Bing Chat免費(fèi)向用戶(hù)提供DALL-E3
微軟宣布將 OpenAI 最新模型 DALL-E3集成在 Bing Chat 和 Bing Image Create 中,并免費(fèi)提供給用戶(hù)使用。
AiBase提要:
1?? DALL-E3是一款類(lèi) Midjourney 產(chǎn)品,通過(guò)文本就能生成二次元、3D、朋克、涂鴉等多種類(lèi)型圖片。
2?? 微軟表示,為了保證用戶(hù)通過(guò) Bing Image Creator 創(chuàng)建的內(nèi)容的安全性,已經(jīng)在生成的圖片中內(nèi)置了符合 C2PA 規(guī)范的數(shù)字水印。
3?? 用戶(hù)在創(chuàng)建圖片的過(guò)程中,提供的文本細(xì)節(jié)越多、描述越豐富,最終生成的圖片也就越精準(zhǔn)。
文心一言將再次升級(jí)
百度宣布將于10月17日舉行“百度世界大會(huì)2023”,李彥宏透露將帶來(lái)文心一言、搜索、地圖、網(wǎng)盤(pán)等應(yīng)用產(chǎn)品的全新亮相。
AiBase提要:
? 李彥宏將在主題演講中分享AI原生應(yīng)用的心得,重點(diǎn)介紹生成式AI的想象和創(chuàng)新空間
? 文心一言將進(jìn)行再次升級(jí),發(fā)揮在生活生產(chǎn)中的更重要作用
? 百度搜索、地圖、網(wǎng)盤(pán)等應(yīng)用將帶來(lái)全新亮相,提供更好的用戶(hù)體驗(yàn)
微軟 OneDrive 將迎來(lái)全新升級(jí):Copilot 將為用戶(hù)提供更多 AI 功能
微軟推出升級(jí)版OneDrive,整合Copilot人工智能功能,幫助用戶(hù)更便捷地管理文件。
AiBase提要:
? OneDrive將整合Copilot人工智能助手,可自動(dòng)生成文件內(nèi)容摘要,提高文件搜索效率。
? OneDrive Copilot可預(yù)測(cè)用戶(hù)需求,建議將相關(guān)文件歸類(lèi)到同一文件夾。
? OneDrive 將推出人工智能搜索功能,可在2024年初公測(cè)。
谷歌為Google Assistant注入AI新功能
谷歌在Made by Google活動(dòng)上為Google Assistant注入了新的AI功能,如與Bard的融合、理解更自然的語(yǔ)音命令、電話(huà)體驗(yàn)優(yōu)化等,以提升其在語(yǔ)音助手市場(chǎng)的地位。
AiBase提要:
? Assistant with Bard將成為更加智能的語(yǔ)音助手
? 可以理解更自然的語(yǔ)音交互方式
? 電話(huà)篩選和垃圾電話(huà)過(guò)濾功能加強(qiáng)
???AI新鮮事
原百度AI高管景鯤和朱凱華離職將聯(lián)手創(chuàng)業(yè)
原百度人工智能高管景鯤和朱凱華最近宣布離職,計(jì)劃聯(lián)手創(chuàng)業(yè)。兩人在語(yǔ)音交互領(lǐng)域積累了豐富經(jīng)驗(yàn)。據(jù)悉,他們的創(chuàng)業(yè)項(xiàng)目會(huì)結(jié)合大模型技術(shù),目標(biāo)是打造語(yǔ)音交互一體化解決方案。業(yè)內(nèi)人士認(rèn)為,兩人在軟硬件結(jié)合方面的經(jīng)驗(yàn),將會(huì)是創(chuàng)業(yè)過(guò)程中的優(yōu)勢(shì)。
AiBase提要:
景鯤和朱凱華分別曾任小度科技CEO和CTO,景鯤被稱(chēng)為“小冰之父”
二人均有軟硬件結(jié)合經(jīng)驗(yàn),擅長(zhǎng)語(yǔ)音交互領(lǐng)域
擬創(chuàng)業(yè)項(xiàng)目預(yù)計(jì)結(jié)合大模型技術(shù),目標(biāo)打造語(yǔ)音交互一體化解決方案
Windows12將于2024年推出:AI 功能刺激更新需求
英特爾高管在公開(kāi)場(chǎng)合透露,微軟可能會(huì)在2024年推出Windows12操作系統(tǒng),以刺激用戶(hù)對(duì)新系統(tǒng)的更新需求。
AiBase提要:
? 英特爾CFO提到2024年Windows會(huì)有重大更新,意味著Windows12即將推出
? 微軟近期在Windows11中加入AI功能,Windows12可能會(huì)進(jìn)一步整合AI
? Windows12開(kāi)發(fā)已在加速,正式發(fā)布時(shí)間表與2024年秋季吻合
淘寶:國(guó)慶期間AI修圖服務(wù)搜索量周環(huán)比暴增數(shù)十倍
淘寶數(shù)據(jù)顯示,國(guó)慶期間淘寶上AI修圖服務(wù)搜索量周環(huán)比暴增數(shù)十倍,景點(diǎn)代打卡等“懶人旅游”服務(wù)也大受歡迎。
AiBase提要
?淘寶上境內(nèi)外旅游門(mén)票預(yù)訂大幅增長(zhǎng)
?代打卡、代P圖等“懶人旅游”服務(wù)火爆
?AI修圖服務(wù)搜索量周環(huán)比暴增數(shù)十倍
百萬(wàn)網(wǎng)友圍觀DALL-E3新玩法!鋼鐵俠特斯拉皆“中招”
最近DALL-E3在網(wǎng)友手中玩出了多種新玩法,比如整齊擺放物品,生成各類(lèi)難以拍攝的產(chǎn)品照片,配合提示詞可生成不同風(fēng)格圖像。這種風(fēng)格叫做knolling,重點(diǎn)在于擺放整齊,也是不少產(chǎn)品攝影的表達(dá)方式。
AiBase提要:
?DALL-E3可將物品整齊擺放,生成有趣的組合照片,比如電影人物的身體部件平鋪照。
?DALL-E3可輕松生成正常拍攝困難的產(chǎn)品組合照,如特斯拉全系列車(chē)型。
?添加提示詞可讓DALL-E3生成不同風(fēng)格的圖像,非常適合產(chǎn)品攝影創(chuàng)作。
研究人員稱(chēng),即使是最糟糕Claude AI版本也比GPT3.5更好
根據(jù)Chatbot Arena排行榜,Anthropic的Claude模型在性能上超越了OpenAI的GPT-3.5,即使是最差的Claude版本也優(yōu)于ChatGPT免費(fèi)版的GPT-3.5。
AiBase提要
? Claude模型在排名上整體領(lǐng)先GPT-3.5
? 排名考量了上下文處理能力、長(zhǎng)文本生成等多個(gè)維度
? 排名結(jié)果將影響用戶(hù)選擇ChatGPT或Claude
賓夕法尼亞州立大學(xué)研發(fā)出“電子舌頭”,有望賦能AI品嘗美食
賓夕法尼亞州立大學(xué)研究團(tuán)隊(duì)最近研發(fā)出一種基于石墨烯的電子“舌頭”,可以檢測(cè)不同味道,為人工情感智能的發(fā)展帶來(lái)重大突破。
AiBase提要:
?研究團(tuán)隊(duì)研發(fā)出基于石墨烯的電子“舌頭”,能檢測(cè)不同味道,實(shí)現(xiàn)AI“品嘗”功能。
?研究關(guān)注將情感智能引入AI,通過(guò)仿效人類(lèi)味覺(jué)過(guò)程使AI更人性化。
?創(chuàng)新可應(yīng)用于智能飲食推薦等領(lǐng)域,未來(lái)可拓展到視覺(jué)、聽(tīng)覺(jué)等其他感官的AI。
AMD蓄勢(shì)待發(fā)準(zhǔn)備挑戰(zhàn)英偉達(dá)的人工智能霸主地位
AMD正在加緊挑戰(zhàn)英偉達(dá)在AI市場(chǎng)近乎壟斷的地位,憑借與PyTorch的合作和微軟的支持,有望顛覆現(xiàn)狀。
AiBase提要
?AMD一直在默默取得進(jìn)展,開(kāi)發(fā)了CUDA轉(zhuǎn)換工具,即將推出的Instinct MI300A處理器具有競(jìng)爭(zhēng)力。
?AMD與PyTorch合作,為后者提供AMD GPU支持,也獲得了微軟的戰(zhàn)略支持。
?AMD有可能借助戰(zhàn)略合作伙伴關(guān)系,在AI市場(chǎng)顛覆英偉達(dá)的壟斷地位。
?????聚焦開(kāi)發(fā)者
浙大校友聯(lián)手微軟開(kāi)源LLaVA-1.5,硬剛GPT-4V
最近威斯康星大學(xué)麥迪遜分校、微軟研究院和哥倫比亞大學(xué)的研究人員聯(lián)手開(kāi)源了新型多模態(tài)模型LLaVA-1.5,在多個(gè)基準(zhǔn)測(cè)試中實(shí)現(xiàn)SOTA,展現(xiàn)出強(qiáng)大的多模態(tài)理解能力,被認(rèn)為可與GPT-4V形成正面競(jìng)爭(zhēng)。
論文地址:https://browse.arxiv.org/pdf/2310.03744.pdf
AiBase提要:
LLaVA-1.5在11項(xiàng)基準(zhǔn)測(cè)試實(shí)現(xiàn)了SOTA,使用8塊A100GPU,LLaVA-1.5的訓(xùn)練僅需1天時(shí)間即可完成。
LLaVA-1.5在多模態(tài)理解上超越GPT-4V,可對(duì)其形成有力競(jìng)爭(zhēng)。
LLaVA-1.5采用最簡(jiǎn)單的架構(gòu)和公開(kāi)數(shù)據(jù)集,性能顯著提升。
OnnxStream:可在樹(shù)莓派Zero2上運(yùn)行Stable Diffusion1.5
OnnxStream是一款內(nèi)存占用極低的機(jī)器學(xué)習(xí)推理引擎,可在內(nèi)存僅512MB的樹(shù)莓派Zero2設(shè)備上運(yùn)行Stable Diffusion1.5等大型深度學(xué)習(xí)模型。
項(xiàng)目地址:
https://github.com/vitoplantamura/OnnxStream/tree/846da873570a737b49154e8f835704264864b0fe
AiBase提要
? OnnxStream通過(guò)出色的內(nèi)存管理,可極大降低模型運(yùn)行時(shí)的RAM占用。
? OnnxStream支持多種功能以適應(yīng)資源受限環(huán)境,如權(quán)重加載器、注意力切片等。
? OnnxStream實(shí)現(xiàn)了跨平臺(tái)支持,可靈活運(yùn)行在Linux、Windows、Mac和Termux等系統(tǒng)。
StreamingLLM:讓AI模型無(wú)限期平穩(wěn)運(yùn)行的一種方法
Meta、麻省理工和卡內(nèi)基梅隆的研究人員提出StreamingLLM技術(shù),通過(guò)在對(duì)話(huà)不同階段重新引入初始標(biāo)記,解決了LLM在長(zhǎng)時(shí)間對(duì)話(huà)中性能下降的問(wèn)題,使其能夠在無(wú)限長(zhǎng)度文本上保持高性能。
AiBase提要:
? Meta、MIT和CMU的研究人員提出了StreamingLLM技術(shù),旨在解決LLM在長(zhǎng)時(shí)間對(duì)話(huà)中的性能下降問(wèn)題。
? StreamingLLM利用attention sinks的概念,在對(duì)話(huà)不同階段重新引入初始標(biāo)記,使LLM能夠在無(wú)限長(zhǎng)度文本上保持高性能。
? 研究人員提出了使用單個(gè)特殊標(biāo)記作為attention sink來(lái)穩(wěn)定LLM的關(guān)注機(jī)制,保持其在長(zhǎng)時(shí)間對(duì)話(huà)中的高性能。
全新圖文生成方式MiniGPT-5生成文本的同時(shí)創(chuàng)作匹配的圖片
MiniGPT-5是一款基于大型語(yǔ)言模型的視覺(jué)與語(yǔ)言協(xié)同生成工具,通過(guò)生成vokens實(shí)現(xiàn)圖像文本協(xié)同生成。
項(xiàng)目地址:https://github.com/eric-ai-lab/minigpt-5
AiBase提要
? MiniGPT-5實(shí)現(xiàn)圖像文本協(xié)同生成,用戶(hù)可輸入文本生成圖像或輸入圖像生成文本
? MiniGPT-5通過(guò)兩階段訓(xùn)練提高模型魯棒性,無(wú)需詳細(xì)描述進(jìn)行訓(xùn)練
?? MiniGPT-5在多個(gè)數(shù)據(jù)集上表現(xiàn)出色,是多模態(tài)生成有力工具
輕量級(jí)代碼庫(kù)分析工具ctoc開(kāi)源
ctoc是一個(gè)輕量級(jí)的代碼庫(kù)分析工具,基于gocloc,可以快速統(tǒng)計(jì)代碼庫(kù)中的令牌數(shù)量,支持多種語(yǔ)言和輸出格式,對(duì)理解代碼庫(kù)復(fù)雜性和與不同LLM模型互操作很有幫助。
項(xiàng)目地址:https://github.com/yaohui-wyh/ctoc
AiBase提要
? ctoc可以快速統(tǒng)計(jì)代碼庫(kù)中的令牌數(shù)量,分析復(fù)雜性
? 支持多種編程語(yǔ)言,可以輕松統(tǒng)計(jì)不同語(yǔ)言的令牌數(shù)
?? 提供多種輸出格式,支持與不同LLM模型互操作