AI視野：王小川發(fā)布新大模型Baichuan53B;必應(yīng)免費(fèi)向用戶(hù)提供DALL-E3；文心一言將再次升級(jí)

由微新創(chuàng)想 · 2023年 10月 10日

????大模型動(dòng)態(tài)

王小川發(fā)布新大模型Baichuan53B 宣布閉源商業(yè)化

王小川團(tuán)隊(duì)發(fā)布新的53B大模型，這是繼Baichuan-7B和Baichuan-13B之后他們的第三個(gè)大模型產(chǎn)品，但與前兩款不同，這次選擇閉源。

AiBase提要

?53B模型規(guī)模達(dá)到530億參數(shù)，是王小川團(tuán)隊(duì)到目前為止參數(shù)量最大的模型

?53B模型結(jié)合了搜索技術(shù)，增強(qiáng)了對(duì)抗生成和時(shí)效性等方面的能力

? 王小川表示商業(yè)化的時(shí)機(jī)已到，53B閉源有利于直接面向企業(yè)客戶(hù)商業(yè)化運(yùn)營(yíng)

開(kāi)放模型權(quán)重被指將導(dǎo)致AI失控，Meta遭舉牌抗議

AI領(lǐng)域開(kāi)源與閉源選擇存在分歧，但大模型時(shí)代開(kāi)源力量崛起，Meta因開(kāi)源陷入麻煩，抗議者質(zhì)疑開(kāi)放模型權(quán)重安全性，LeCun則表態(tài)開(kāi)源AI不可阻擋。

AiBase提要

? 開(kāi)源模型公開(kāi)權(quán)重可能被濫用，Meta遭抗議

? 開(kāi)源與閉源各有利弊，關(guān)鍵看使用

? 開(kāi)源促進(jìn)AI健康發(fā)展不可阻擋

港中大MathCoder模型挑戰(zhàn)GPT-4，數(shù)學(xué)題解得分超越后者

港中大開(kāi)發(fā)的 MathCoder 大模型在數(shù)學(xué)推理方面超過(guò)了 GPT-4，能夠無(wú)縫集成代碼解決數(shù)學(xué)問(wèn)題。

論文地址:https://browse.arxiv.org/pdf/2310.03731.pdf

AiBase提要:

1?? 港中大開(kāi)發(fā)的 MathCoder 大模型數(shù)學(xué)能力超過(guò) GPT-4。

2?? MathCoder 在 MATH 和 GSM8K 數(shù)據(jù)集上取得了優(yōu)秀成績(jī)。

3?? MathCoder 通過(guò)無(wú)縫集成代碼解決數(shù)學(xué)問(wèn)題。

???AI應(yīng)用

微軟Bing Chat免費(fèi)向用戶(hù)提供DALL-E3

微軟宣布將 OpenAI 最新模型 DALL-E3集成在 Bing Chat 和 Bing Image Create 中，并免費(fèi)提供給用戶(hù)使用。

AiBase提要:

1?? DALL-E3是一款類(lèi) Midjourney 產(chǎn)品，通過(guò)文本就能生成二次元、3D、朋克、涂鴉等多種類(lèi)型圖片。

2?? 微軟表示，為了保證用戶(hù)通過(guò) Bing Image Creator 創(chuàng)建的內(nèi)容的安全性，已經(jīng)在生成的圖片中內(nèi)置了符合 C2PA 規(guī)范的數(shù)字水印。

3?? 用戶(hù)在創(chuàng)建圖片的過(guò)程中，提供的文本細(xì)節(jié)越多、描述越豐富，最終生成的圖片也就越精準(zhǔn)。

文心一言將再次升級(jí)

百度宣布將于10月17日舉行“百度世界大會(huì)2023”，李彥宏透露將帶來(lái)文心一言、搜索、地圖、網(wǎng)盤(pán)等應(yīng)用產(chǎn)品的全新亮相。

AiBase提要:

? 李彥宏將在主題演講中分享AI原生應(yīng)用的心得，重點(diǎn)介紹生成式AI的想象和創(chuàng)新空間

? 文心一言將進(jìn)行再次升級(jí)，發(fā)揮在生活生產(chǎn)中的更重要作用

? 百度搜索、地圖、網(wǎng)盤(pán)等應(yīng)用將帶來(lái)全新亮相，提供更好的用戶(hù)體驗(yàn)

微軟 OneDrive 將迎來(lái)全新升級(jí):Copilot 將為用戶(hù)提供更多 AI 功能

微軟推出升級(jí)版OneDrive，整合Copilot人工智能功能，幫助用戶(hù)更便捷地管理文件。

AiBase提要:

? OneDrive將整合Copilot人工智能助手，可自動(dòng)生成文件內(nèi)容摘要，提高文件搜索效率。

? OneDrive Copilot可預(yù)測(cè)用戶(hù)需求，建議將相關(guān)文件歸類(lèi)到同一文件夾。

? OneDrive 將推出人工智能搜索功能，可在2024年初公測(cè)。

谷歌為Google Assistant注入AI新功能

谷歌在Made by Google活動(dòng)上為Google Assistant注入了新的AI功能，如與Bard的融合、理解更自然的語(yǔ)音命令、電話(huà)體驗(yàn)優(yōu)化等，以提升其在語(yǔ)音助手市場(chǎng)的地位。

AiBase提要:

? Assistant with Bard將成為更加智能的語(yǔ)音助手

? 可以理解更自然的語(yǔ)音交互方式

? 電話(huà)篩選和垃圾電話(huà)過(guò)濾功能加強(qiáng)

???AI新鮮事

原百度AI高管景鯤和朱凱華離職將聯(lián)手創(chuàng)業(yè)

原百度人工智能高管景鯤和朱凱華最近宣布離職，計(jì)劃聯(lián)手創(chuàng)業(yè)。兩人在語(yǔ)音交互領(lǐng)域積累了豐富經(jīng)驗(yàn)。據(jù)悉，他們的創(chuàng)業(yè)項(xiàng)目會(huì)結(jié)合大模型技術(shù)，目標(biāo)是打造語(yǔ)音交互一體化解決方案。業(yè)內(nèi)人士認(rèn)為，兩人在軟硬件結(jié)合方面的經(jīng)驗(yàn)，將會(huì)是創(chuàng)業(yè)過(guò)程中的優(yōu)勢(shì)。

AiBase提要：

景鯤和朱凱華分別曾任小度科技CEO和CTO，景鯤被稱(chēng)為“小冰之父”

二人均有軟硬件結(jié)合經(jīng)驗(yàn)，擅長(zhǎng)語(yǔ)音交互領(lǐng)域

擬創(chuàng)業(yè)項(xiàng)目預(yù)計(jì)結(jié)合大模型技術(shù)，目標(biāo)打造語(yǔ)音交互一體化解決方案

Windows12將于2024年推出:AI 功能刺激更新需求

英特爾高管在公開(kāi)場(chǎng)合透露，微軟可能會(huì)在2024年推出Windows12操作系統(tǒng)，以刺激用戶(hù)對(duì)新系統(tǒng)的更新需求。

AiBase提要:

? 英特爾CFO提到2024年Windows會(huì)有重大更新，意味著Windows12即將推出

? 微軟近期在Windows11中加入AI功能，Windows12可能會(huì)進(jìn)一步整合AI

? Windows12開(kāi)發(fā)已在加速，正式發(fā)布時(shí)間表與2024年秋季吻合

淘寶:國(guó)慶期間AI修圖服務(wù)搜索量周環(huán)比暴增數(shù)十倍

淘寶數(shù)據(jù)顯示，國(guó)慶期間淘寶上AI修圖服務(wù)搜索量周環(huán)比暴增數(shù)十倍，景點(diǎn)代打卡等“懶人旅游”服務(wù)也大受歡迎。

AiBase提要

?淘寶上境內(nèi)外旅游門(mén)票預(yù)訂大幅增長(zhǎng)

?代打卡、代P圖等“懶人旅游”服務(wù)火爆

?AI修圖服務(wù)搜索量周環(huán)比暴增數(shù)十倍

百萬(wàn)網(wǎng)友圍觀DALL-E3新玩法!鋼鐵俠特斯拉皆“中招”

最近DALL-E3在網(wǎng)友手中玩出了多種新玩法，比如整齊擺放物品，生成各類(lèi)難以拍攝的產(chǎn)品照片，配合提示詞可生成不同風(fēng)格圖像。這種風(fēng)格叫做knolling，重點(diǎn)在于擺放整齊，也是不少產(chǎn)品攝影的表達(dá)方式。

AiBase提要:

?DALL-E3可將物品整齊擺放，生成有趣的組合照片，比如電影人物的身體部件平鋪照。

?DALL-E3可輕松生成正常拍攝困難的產(chǎn)品組合照，如特斯拉全系列車(chē)型。

?添加提示詞可讓DALL-E3生成不同風(fēng)格的圖像，非常適合產(chǎn)品攝影創(chuàng)作。

研究人員稱(chēng)，即使是最糟糕Claude AI版本也比GPT3.5更好

根據(jù)Chatbot Arena排行榜，Anthropic的Claude模型在性能上超越了OpenAI的GPT-3.5，即使是最差的Claude版本也優(yōu)于ChatGPT免費(fèi)版的GPT-3.5。

AiBase提要

? Claude模型在排名上整體領(lǐng)先GPT-3.5

? 排名考量了上下文處理能力、長(zhǎng)文本生成等多個(gè)維度

? 排名結(jié)果將影響用戶(hù)選擇ChatGPT或Claude

賓夕法尼亞州立大學(xué)研發(fā)出“電子舌頭”，有望賦能AI品嘗美食

賓夕法尼亞州立大學(xué)研究團(tuán)隊(duì)最近研發(fā)出一種基于石墨烯的電子“舌頭”，可以檢測(cè)不同味道，為人工情感智能的發(fā)展帶來(lái)重大突破。

AiBase提要:

?研究團(tuán)隊(duì)研發(fā)出基于石墨烯的電子“舌頭”，能檢測(cè)不同味道，實(shí)現(xiàn)AI“品嘗”功能。

?研究關(guān)注將情感智能引入AI，通過(guò)仿效人類(lèi)味覺(jué)過(guò)程使AI更人性化。

?創(chuàng)新可應(yīng)用于智能飲食推薦等領(lǐng)域，未來(lái)可拓展到視覺(jué)、聽(tīng)覺(jué)等其他感官的AI。

AMD蓄勢(shì)待發(fā)準(zhǔn)備挑戰(zhàn)英偉達(dá)的人工智能霸主地位

AMD正在加緊挑戰(zhàn)英偉達(dá)在AI市場(chǎng)近乎壟斷的地位，憑借與PyTorch的合作和微軟的支持，有望顛覆現(xiàn)狀。

AiBase提要

?AMD一直在默默取得進(jìn)展，開(kāi)發(fā)了CUDA轉(zhuǎn)換工具，即將推出的Instinct MI300A處理器具有競(jìng)爭(zhēng)力。

?AMD與PyTorch合作，為后者提供AMD GPU支持，也獲得了微軟的戰(zhàn)略支持。

?AMD有可能借助戰(zhàn)略合作伙伴關(guān)系，在AI市場(chǎng)顛覆英偉達(dá)的壟斷地位。

?????聚焦開(kāi)發(fā)者

浙大校友聯(lián)手微軟開(kāi)源LLaVA-1.5，硬剛GPT-4V

最近威斯康星大學(xué)麥迪遜分校、微軟研究院和哥倫比亞大學(xué)的研究人員聯(lián)手開(kāi)源了新型多模態(tài)模型LLaVA-1.5，在多個(gè)基準(zhǔn)測(cè)試中實(shí)現(xiàn)SOTA，展現(xiàn)出強(qiáng)大的多模態(tài)理解能力，被認(rèn)為可與GPT-4V形成正面競(jìng)爭(zhēng)。

論文地址:https://browse.arxiv.org/pdf/2310.03744.pdf

AiBase提要:

LLaVA-1.5在11項(xiàng)基準(zhǔn)測(cè)試實(shí)現(xiàn)了SOTA，使用8塊A100GPU，LLaVA-1.5的訓(xùn)練僅需1天時(shí)間即可完成。

LLaVA-1.5在多模態(tài)理解上超越GPT-4V，可對(duì)其形成有力競(jìng)爭(zhēng)。

LLaVA-1.5采用最簡(jiǎn)單的架構(gòu)和公開(kāi)數(shù)據(jù)集，性能顯著提升。

OnnxStream:可在樹(shù)莓派Zero2上運(yùn)行Stable Diffusion1.5

OnnxStream是一款內(nèi)存占用極低的機(jī)器學(xué)習(xí)推理引擎，可在內(nèi)存僅512MB的樹(shù)莓派Zero2設(shè)備上運(yùn)行Stable Diffusion1.5等大型深度學(xué)習(xí)模型。

項(xiàng)目地址:

https://github.com/vitoplantamura/OnnxStream/tree/846da873570a737b49154e8f835704264864b0fe

AiBase提要

? OnnxStream通過(guò)出色的內(nèi)存管理，可極大降低模型運(yùn)行時(shí)的RAM占用。

? OnnxStream支持多種功能以適應(yīng)資源受限環(huán)境，如權(quán)重加載器、注意力切片等。

? OnnxStream實(shí)現(xiàn)了跨平臺(tái)支持，可靈活運(yùn)行在Linux、Windows、Mac和Termux等系統(tǒng)。

StreamingLLM:讓AI模型無(wú)限期平穩(wěn)運(yùn)行的一種方法

Meta、麻省理工和卡內(nèi)基梅隆的研究人員提出StreamingLLM技術(shù)，通過(guò)在對(duì)話(huà)不同階段重新引入初始標(biāo)記，解決了LLM在長(zhǎng)時(shí)間對(duì)話(huà)中性能下降的問(wèn)題，使其能夠在無(wú)限長(zhǎng)度文本上保持高性能。

AiBase提要:

? Meta、MIT和CMU的研究人員提出了StreamingLLM技術(shù)，旨在解決LLM在長(zhǎng)時(shí)間對(duì)話(huà)中的性能下降問(wèn)題。

? StreamingLLM利用attention sinks的概念，在對(duì)話(huà)不同階段重新引入初始標(biāo)記，使LLM能夠在無(wú)限長(zhǎng)度文本上保持高性能。

? 研究人員提出了使用單個(gè)特殊標(biāo)記作為attention sink來(lái)穩(wěn)定LLM的關(guān)注機(jī)制，保持其在長(zhǎng)時(shí)間對(duì)話(huà)中的高性能。

全新圖文生成方式MiniGPT-5生成文本的同時(shí)創(chuàng)作匹配的圖片

MiniGPT-5是一款基于大型語(yǔ)言模型的視覺(jué)與語(yǔ)言協(xié)同生成工具，通過(guò)生成vokens實(shí)現(xiàn)圖像文本協(xié)同生成。

項(xiàng)目地址:https://github.com/eric-ai-lab/minigpt-5

AiBase提要

? MiniGPT-5實(shí)現(xiàn)圖像文本協(xié)同生成，用戶(hù)可輸入文本生成圖像或輸入圖像生成文本

? MiniGPT-5通過(guò)兩階段訓(xùn)練提高模型魯棒性，無(wú)需詳細(xì)描述進(jìn)行訓(xùn)練

?? MiniGPT-5在多個(gè)數(shù)據(jù)集上表現(xiàn)出色，是多模態(tài)生成有力工具

輕量級(jí)代碼庫(kù)分析工具ctoc開(kāi)源

ctoc是一個(gè)輕量級(jí)的代碼庫(kù)分析工具，基于gocloc，可以快速統(tǒng)計(jì)代碼庫(kù)中的令牌數(shù)量，支持多種語(yǔ)言和輸出格式，對(duì)理解代碼庫(kù)復(fù)雜性和與不同LLM模型互操作很有幫助。

項(xiàng)目地址:https://github.com/yaohui-wyh/ctoc

AiBase提要

? ctoc可以快速統(tǒng)計(jì)代碼庫(kù)中的令牌數(shù)量，分析復(fù)雜性

? 支持多種編程語(yǔ)言，可以輕松統(tǒng)計(jì)不同語(yǔ)言的令牌數(shù)

?? 提供多種輸出格式，支持與不同LLM模型互操作

人人人免费人人专区人人,欧美精品不卡,欧美大片无尺码在线观看,久久精品小视频,成人免费黄色大片,欧美+亚洲+精品+三区

AI視野：王小川發(fā)布新大模型Baichuan53B;必應(yīng)免費(fèi)向用戶(hù)提供DALL-E3；文心一言將再次升級(jí)

您可能還喜歡...

發(fā)表回復(fù) 取消回復(fù)

熱門(mén)文章

熱門(mén)文章

人人人免费人人专区人人,欧美精品不卡,欧美大片无尺码在线观看,久久精品小视频,成人免费黄色大片,欧美+亚洲+精品+三区

AI視野：王小川發(fā)布新大模型Baichuan53B;必應(yīng)免費(fèi)向用戶(hù)提供DALL-E3；文心一言將再次升級(jí)

您可能還喜歡...

沃爾瑪認(rèn)為人工智能不會(huì)導(dǎo)致裁員：將在推出更多 AI 技術(shù)時(shí)繼續(xù)雇用相同數(shù)量或更多的員工

6家海外VC負(fù)責(zé)人談初創(chuàng)公司如何在這波AI浪潮中拿下市場(chǎng)？普遍關(guān)注應(yīng)用層以及垂直方案；除了LLM機(jī)遇，還要回答Why now？

Getty Images與Nvidia合作開(kāi)發(fā)生成式AI圖片工具

發(fā)表回復(fù) 取消回復(fù)

熱門(mén)文章

熱門(mén)文章

AI視野：王小川發(fā)布新大模型Baichuan53B;必應(yīng)免費(fèi)向用戶(hù)提供DALL-E3；文心一言將再次升級(jí)

6家海外VC負(fù)責(zé)人談初創(chuàng)公司如何在這波AI浪潮中拿下市場(chǎng)？普遍關(guān)注應(yīng)用層以及垂直方案；除了LLM機(jī)遇，還要回答Why now？