AI視野:阿里媽媽上線AI直播;多家AI繪畫網(wǎng)站集中關(guān)閉;Stability AI發(fā)布AI音樂生成工具Stable Audio
???AI應(yīng)用
Stability AI發(fā)布AI音樂生成工具Stable Audio
倫敦初創(chuàng)公司Stability AI發(fā)布Stable Audio,使用AI從文本生成自定義音樂和音效。該系統(tǒng)使用基于擴散的模型,可以在幾秒內(nèi)生成長達(dá)90秒的專業(yè)音頻。Stable Audio的優(yōu)勢在于生成多風(fēng)格音樂,提供友好界面,面向需要快速背景音樂的創(chuàng)意專業(yè)人士。
要點:
1、Stable Audio使用擴散模型從文本生成自定義音樂和音效,支持多種風(fēng)格。
2、提供瀏覽器界面,使用簡單,可在幾秒內(nèi)生成長達(dá)90秒的高質(zhì)量音頻。
3、面向需要快速獲取背景音樂的電影、游戲等創(chuàng)意行業(yè)專業(yè)人士。
Adobe 的 Firefly 生成式 AI 工具結(jié)束測試:現(xiàn)已向所有訂閱用戶提供
Adobe宣布其Firefly生成式AI工具正式結(jié)束測試,現(xiàn)已向所有Creative Cloud訂閱用戶開放,用戶可以利用AI生成圖像和內(nèi)容。
要點:
1. Adobe Firefly生成式AI工具已正式開放給所有Creative Cloud訂閱用戶。
2. Firefly提供了多種AI功能,包括圖像擴充、色彩校正、語音到圖像等。
3. 每個用戶每月將獲得一定的“生成積分”限額用于AI內(nèi)容生成。
Stable Diffusion發(fā)布WebUI1.6版本 對小顯存用戶更加友好
Stable Diffusion最近發(fā)布了1.6版本的WebUI,對小顯存用戶更加友好,可以直接跨入使用1.60版本的模型。
要點:
1.1.6版本W(wǎng)ebUI性能優(yōu)異,小顯存用戶不再容易爆顯存。
2. 墻裂建議所有小顯存用戶都升級到1.6版本。
3.1.6版本增加了很多采樣器,但對畫面影響似乎不大,采用DPM++采樣器即可。
微軟Teams AI庫來了! 可幫助公司創(chuàng)建消息機器人
微軟Teams的AI庫將于10月正式投入全球運行。AI庫提供各種工具,幫助開發(fā)者在Teams中輕松集成大規(guī)模語言模型,構(gòu)建會話式應(yīng)用,提高企業(yè)工作效率。
要點:
1、 AI庫包含用于創(chuàng)建機器人、消息擴展等工具,以及將現(xiàn)有應(yīng)用遷移到大語言模型的工具。
2、AI庫推出開發(fā)者預(yù)覽版,10月面向全球發(fā)布,支持桌面和移動端。
3、AI庫發(fā)布后,Teams工作協(xié)作將大規(guī)模應(yīng)用AI技術(shù),提升企業(yè)工作效率。
Trickle:利用GPT-4推理能力識別截圖關(guān)鍵信息
Trickle是一個支持GPT-4人工智能的截圖管理平臺,能將雜亂截圖轉(zhuǎn)化為有價值的視覺備忘錄。它通過AI文本生成功能為截圖創(chuàng)建概要,深度分析內(nèi)容,實現(xiàn)智能歸類整理。用戶可以用語音交互檢索所需信息。
體驗地址:https://www.trickle.so/
要點:
1. 智能生成截圖文本概要,提高檢索效率
2. 深度分析截圖內(nèi)容,洞察信息本質(zhì)
3. 支持語音交互,快速檢索所需截圖
三星SDS推出Brity Copilot 、 FabriX兩款生成式AI服務(wù)
三星 SDS 推出Brity Copilot和FabriX兩項生成AI服務(wù),解決RPA局限,提高企業(yè)生產(chǎn)力,支持多語言模型集成,可私有云或獨立服務(wù)器構(gòu)建。
要點:
1、三星 SDS 推出Brity Copilot和FabriX兩項生成AI服務(wù),旨在解決RPA局限,提高企業(yè)生產(chǎn)力。
2、Brity Copilot用于處理電子郵件、信息傳遞、視頻會議和數(shù)據(jù)存儲等業(yè)務(wù)流程中的智力工作,而FabriX是一個業(yè)務(wù)平臺,集中公司數(shù)據(jù)和知識資產(chǎn),為員工提供便利。
3、這些服務(wù)支持多種大型語言模型的集成,包括OpenAI的ChatGPT和Naver的HyperCLOVA X,可以構(gòu)建在私有云或獨立服務(wù)器上。
知網(wǎng)推出“AIGC檢測服務(wù)系統(tǒng)” 可識別學(xué)術(shù)文本中AI生成內(nèi)容
同方知網(wǎng)推出“AIGC檢測服務(wù)系統(tǒng)”,可快速準(zhǔn)確識別學(xué)術(shù)文本中的AI生成內(nèi)容,系統(tǒng)支持多種檢測場景,界面簡潔易用,檢準(zhǔn)率較高。
要點:
1. 系統(tǒng)基于知網(wǎng)大數(shù)據(jù)資源,使用知識增強AIGC檢測技術(shù),可以識別不同程度疑似AI生成文本。
2. 支持上傳各類格式文檔進(jìn)行檢測,可實時查看檢測進(jìn)度和結(jié)果報告。
3. 支持論文、學(xué)位論文、科研報告等多種學(xué)術(shù)場景的生成內(nèi)容檢測。
Memo AI:一個小而美的AI音視頻轉(zhuǎn)譯工具
Memo AI是一個小而強大的AI音視頻轉(zhuǎn)譯工具,支持本地部署,提供多項實用功能,包括視頻轉(zhuǎn)文字、多語言支持、實時字幕等。
體驗地址:https://memo.ac/
要點:
1. 支持多語言翻譯,覆蓋90多種語言
2. 提供實時字幕、筆記、內(nèi)容摘要等輔助功能
3. 可利用GPU加速,支持本地部署使用
Whisper API平替?Whisper Turbo語音轉(zhuǎn)錄速度是前者的20倍
GitHub最近發(fā)布了一款名為Whisper Turbo的新產(chǎn)品,作為OpenAI Whisper API的替代品,用于提供語音轉(zhuǎn)錄服務(wù)。其最引人關(guān)注的就是轉(zhuǎn)錄速度是OpenAI API的20倍。Whisper Turbo采用Rust語言開發(fā),擁有出色的性能。它易于安裝使用,支持GPU加速,是提升語音應(yīng)用性能的理想選擇。
項目地址:https://github.com/FL33TW00D/whisper-turbo
要點:
1. GitHub發(fā)布Whisper Turbo作為OpenAI Whisper API的替代品,轉(zhuǎn)錄速度快20倍。
2. Whisper Turbo使用Rust語言開發(fā),性能出色,支持GPU加速。
3. Whisper Turbo易于安裝使用,可以提升語音應(yīng)用性能。
???AI新鮮事
多家AI繪畫網(wǎng)站集中關(guān)閉!技術(shù)升級還是合規(guī)整改?
近日,稿定設(shè)計、即時AI、無界AI、一覽運營寶、吐司TusiArt、LiblibAI、VegaAI、DraftAI、4B3等多家AI繪畫網(wǎng)站集中關(guān)閉或更換域名,據(jù)了解是進(jìn)行技術(shù)升級或整改,具體原因不明。這可能與最近出臺的算法備案管理制度有關(guān)。根據(jù)新規(guī),提供AIGC服務(wù)需完成安全評估和算法備案。監(jiān)管部門正在加快對AIGC領(lǐng)域的管理。
要點:
1、多家AI繪畫網(wǎng)站集中關(guān)閉或更換域名,稱技術(shù)升級,但具體原因不明。
2、這可能與最近出臺的算法備案管理制度有關(guān),提供AIGC服務(wù)需備案。
3、監(jiān)管部門正在加快對AIGC領(lǐng)域的管理,加強審核和規(guī)范。
阿里媽媽上線「AI全時直播」能力
阿里媽媽推出了「AI全時直播」能力,通過阿里媽媽創(chuàng)意生態(tài)「AI直播間」和阿里媽媽萬相臺無界版「短直聯(lián)動」兩大能力,幫助商家實現(xiàn)24小時不停播,降低直播成本,增加直播效果。
要點:
1、阿里媽媽推出「AI全時直播」能力,實現(xiàn)24小時不停播
2、通過「AI直播間」和「短直聯(lián)動」兩大能力,降低直播成本
3、AI功能如智能腳本等,可增加直播效果
ChatGPT使用數(shù)據(jù)曝光 訪問量和編程需求自5月開始持續(xù)下滑
SparkToro公布數(shù)據(jù)分析結(jié)果顯示,ChatGPT的使用量和編程協(xié)助需求自5月份以來呈明顯下降趨勢。自5月份以來,ChatGPT官方網(wǎng)站OpenAI.com的月訪問量已經(jīng)下降了29%。更值得注意的是,使用ChatGPT進(jìn)行編程協(xié)助的比例也下降了30%。
要點:
1、自5月份以來,ChatGPT官方網(wǎng)站訪問量下降29%,編程協(xié)助使用下降30%,表明ChatGPT的熱潮正在減退。
2、分析顯示編程協(xié)助是ChatGPT的主要用途,占29%,其他用途包括教育、內(nèi)容創(chuàng)作、知識查詢、銷售和營銷等。
3、盡管ChatGPT在編程協(xié)助方面表現(xiàn)強勁,但隨著用戶了解其功能和局限性,長期吸引力存在不確定性,其持久性有待觀察。
加州議員提議規(guī)范AI模型
加州議員Scott Wiener提出法案,要求AI模型開發(fā)商達(dá)到透明度標(biāo)準(zhǔn)。該提案計劃建立加州AI研究所,在AI安全風(fēng)險方面進(jìn)行測試。Wiener的目標(biāo)是啟動關(guān)于如何監(jiān)管AI的討論。
圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney
要點:
1. 加州議員Scott Wiener提出法案,要求AI模型開發(fā)商達(dá)到透明度標(biāo)準(zhǔn)。
2. 該提案計劃建立加州AI研究所,在AI安全風(fēng)險方面進(jìn)行測試。
3. Wiener的目標(biāo)是啟動關(guān)于如何監(jiān)管AI的討論。
馬斯克呼吁成立人工智能聯(lián)邦部門
特斯拉CEO埃隆·馬斯克在國會山人工智能峰會后呼吁成立聯(lián)邦人工智能部門,認(rèn)為這次高調(diào)的技術(shù)領(lǐng)袖和研究人員峰會可能成為人類文明史上的重要會議。
要點:
1. 埃隆·馬斯克在峰會后表示人工智能發(fā)展?jié)撛谖:θ祟悾粲醭闪㈩愃艶AA的聯(lián)邦人工智能部門。
2. 本次峰會云集包括OpenAI、谷歌等科技公司CEO,討論AI監(jiān)管問題。
3. 出席者認(rèn)為需要加強AI安全監(jiān)管,但監(jiān)管細(xì)節(jié)還存在分歧。
歐盟將向人工智能初創(chuàng)公司開放超級計算機資源
歐盟計劃向人工智能初創(chuàng)公司開放超級計算機資源,以幫助它們訓(xùn)練AI模型,但需要初創(chuàng)公司加入歐盟的AI治理框架。歐盟委員會主席警告AI發(fā)展速度太快,存在風(fēng)險,呼吁建立機構(gòu)評估AI風(fēng)險。
要點:
1. 歐盟計劃開放超級計算機資源,助力人工智能初創(chuàng)公司訓(xùn)練AI模型。
2. 歐盟要求初創(chuàng)公司加入AI治理框架,以獲取使用權(quán)限。
3. 歐盟委員會主席警告AI發(fā)展過快,呼吁建立機構(gòu)評估AI風(fēng)險。
17名醫(yī)生束手無策3年未診斷 ChatGPT準(zhǔn)確診斷孩子的慢性疼痛
一名母親帶兒子見過17名醫(yī)生但未能確診慢性頭痛原因,后將癥狀輸入ChatGPT,ChatGPT正確診斷出罕見病脊髓栓系綜合癥。
圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney
要點:
1. 兒子頭痛3年,母親帶兒子見過17名專家,但都無法確診。
2. 母親將癥狀輸入ChatGPT,ChatGPT診斷出罕見病脊髓栓系綜合癥。
3. 醫(yī)生驗證ChatGPT診斷正確,為兒子進(jìn)行了手術(shù)治療。
?????聚焦開發(fā)者
Floneum開源:適用于 LLM 工作流程的圖形編輯器!
Floneum是一個面向本地AI和社區(qū)插件的圖形化工作流編輯器,提供簡單的圖形界面,無需編程就可以組合運行插件和本地AI模型。
項目地址:https://github.com/floneum/floneum
要點:
1、Floneum具備圖形化工作流界面,使用簡單,無需編程即可組合運行插件和本地AI模型。
2、支持本地運行大型語言模型,保障用戶隱私和數(shù)據(jù)安全。
3、開放的插件系統(tǒng),可以自定義模型行為,提升性能和效果。
日前,公眾號南瓜博士介紹了一款名為"人生重開模擬器"的偽代碼 prompt,旨在通過這個 prompt 來模擬玩家的人生經(jīng)歷,并讓 GPT-3自動根據(jù)玩家的選擇和屬性值生成相關(guān)事件,最終生成玩家一生的故事。這個偽代碼 prompt 的目的是使人們更容易創(chuàng)建具有邏輯的虛擬體驗,同時探索了如何使用偽代碼和自然語言混合編寫。
要點:
1、作者介紹了名為"人生重開模擬器"的偽代碼 prompt,目的是通過這個 prompt 模擬玩家的人生經(jīng)歷,生成玩家一生的故事,以及探索偽代碼和自然語言混合編寫的方法。
2、文章展示了模擬器的不同版本,從最初的純偽代碼到包含真實代碼和偽代碼的混合版本,討論了屬性分配、事件生成和屬性更新等模擬器的不同部分。
3、作者提出了改進(jìn)方向,如開局選擇天賦卡、使用隨機詞匯生成事件、添加成就,并介紹了提高穩(wěn)定性的方法,為構(gòu)建具有邏輯和互動性的虛擬體驗提供了有價值的思路和靈感。
Chupa:使用2D 擴散概率模型雕刻3D 穿衣人體
Chupa是一種新的3D人體生成方法,它將擴散模型與神經(jīng)渲染相結(jié)合,可以生成逼真且多樣化的3D人體。Chupa的創(chuàng)新之處在于它從SMPL-X網(wǎng)格生成高質(zhì)量的人體網(wǎng)格。具體來說,它首先使用擴散模型生成人體法線貼圖,然后基于法線貼圖進(jìn)行3D重建,還采用了擴散重采樣以提升全身和面部的質(zhì)量。Chupa可以輕松推廣到各種姿勢,并顯示真實的質(zhì)量。
項目地址:https://snuvclab.github.io/chupa/
要點:
1. Chupa使用擴散模型生成人體法線貼圖,然后進(jìn)行基于法線的3D重建。
2. Chupa采用擴散重采樣提升身體和面部區(qū)域的質(zhì)量。
3. Chupa可以輕松地推廣到各種姿勢,生成真實逼真的3D人體。
????大模型動態(tài)
騰訊 AI Lab聯(lián)合多家學(xué)術(shù)機構(gòu)發(fā)布大模型幻覺問題評估
騰訊AI Lab聯(lián)合多家學(xué)術(shù)機構(gòu)發(fā)布了面向大模型幻覺問題的綜述文章。研究將大模型幻覺分為三類,當(dāng)前研究重點是與事實知識沖突的幻覺。相比傳統(tǒng)模型,大模型幻覺評估面臨數(shù)據(jù)規(guī)模大、模型通用性強、幻覺不易察覺等新難題。為減少幻覺,可從多個方面進(jìn)行干預(yù),但仍存在可靠評估等挑戰(zhàn)。
-
論文鏈接:https://arxiv.org/abs/2309.01219
-
Github 鏈接:https://github.com/HillZhang1999/llm-hallucination-survey
要點:
1、大模型幻覺主要分為與輸入、上下文及事實沖突的三類,研究熱點在第三類。
2、相比傳統(tǒng)模型,大模型幻覺評估面臨數(shù)據(jù)規(guī)模大、通用性強、不易察覺等新難題。
3、緩解幻覺可從預(yù)訓(xùn)練、微調(diào)、強化學(xué)習(xí)、推理等方面入手,但仍有可靠評估等挑戰(zhàn)。