降本增效、自由交互的數字員工,360 智腦大模型應用落地實踐
8月30日,由微新創想主辦的2023AIGC技術應用大會在深圳舉行。本屆大會以“元載萬物·智啟新界”為主題,旨在聚焦AIGC技術的創新應用,打造深入探索AIGC產業落地的交流平臺。
會上,360集團副總裁梁志輝帶來了360智腦大模型應用落地實踐的最新產品和場景,其中精彩觀點如下:
大模型的時代,最容易取代你的并不是AI,而是比你先掌握AI的一些人。
很多企業希望能夠充分利用大模型的優勢:內容生成、內容理解和邏輯推理。所以我們針對這幾個需求,希望把大模型的能力充分發揮在企業最需要的地方。
以下為演講內容,由微新創想整理:
01 大模型驅動的數字人將顛覆生產關系
大模型的時代,最容易取代你的并不是AI,而是比你先掌握AI的一些人。
在這過程中我們認為大模型它更接近工業革命,我們相信未來不會只有一個大模型,未來每個公司、每個大企業都會訓練自己的大模型。剛才前面有些嘉賓也提到了,其實大模型發展方向是把它做小和做專,我們希望以后能夠把大模型能力賦能到百行千業,中小企業和大型企業都能用得上。
在這過程中,企業場景里去落地大模型會遇到什么問題呢?
一方面,作為一個中國企業,你很難用一個美國的ChatGPT。國內雖然也有很多類似的一些產品了。但這類大模型它可能會存在幾個問題:一是數據可能會泄漏。二是大模型的幻覺以及知識更新的問題,會讓它在很多企業內部無法使用。第三,如果你去建立一個私有的大模型,其實很多訓練大模型的數據,它是沒辦法做分級管理的。
很多企業很難去訓練自己的大模型,首先這個資金投入上會很大,并且對很多企業的員工來說比較費時費力。一個企業的IT部門去學會建自己的大模型、訓練一個大模型很貴,會訓練大模型的工程師更貴,正常來說一臺A100,價格大概在150萬,但是一個會用A100的工程師至少是兩三百萬年薪起,這是很多企業很難把大模型落地到自己的內部的原因所在。
目前我們正在積極擁抱大模型加Agent方向的一些能力。我們嘗試了很多新的方案,我們的底層不只有一個千億大模型,我們還會有一些百億大模型。其中有些百億大模型專門解決交流對話,有些專門解決文檔分析。我們目前已經能夠讓多個大模型協同工作。在這個大模型之上我們會構建一套AI Agent中間件平臺,讓絕大部分的用戶不用直接用大模型,而是通過一些更友好的、角色代入、數字人的形式去使用,同時讓大模型結合外部的信息進行數據學習。360本來也是國內第二大搜索引擎公司,因此們跟搜索上也做了很多的結合,讓大模型學會進行一些信息的爬取,讓一些API能夠接入。
具體到落地場的景,我們就是希望能解決兩個問題。第一,對內能夠降本增效。第二,能夠提升數字人交互的自由度。
先說降本增效。這種既有最強大腦又有最佳外表的數字人能夠7×24小時替你工作。我們可以給很多企業產出一些這種對外有互動功能的輸出型數字人,例如數字名人、數字客服、數字銷售、數字主播等。
在數字人這一塊,其實我們今天在很多平臺上也看到了一些數字人形象的產品,但他不見得是基于真人。目前來說我們也看到小紅書上的一些號,其實它都已經是AI生成的。今天我們希望把這種技術提升到另外一個階段,我們希望這個人他有最佳的形象,他甚至可以跟你說話,可以做情感陪伴或者甚至可以幫你工作。
在前兩年大家談到的數字人很多都是這種影視級的數字人,比如說什么希加加、柳夜熙。但是這樣的數字人有一個很核心的問題,首先它每一分鐘的內容生產成本超過10萬,在這種場景下你只能把它當成一個拍電影的方式來進行運營,絕大部分企業是用不起來的。
再來說自由交互。現在很火的能做形象客服的數字人,也存在一定的問題。我們跟很多這種終端用戶交流后發現,如果今天要做一個直播的話,用這樣的數字人是很容易被封號的。為什么呢?因為很多觀眾看到我跟你交流,你不進行回答的話,他會懷疑你這個視頻實際上是錄播。我們問過同行,就類似于這樣的一些形象克隆數字人,他被封號的概率超過40%,因為很多人其實是能看出來這是個假的。
所以在這種場景,我們希望基于大模型去構造的數字人能夠實現跟人之間的自由對話,他每次對話的延遲控制在3秒以內,目前來說這個我們已經做到了。并且,他是可以有記憶、有靈魂的。那為什么叫有記憶呢?實際上所有人跟它說過的話,今天你告訴他我的女朋友,或者我老婆什么時候出生的、什么時候認識的,他可以把這個信息記住,下次再跟你聊的時候他不會像一個全新的操作系統一樣每次都會遺忘。再者他會主動上網學習一些最新的資訊,能夠根據最新的熱搜來幫你編輯一篇小紅書的文案,而不是胡編亂造。
化成具體的角色,今天我們已經能夠用大模型生成數字客服、數字銷售、數字主播和數字名人,后面我們會有一些具體例子可以看到。
像這樣一個“數字老周”,其實就是我們做的一個案例。第一次做這個案例的時候是因為他陽了,出席不了某次大會,后來發現這種方式非常好。為什么呢?因為這樣的視頻其實我們后來給不同級別的領導都看過,反響非常不錯。只需要一張照片、一段音頻就能復刻我的形象、我的聲音。只要把演講稿、把他過往寫過的書輸入就能獲得他的這種說話風格。
同時我們也可以用這樣的一種形式解決直播帶貨的問題。例如,數字人可以在直播間里面自動抓取一些問題來自己回答。在這種互動場景中,看直播的用戶不會覺得它是個數字人,他以為就是一個真人。同時在很多文旅和客服的場景里都需要有一個人親自給你做接待、銷售、介紹,今天有了這套大模型,以及AI Agnet的平臺之后,我們可以讓這樣的一個數字人更好的帶入自己的角色。它可以看得見、聽得懂、說得好,它能夠克隆你的形象、聲音、動作以及思維,可以非常自然的進行人與人之間的交互。
像這樣的數字人我們其實是做給安徽省的新華書店的。未來我們可以看到,有可能在書店里有一個無人區,這個區域所有的圖書推薦都是由這個數字人來完成。通過這樣的數字人,以及大家看到的老周的演講,大家已經知道它已經是一個完成度比較高的產物了。在這個過程里面,實際上“數字老周”可以完成PPT的演講,甚至在很多場景中還可以做這種類似于自由的對答。
02 從大模型到數字員工, 賦能企業最需要的場景
我們關注到很多企業希望能夠充分利用大模型的優勢:內容生成、內容理解和邏輯推理。所以在這個過程里面我們針對這幾個需求,希望把大模型的能力充分發揮在企業最需要的地方。
我們希望大模型可以變成員工的知識助手、辦公助手和領導的決策助手。比如說,以往總監或者是總經理以上一般才有自己的助理,這個高級領導讓底下的助理幫他寫一些文案,做一些內容分析,以及去安排一些會議。但是我們會發現很多企業里面不只是領導需要這樣的一個數字員工,其實每個員工本身也希望有不同的助手能夠幫他去做這些文案的撰寫、行研的分析,以及類似這種多模態的音視頻創作。
在這個過程里面,實際上我們做了一個AI數字員工的平臺,在默認的情況下我們已經預訓練出來9個AI數字員工。在這9個AI數字員工里面有能幫你寫文案的、能幫你做社媒分析的、有能幫你做翻譯的。在這種場景中我們還挖掘了一些新的應用出來,也就是說怎么樣讓幾個AI數字人工能夠幫你去協同完成一個任務。我們的產品里面支持企業知識庫,所以我也許未來一個人開一家公司不是夢想。大家可以利用AI來完成很多執行上、協作上、內容分析上的工作。同時我們關注到,由于大模型的內容生成能力非常強,所以我們根據很多企業的一些應用場景,把這種類似于寫工作報告,寫一些周期性有固定格式的文檔工作交給大模型。
我們就以寫公文為例,以前一個小時最多寫個一千字,但是在我們的AI數字員工的幫助下一個小時可以寫一萬字。同時我們可以利用我們的360鴻圖的能力來進行生圖。過去其實我們360也有這種大量圖片的需求,因為我們是一個搜索引擎,我們有大量的推廣物料要持續產出。所以在這種場景中,AI數字員工率先在360內部使用起來。我們每張圖的生產時間大概是2-3分鐘之間,如果要找設計師去做這樣的一張圖,他即使用視覺中國的圖修改,一天最多做十張、八張就了不起了。現在我們一個搜索關鍵詞對應一個配圖,源源不斷地讓AI來生成,一天生成10萬張還是100萬張,其實取決于我們部署多少算力。
很多企業內部其實都會有文檔分析的需求,在我們的AI數字員工里,我們試過把一個非常長的文章讓AI進行分析和訓練。同樣的一份文檔,如果真人去做閱讀、分析、理解、總結,那可能幾個小時就過去了。但讓AI來做這個事情,200頁的財報,可能10分鐘它就可以給你提煉,你可以從各種角度來對它進一步分析。
對于企業用戶來說,我們如果要寫一個文檔,做一個行業分析,你首先要讓大模型知道你的企業是干什么的。所以我們提供了一種非常輕量級的,基于知識庫的大模型工具。企業相關的知識,很多場景里其實都是以文檔來呈現的。你可以導入一些網站和數據,在這種場景中你去建立自己的一個知識庫大模型將會非常快、非常輕便。傳統的大模型預訓練大概要花一個月,做微調也要花大概一周的時間。基于我們企業級的大模型訓練方案,你只要把幾百兆的文檔上傳,那我們的訓練時間在一個小時之內就能完成。
以上是我們360在企業實際業務場景中大模型落地的一些案例和經驗,謝謝大家!
更多活動大會一手信息,歡迎加入微新創想會員,現場聆聽一線投資人、頭部企業家精彩分享,掌握最新創投趨勢!