人人人免费人人专区人人,欧美精品不卡,欧美大片无尺码在线观看,久久精品小视频,成人免费黄色大片,欧美+亚洲+精品+三区

從模擬到創(chuàng)新:人工智能從游戲中學(xué)到了什么?

編者按:本文來自微信公眾號 騰訊研究院( ID:cyberlawrc),作者:王樞、孟靖之,微新創(chuàng)想經(jīng)授權(quán)轉(zhuǎn)載。

7月13日《Science》雜志刊發(fā)名為《游戲持續(xù)驅(qū)動(dòng)著人工智能發(fā)展進(jìn)步》文章,詳細(xì)論述了游戲與人工智能的發(fā)展關(guān)系,認(rèn)為“游戲?yàn)橥ㄓ弥悄芄ぷ魈峁┝饲熬皬V闊的應(yīng)用領(lǐng)域,將游戲作為研究人工智能的平臺(tái),給價(jià)值2000億美元全球電子游戲產(chǎn)業(yè)帶來了直接的助益。”[1]

那么,游戲與人工智能之間到底有著怎樣的關(guān)系,游戲究竟是如何推動(dòng)人工智能的發(fā)展與進(jìn)步,而這些又會(huì)對人們的生活帶來哪些影響?

協(xié)同共生:游戲與人工智能的相輔相成

回顧整個(gè)信息科學(xué)或計(jì)算機(jī)科學(xué)的發(fā)展歷史,不難發(fā)現(xiàn)游戲幾乎貫穿著整個(gè)人工智能研究的發(fā)展過程,人工智能領(lǐng)域中每一次里程碑式的突破都與游戲密切相關(guān)。此前,廈門大學(xué)游戲哲學(xué)研究中心等從理論、硬件、應(yīng)用三個(gè)層面論述了游戲與人工智能發(fā)展之間的關(guān)系[2]:

游戲啟發(fā)人工智能理論,助力人工智能研究發(fā)展。從1950年信息之父香農(nóng)以國際象棋為對象開始研究人工智能,到人工智能先驅(qū)塞繆爾基于國際跳棋發(fā)明強(qiáng)化學(xué)習(xí)算法。國際象棋、跳棋等棋類游戲一直被認(rèn)為是“AI研究的果蠅”,即低成本、可感知地快速驗(yàn)證問題的媒介。如今,游戲產(chǎn)業(yè)的快速發(fā)展直接促進(jìn)了人工智能理論研究的繁榮。1971年到2015年間,與游戲相關(guān)的人工智能研究論文數(shù)量不足1000篇,但從2015年AlphaGO戰(zhàn)勝三屆歐洲圍棋冠軍選手樊麾后,與游戲相關(guān)的人工智能研究出現(xiàn)爆發(fā)式增長,2015—2022年的7年里,相關(guān)論文數(shù)量就達(dá)到1625篇,其中有17篇論文成為《自然》(Nature)和《科學(xué)》(Science)的封面文章。[3]

游戲推動(dòng)人工智能算力基礎(chǔ)設(shè)施GPU(圖形顯卡)創(chuàng)新迭代。以芯片公司英偉達(dá)為例,從1995-2022年英偉達(dá)游戲及數(shù)據(jù)中心業(yè)務(wù)營收及總營收變化情況來看,早期英偉達(dá)收入幾乎全部來自于游戲業(yè)務(wù),依托游戲業(yè)務(wù)的英偉達(dá)完成了資金積累,并構(gòu)筑起技術(shù)壁壘,為后續(xù)轉(zhuǎn)型蓄力。如今,英偉達(dá)憑借在游戲顯卡的豐富技術(shù)積累和高額研發(fā)投入,快速崛起為人工智能芯片的龍頭,目前英偉達(dá)在AI訓(xùn)練芯片市場占有率高達(dá)95%[4]。游戲顯卡積累的許多技術(shù),也成為英偉達(dá)GPU的關(guān)鍵底層能力,被運(yùn)用到自動(dòng)駕駛、醫(yī)療、生命科學(xué)、能源、金融服務(wù)、制造業(yè)等更多領(lǐng)域。

游戲?yàn)槿斯ぶ悄芴峁┛煽赜?xùn)練環(huán)境與清晰測量標(biāo)準(zhǔn)。游戲中包含著目標(biāo)、規(guī)則和挑戰(zhàn),解決挑戰(zhàn)的過程就體現(xiàn)了智能。因此,當(dāng)創(chuàng)造一個(gè)能夠完成某種游戲的程序時(shí),可以認(rèn)為這個(gè)程序?qū)⒃谝欢ǔ潭壬蠐碛心撤N“類人”的“智能” 。一方面,游戲中具有豐富的人機(jī)交互場景和穩(wěn)定可控的規(guī)則,能夠解決人工智能科研場景缺失問題。另一方面,游戲?yàn)槿斯ぶ悄芴峁┣逦鷾y量標(biāo)準(zhǔn),用游戲中清晰、可量化的規(guī)則評估人工智能的能力,可大幅提升技術(shù)迭代與測試效率。

伴隨著技術(shù)迭代與應(yīng)用創(chuàng)新,越來越多的企業(yè)、高校和科研機(jī)構(gòu)開始基于游戲開展人工智能創(chuàng)新研究。游戲人工智研究已從最初致力于創(chuàng)造類人水平的智能體,實(shí)現(xiàn)在完美信息/非完美信息環(huán)境中與人類進(jìn)行對抗(例如基于《星際爭霸2》的人工智能AlphaStar,基于《DOTA2》的人工智能OpenAIFive等),延伸至關(guān)注游戲(虛擬環(huán)境)中各類內(nèi)容的自動(dòng)生成,從而進(jìn)一步提升人機(jī)交互體驗(yàn)。在前不久,2023世界人工智能大會(huì)上,多所高校聯(lián)合發(fā)起“游戲人工智能高校聯(lián)合研究中心”,聚焦游戲與人工智能產(chǎn)業(yè)之間的發(fā)展關(guān)系。

從簡單規(guī)則到復(fù)雜模擬:人類教AI學(xué)會(huì)“行走與奔跑”

在眾多關(guān)注交互體驗(yàn)的游戲人工智能研究中,比較典型的當(dāng)屬智能體的動(dòng)作生成。智能體是能夠根據(jù)不同的內(nèi)外條件做出動(dòng)作和反應(yīng)的、被機(jī)器控制的虛擬或現(xiàn)實(shí)客體,典型代表是游戲中的非玩家控制角色(NPC)。智能體動(dòng)作生成技術(shù)主要研究如何讓智能體的行為動(dòng)作能夠像真人一樣流暢和自然,進(jìn)一步提升人機(jī)交互體驗(yàn)。如果說人工智能研究中計(jì)算機(jī)視覺、自然語言處理等領(lǐng)域分別關(guān)注圖像、文字、語言理解方面的能力,那么智能體動(dòng)作生成對應(yīng)著人工智能對行為動(dòng)作控制的領(lǐng)域。

歷史地看,動(dòng)作生成技術(shù)的發(fā)展經(jīng)歷了從簡單規(guī)則到復(fù)雜模擬的過程,從最早的有限狀態(tài)機(jī)到運(yùn)動(dòng)匹配算法,再到基于機(jī)器學(xué)習(xí)的作生成,通過模擬人類行為動(dòng)作,智能體逐漸學(xué)會(huì)了像人類一樣的行走與奔跑。

(一)基于規(guī)則匹配的動(dòng)作生成

1、基于狀態(tài)機(jī)的動(dòng)作生成

在虛擬環(huán)境中,智能體的各種動(dòng)作,如行走、跑步、跳躍、攻擊等,被視為不同的狀態(tài)。早期的開發(fā)者通常會(huì)使用“狀態(tài)機(jī)”來控制智能體的行為動(dòng)作,其做法是將智能體不同的動(dòng)作根據(jù)不同的條件拼接到一起。該做法的優(yōu)勢在于能明確定義狀態(tài)間的轉(zhuǎn)換規(guī)則,例如行走狀態(tài)可轉(zhuǎn)變?yōu)榕懿交蛱S。下圖為游戲中智能體使用的有限狀態(tài)機(jī)。

圖1 游戲中的狀態(tài)機(jī)示意圖[5]

不難發(fā)現(xiàn),該做法的優(yōu)勢在于能明確定義狀態(tài)間的轉(zhuǎn)換規(guī)則,例如行走狀態(tài)可轉(zhuǎn)變?yōu)榕懿交蛱S;局限在于處理復(fù)雜的行為交互和預(yù)見未來的狀態(tài)變化,可能有困難。由于需要手寫邏輯從一個(gè)節(jié)點(diǎn)跳到另一個(gè)節(jié)點(diǎn),對于高度復(fù)雜的系統(tǒng),狀態(tài)機(jī)的設(shè)計(jì)和維護(hù)可能會(huì)變得極為復(fù)雜和費(fèi)時(shí)。

2、基于運(yùn)動(dòng)匹配的動(dòng)作生成

為了解決狀態(tài)機(jī)的應(yīng)用局限,游戲人工智能科學(xué)家們開始探索更高效的動(dòng)作生成方案,運(yùn)動(dòng)匹配技術(shù)(Motion Matching)應(yīng)運(yùn)而生。相比狀態(tài)機(jī),該技術(shù)不再需要手動(dòng)拼接不同的動(dòng)作捕捉數(shù)據(jù)片段,而是使用動(dòng)作捕捉數(shù)據(jù)建立一個(gè)動(dòng)作姿態(tài)數(shù)據(jù)庫,根據(jù)智能體當(dāng)前的狀態(tài)和目標(biāo)狀態(tài),實(shí)時(shí)選擇和混合最合適的動(dòng)作片段。由此,可根據(jù)角色的實(shí)時(shí)狀態(tài)和環(huán)境因素,實(shí)現(xiàn)更復(fù)雜和精細(xì)的動(dòng)畫控制,讓智能體呈現(xiàn)出更自然、流暢的動(dòng)作效果。

圖2 Motin Matching流程示意圖[6]

當(dāng)然,運(yùn)動(dòng)匹配技術(shù)在實(shí)踐中也存在一定的局限,比如在使用時(shí)需要把所有的動(dòng)畫數(shù)據(jù)都保留在內(nèi)存里,對內(nèi)存占用較大;所有的動(dòng)畫都是數(shù)據(jù)庫中已有的內(nèi)容,無法實(shí)現(xiàn)動(dòng)作動(dòng)畫的創(chuàng)新。即便是《荒野大鏢客2》這樣將NPC做得足夠逼真的游戲大作中,也只是實(shí)現(xiàn)了“運(yùn)動(dòng)匹配”。雖然游戲?yàn)轳R設(shè)計(jì)了數(shù)百種不同的動(dòng)作動(dòng)畫,甚至連喘氣都有上百種不同的音,但這些都不是真正的智能,只是由龐大的狀態(tài)機(jī)規(guī)則和動(dòng)畫資源堆疊而成。

(二)基于機(jī)器學(xué)習(xí)的智能體動(dòng)作生成

無論是基于狀態(tài)機(jī)還是運(yùn)動(dòng)匹配技術(shù),本質(zhì)上都并未實(shí)現(xiàn)真正的智能動(dòng)作生成,在落地應(yīng)用過程中都存在著系統(tǒng)復(fù)雜且損耗大的問題。那么,有沒有一種方法可以在訓(xùn)練模型時(shí)隨心所欲地添加盡可能多的動(dòng)作數(shù)據(jù),在運(yùn)行游戲時(shí)也不需要把這些額外數(shù)據(jù)放進(jìn)內(nèi)存里的方案呢?

為此,海內(nèi)外學(xué)界和業(yè)界進(jìn)行了許多探索,嘗試基于機(jī)器學(xué)習(xí)實(shí)現(xiàn)智能體動(dòng)作的自動(dòng)生成。在海外,美國EA公司于2021年開發(fā)出HyperMotion技術(shù),極大提升了FIFA系列游戲中智能體動(dòng)作的逼真程度和響應(yīng)速度。該技術(shù)方案首先利用動(dòng)作捕捉技術(shù)捕捉了22名人類職業(yè)足球運(yùn)動(dòng)員在比賽中超過870萬幀的動(dòng)作數(shù)據(jù),然后使用機(jī)器學(xué)習(xí)算法從870萬幀數(shù)據(jù)中不斷學(xué)習(xí),最終實(shí)現(xiàn)游戲內(nèi)智能體動(dòng)作的實(shí)時(shí)生成。[7]

在國內(nèi),2019年以來騰訊就嘗試將自回歸神經(jīng)網(wǎng)絡(luò)模型(ARNN)應(yīng)用到智能體的動(dòng)作生成解決方案中,并取得突破性進(jìn)展。ARNN是一種廣泛應(yīng)用于分析和處理時(shí)間序列數(shù)據(jù)的機(jī)器學(xué)習(xí)算法,經(jīng)常用在天氣、股市預(yù)測等場景。如果能將其用在動(dòng)作領(lǐng)域,就能實(shí)現(xiàn)通過大量真人動(dòng)作捕捉從而輸入數(shù)據(jù)訓(xùn)練,讓AI模型預(yù)測出動(dòng)作序列幀的下一幀,最終連貫生成完整、自然的動(dòng)作。

為實(shí)現(xiàn)這一目標(biāo),2019年天美J3工作室的《逆戰(zhàn)手游》團(tuán)隊(duì)聯(lián)手騰訊RoboticsX實(shí)驗(yàn)室,基于ARNN模型的研究,開啟并逐漸完成了游戲及機(jī)器人領(lǐng)域的交叉前沿技術(shù)——“智能體動(dòng)作生成技術(shù)”研發(fā)。該技術(shù)以ARNN模型原理為基石,學(xué)習(xí)動(dòng)作捕捉數(shù)據(jù),通過數(shù)據(jù)驅(qū)動(dòng)的自適應(yīng)算法,讓NPC或機(jī)器人能根據(jù)玩家操作或環(huán)境變化等外界不同反應(yīng),自動(dòng)生成更像真實(shí)生物的動(dòng)作、反應(yīng)與表達(dá)。

圖3 智能體動(dòng)作生成技術(shù)示意圖

騰訊逆戰(zhàn)手游團(tuán)隊(duì)提出的這一套基于ARNN的動(dòng)作生成技術(shù)解決方案,在業(yè)內(nèi)實(shí)現(xiàn)了多個(gè)突破:

第一,為了落地自回歸神經(jīng)網(wǎng)絡(luò)算法,研究人員從零建立起完整的工具鏈,并通過動(dòng)作捕捉、動(dòng)畫預(yù)處理、訓(xùn)練與調(diào)優(yōu)等步驟,建立起完整的制作管線。為了解決該技術(shù)在移動(dòng)端應(yīng)用時(shí)可能存在的網(wǎng)絡(luò)同步和性能優(yōu)化問題,團(tuán)隊(duì)采用了軌跡匹配技術(shù)、融合動(dòng)畫技術(shù)以及相應(yīng)算法層面的解決方案,極大提升了整體的效果表現(xiàn),降低了神經(jīng)網(wǎng)絡(luò)推理的內(nèi)存開銷。

第二,研究團(tuán)隊(duì)聯(lián)合騰訊RoboticsX實(shí)驗(yàn)室,將智能體動(dòng)作生成技術(shù)應(yīng)用于四足機(jī)器人,幫助其實(shí)現(xiàn)智能控制、決策,并大幅提升訓(xùn)練效率。在算法本身的應(yīng)用上,這套技術(shù)能幫助機(jī)器人提升思考能力,幫助機(jī)器人進(jìn)行自主決策,自動(dòng)根據(jù)外界反應(yīng),生成更像真實(shí)生物的動(dòng)作、反應(yīng)與表達(dá)。在持續(xù)的研究與訓(xùn)練下,搭載該技術(shù)的機(jī)器人經(jīng)過大量模擬訓(xùn)練之后,已經(jīng)學(xué)會(huì)了走、跑、跳、站立等真狗的動(dòng)作,并能夠靈活運(yùn)用這些姿態(tài)去完成匍匐前進(jìn)、跨欄跑、障礙物之間跑酷穿梭等各種任務(wù);即使臨時(shí)碰到預(yù)先不知道的障礙物,也能輕輕一閃,靈巧避開,自主修改運(yùn)動(dòng)軌跡,用不同路線方案完成既定目標(biāo)(如下圖)。[8]

圖4 騰訊自主研發(fā)多模態(tài)四足機(jī)器人

從模仿到超越:游戲人工智能影響現(xiàn)實(shí)世界

基于游戲環(huán)境,人類已經(jīng)教會(huì)了人工智能如何更好地在虛擬環(huán)境中實(shí)現(xiàn)“行走與奔跑“,但游戲人工智能研究的價(jià)值并不止于此。正如《Science》雜志文章中提到,“在游戲中取得人工智能方面的進(jìn)展,也將是朝著在現(xiàn)實(shí)世界中運(yùn)行更強(qiáng)大、更靈活的人工智能系統(tǒng)所邁出的重要一步。”人工智能在游戲中通過“模仿”學(xué)到的十八般武藝,在多種現(xiàn)實(shí)問題和場景中都具有可遷移的、通用的特性與價(jià)值。

在國內(nèi)外學(xué)界和業(yè)界的實(shí)踐中,來自科研機(jī)構(gòu)和企業(yè)的研究人員也在嘗試將更多的游戲人工智能技術(shù)應(yīng)用與其他領(lǐng)域,用游戲AI連接實(shí)體經(jīng)濟(jì),在更多領(lǐng)域形成數(shù)字生產(chǎn)力:

在醫(yī)療診斷領(lǐng)域,游戲人工智能的相關(guān)技術(shù)在醫(yī)學(xué)研究和臨床實(shí)踐等醫(yī)療健康領(lǐng)域也有所引用,包括個(gè)性化篩查、診斷、預(yù)后、監(jiān)測、風(fēng)險(xiǎn)建模、藥物發(fā)現(xiàn)和治療反應(yīng)預(yù)測等等。尤其是在提高疾病識(shí)別和診斷的速度以及準(zhǔn)確性方面,游戲人工智能技術(shù)提供了有效的支持。游戲人工智能技術(shù)還可以通過歷史數(shù)據(jù)模擬患者病情或手術(shù)的虛擬場景,通過強(qiáng)化學(xué)習(xí)來為醫(yī)療決策提供支持,同時(shí)也使得機(jī)器人輔助手術(shù)成為可能。

在教育活動(dòng)領(lǐng)域,游戲人工智能也擁有著巨大的應(yīng)用潛力。一方面,人們可以參考游戲人工智能的研究成果,創(chuàng)建或完善“基于游戲的學(xué)習(xí)”(Gamebased learning)、“游戲化教育”(Gamification in Education)等新形式的教學(xué)活動(dòng),從而在傳統(tǒng)教學(xué)的過程中融入游戲所特有的要素、機(jī)制,達(dá)成提升學(xué)習(xí)效果的目的;另一方面,人們也可以利用《我的世界》《星際爭霸》《王者榮耀》等游戲環(huán)境,來幫助人工智能教學(xué)活動(dòng)的進(jìn)行(事實(shí)上,當(dāng)前強(qiáng)化學(xué)習(xí)的教學(xué)活動(dòng),幾乎不可能脫離游戲環(huán)境來進(jìn)行)。[9]

可以預(yù)見的是,在未來一段時(shí)間中,讓游戲人工智能技術(shù)走出游戲環(huán)境將成為一個(gè)主要的應(yīng)用方向。我們也期待,游戲人工智能能夠在走出虛擬世界后,助力各行各業(yè)的創(chuàng)新發(fā)展。

感謝騰訊天美J3工作室多位專家在本文寫作過程中給予的指導(dǎo)。

參考資料來源:

[1]Wurman,P. R., Stone, P., & Spranger, M. (2023). Improving artificial intelligence with games. Science,381(6654), 147-148.

[2] 廈門大學(xué)游戲哲學(xué)研究中心等《游戲人工智能產(chǎn)業(yè)觀察報(bào)告》

[3]中科院團(tuán)隊(duì)最新研究:游戲科技已成為人工智能創(chuàng)新發(fā)展的重要驅(qū)動(dòng)力.https://tech.cnr.cn/techph/20230426/t20230426_526232049.shtml

[4]從游戲到AI加速:英偉達(dá)向左,AMD向右.

https://36kr.com/p/2161239632849413

[5]Holden, Daniel. "Character Control with Neural Networks and Machine Learning".https://www.gdcvault.com/play/10253

[6]Holden, Daniel. "Character Control with Neural Networks and Machine Learning".https://www.gdcvault.com/play/10253

[7]FIFA22 Hypermotion Technology.

https://www.ea.com/en-au/games/fifa/fifa-22/hypermotion

[8]騰訊機(jī)器人最新動(dòng)態(tài):跟真狗學(xué)“奔跑跳躍”

https://mp.weixin.qq.com/s/vv5DsK6zjQBAsaNFh5Pxuw

[9]廈門大學(xué)游戲哲學(xué)研究中心《游戲人工智能發(fā)展報(bào)告2023》

本文為專欄作者授權(quán)微新創(chuàng)想發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表微新創(chuàng)想立場,轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問,請聯(lián)系http://www.i0562.net/。

您可能還喜歡...

發(fā)表回復(fù)

您的郵箱地址不會(huì)被公開。 必填項(xiàng)已用 * 標(biāo)注