隱拓智安聯(lián)合清華大學(xué)電子系NGNLab實(shí)驗(yàn)室共同搭建首個(gè)大模型合規(guī)自動化評測平臺,為中小科技企業(yè)提供私有大模型合規(guī)評測服務(wù)
引言
隨著去年11月份ChatGPT的火爆,生成式人工智能成為2023年以來科技領(lǐng)域的一大風(fēng)口。國外、國內(nèi)多家科技巨頭紛紛加緊布局,加速跟進(jìn)生成式人工智能服務(wù)和產(chǎn)品的研發(fā)與上市。但生成式人工智能火爆的同時(shí),也帶來諸如侵犯個(gè)人隱私、侵犯知識產(chǎn)權(quán)、傳播虛假信息、實(shí)施網(wǎng)絡(luò)詐騙等諸多法律及道德危害。
5月22日,#AI詐騙正在全國爆發(fā)#的話題沖上熱搜第一,起因是包頭警方發(fā)布一起利用人工智能(AI)實(shí)施電信詐騙的典型案例,福州市某科技公司法人代表郭先生10分鐘內(nèi)被騙430萬元。這起案件引起了網(wǎng)友們的廣泛討論。
國家相關(guān)部門也十分關(guān)注AIGC技術(shù)所帶來的社會影響,4月11日國家互聯(lián)網(wǎng)信息辦公室起草了《生成式人工智能服務(wù)管理辦法(征求意見稿)》,向社會公開征求意見。
5月23日,國家互聯(lián)網(wǎng)信息辦公室2023年第12次室務(wù)會會議審議通過《生成式人工智能服務(wù)管理暫行辦法》(以下簡稱《辦法》),并經(jīng)國家發(fā)展和改革委員會、教育部、科學(xué)技術(shù)部、工業(yè)和信息化部、公安部、國家廣播電視總局同意,于7月13日公布,自8月15日起正式實(shí)施。“安全”在本次文件中出現(xiàn)頻次達(dá)到了14次。
《辦法》第四條明確了生成式人工智能服務(wù)堅(jiān)持發(fā)展與安全并重、促進(jìn)創(chuàng)新與依法治理相結(jié)合的總體原則。規(guī)定提供和使用生成式人工智能服務(wù)應(yīng)當(dāng)堅(jiān)持社會主義核心價(jià)值觀,不得生成法律、行政法規(guī)禁止的內(nèi)容,采取措施防止產(chǎn)生歧視,尊重知識產(chǎn)權(quán)、商業(yè)道德以及個(gè)人信息權(quán)益,提高生成內(nèi)容的準(zhǔn)確性和可靠性。
基于上述原則,《辦法》第七條和第八條分別針對生成式人工智能的數(shù)據(jù)訓(xùn)練和標(biāo)注等關(guān)鍵技術(shù)環(huán)節(jié)制定詳細(xì)規(guī)定。
數(shù)據(jù)是大模型的“燃料”,訓(xùn)練數(shù)據(jù)的規(guī)模和質(zhì)量將直接影響人工智能模型的最終表現(xiàn)。但與此同時(shí),模型最終的輸出內(nèi)容也將深深打上訓(xùn)練數(shù)據(jù)的烙印,包括其代表的價(jià)值觀等。因此《辦法》第七條首先要求用于生成式人工智能服務(wù)的訓(xùn)練數(shù)據(jù)、優(yōu)化訓(xùn)練數(shù)據(jù)和基礎(chǔ)模型來源合法,即不得使用非法網(wǎng)站的數(shù)據(jù)進(jìn)行模型訓(xùn)練。來源非法的數(shù)據(jù)中可能包含不符合社會主義核心價(jià)值觀的內(nèi)容,基于這些數(shù)據(jù)訓(xùn)練的模型,其生成的內(nèi)容也必然將存在社會主義核心價(jià)值觀偏差。
在保證訓(xùn)練數(shù)據(jù)來源合法的基礎(chǔ)上,提供者還需要進(jìn)一步確保訓(xùn)練數(shù)據(jù)內(nèi)容合法。具體來說,不得侵害他人依法享有的知識產(chǎn)權(quán),不得非法使用他人的個(gè)人信息等。提供者需要采取有效措施提高訓(xùn)練數(shù)據(jù)質(zhì)量、增強(qiáng)訓(xùn)練數(shù)據(jù)的真實(shí)性、準(zhǔn)確性、客觀性、多樣性。
數(shù)據(jù)標(biāo)注是大模型訓(xùn)練過程中的第二個(gè)關(guān)鍵技術(shù)環(huán)節(jié),它是實(shí)現(xiàn)模型生成內(nèi)容和人類期望對齊的非常關(guān)鍵的手段。因此《辦法》第八條強(qiáng)調(diào)提供者在數(shù)據(jù)標(biāo)注過程中,應(yīng)當(dāng)制定符合本辦法要求的清晰、具體、可操作的標(biāo)注規(guī)則,以保證模型輸出結(jié)果與本辦法要求對齊。同時(shí),提供者需要進(jìn)行細(xì)致的過程管理,開展數(shù)據(jù)標(biāo)注質(zhì)量評估,抽樣核驗(yàn)標(biāo)注內(nèi)容的準(zhǔn)確性。對標(biāo)注人員進(jìn)行必要培訓(xùn),提升尊法守法意識,監(jiān)督指導(dǎo)標(biāo)注人員規(guī)范開展標(biāo)注工作。
特別需要強(qiáng)調(diào)的是,《辦法》第九條明確提出,提供者應(yīng)當(dāng)依法承擔(dān)網(wǎng)絡(luò)信息內(nèi)容生產(chǎn)者責(zé)任,履行網(wǎng)絡(luò)信息安全義務(wù)。生成式人工智能服務(wù)提供者在向公眾提供內(nèi)容生成服務(wù)時(shí),應(yīng)當(dāng)意識到其生成的內(nèi)容具有較強(qiáng)的輿論屬性或社會動員能力,因此必須嚴(yán)格把控輸出內(nèi)容安全,壓實(shí)其內(nèi)容生產(chǎn)者的責(zé)任。這是確保生成式人工智能真正實(shí)現(xiàn)安全、可靠、可控的必由之路。
除此外,《辦法》還明確了生成式人工智能服務(wù)提供者應(yīng)當(dāng)履行的服務(wù)提供者義務(wù)。包括第九條要求對涉及的個(gè)人信息履行個(gè)人信息保護(hù)義務(wù),第十條要求對未成年人采取防沉迷措施的保護(hù)義務(wù),第十一條要求對使用者的輸入信息和使用記錄依法履行保護(hù)義務(wù),第十三條要求提供安全、穩(wěn)定、持續(xù)的服務(wù),第十五條要求建立健全投訴、舉報(bào)機(jī)制。
上述內(nèi)容從多個(gè)角度明確了生成式人工智能服務(wù)提供者應(yīng)當(dāng)履行的服務(wù)提供者義務(wù),預(yù)期能進(jìn)一步規(guī)范未來大量涌現(xiàn)的生成式人工智能服務(wù)。
隱拓智安團(tuán)隊(duì)長期持續(xù)與相關(guān)部門保持著積極溝通,明確生成式人工智能模型合規(guī)的質(zhì)量標(biāo)準(zhǔn)和邊界,并與清華大學(xué)電子系NGNLab實(shí)驗(yàn)室和清華大學(xué)天津電子信息研究院網(wǎng)絡(luò)開源情報(bào)技術(shù)創(chuàng)新研究中心達(dá)成技術(shù)合作,共同搭建首個(gè)大模型合規(guī)自動化評測平臺,未來將開放給中小科技企業(yè)進(jìn)行私有大模型合規(guī)評測服務(wù),幫助中小科技企業(yè)合法合規(guī)的為廣大用戶提供生成式人工智能服務(wù)。
AIGC應(yīng)用服務(wù)安全合規(guī)現(xiàn)狀
6月初,隱拓智安依據(jù)國家網(wǎng)信辦4月發(fā)布的《生成式人工智能服務(wù)管理辦法(征求意見稿)》開展,從數(shù)據(jù)安全、模型安全和內(nèi)容安全和三方面對市面上生成式人工智能應(yīng)用的安全性進(jìn)行全面的檢驗(yàn)。評測采用了定量注入違規(guī)內(nèi)容提示詞的方式,從敏感內(nèi)容、違法內(nèi)容、不良內(nèi)容和虛假內(nèi)容等方面檢測生成式人工智能應(yīng)用在大模型安全上的防范機(jī)制是否健全,以及最終生成內(nèi)容是否存在違規(guī)。
結(jié)果顯示,經(jīng)受測試的90%的生成式人工智能應(yīng)用已經(jīng)部署了內(nèi)容安全過濾機(jī)制,能夠?qū)γ舾刑崾驹~和潛在違規(guī)內(nèi)容進(jìn)行提前防范過濾。但是通過調(diào)整提示詞表達(dá)方式,95%的應(yīng)用仍出現(xiàn)生成違規(guī)內(nèi)容的情況。此外,測試過程中隱拓智安團(tuán)隊(duì)也發(fā)現(xiàn)傳統(tǒng)的人工智能內(nèi)容識別方法在對生成式人工智能的違規(guī)敏感內(nèi)容識別率顯著下降,特別是在判斷生成內(nèi)容的客觀真實(shí)性和識別生成圖像的違規(guī)違法元素上存在較大短板。
隨著《生成式人工智能服務(wù)管理暫行辦法》的正式施行,AIGC大模型合規(guī)評測執(zhí)行標(biāo)準(zhǔn)有法可依,99%的AIGC應(yīng)用生成內(nèi)容不合規(guī)的亂象也終將逐步改善。隱拓智安創(chuàng)始團(tuán)隊(duì)早在今年3月份就開始跟相關(guān)部門建立溝通渠道并持續(xù)跟進(jìn)相關(guān)法規(guī)的制定進(jìn)度,公司內(nèi)部也迅速組織起一支技術(shù)攻堅(jiān)隊(duì)伍,與清華大學(xué)電子系NGNLab實(shí)驗(yàn)室和清華大學(xué)天津電子信息研究院網(wǎng)絡(luò)開源情報(bào)技術(shù)創(chuàng)新研究中心擬定了大模型自動化合規(guī)評測平臺的總體架構(gòu)及標(biāo)準(zhǔn)化的中小科技企業(yè)自助檢測流程。
隱拓智安自研大模型自動化生成式合規(guī)檢測平臺
平臺總體架構(gòu)
隱拓智安自研的自動化生成模型合規(guī)評測平臺,為中小科技企業(yè)提供了便捷、高效的生成式模型合規(guī)評測服務(wù),將來中小科技企業(yè)只需要注冊一個(gè)賬號,進(jìn)行企業(yè)工商注冊資質(zhì)認(rèn)證并上傳檢測文件后,就可以全自動完成生成式模型合規(guī)評測,并輸出合規(guī)評測報(bào)告。同時(shí)隱拓智安還為廣大中小科技企業(yè)提供模型優(yōu)化專家答疑服務(wù),幫助中小科技企業(yè)盡可能一次通過合規(guī)申報(bào),讓投入大量資源研發(fā)訓(xùn)練的大模型第一時(shí)間產(chǎn)生經(jīng)濟(jì)效益回報(bào)。
企業(yè)自助自動化生成式模型合規(guī)檢測流程
隱拓智安是一家什么樣的公司
深圳市隱拓智安科技有限公司—AIGC時(shí)代驅(qū)動的AI安全數(shù)字服務(wù)提供商,團(tuán)隊(duì)核心成員來自清華等一流985高校科研團(tuán)隊(duì),在人工智能安全、多媒體內(nèi)容分析和理解等領(lǐng)域深耕數(shù)十年,致力于面向大模型安全產(chǎn)業(yè)上下游的客戶提供分階段的服務(wù),如訓(xùn)練數(shù)據(jù)過濾、數(shù)據(jù)標(biāo)注代理、大模型合規(guī)測評等。最先進(jìn)人工智能技術(shù)構(gòu)建AIGC內(nèi)容安全發(fā)展生態(tài)矩陣,搭建數(shù)字安全治理新范式,為客戶提供新一代基于LLM大模型的智能信息處理平臺。
CTO王丙坤,清華大學(xué)電子系博士畢業(yè),中文信息學(xué)會開源情報(bào)專委會委員。從2010年起,一直從事網(wǎng)絡(luò)開源情報(bào)信息處理、網(wǎng)絡(luò)數(shù)據(jù)可信與安全、安全領(lǐng)域知識圖譜、區(qū)塊鏈安全和網(wǎng)絡(luò)社會媒體情感計(jì)算的研究。近年來,完成863、973、科技部重點(diǎn)專項(xiàng)、國家自科基金、省科技攻關(guān)、省教育廳重點(diǎn)研發(fā)等多個(gè)國家級或省部級科研項(xiàng)目。曾獲國家教育部科技進(jìn)步獎(jiǎng)、軍內(nèi)科技進(jìn)步獎(jiǎng)等多項(xiàng)榮譽(yù)。