AI大模型訓(xùn)練背后,一條數(shù)據(jù)產(chǎn)業(yè)鏈正在形成
編者按:本文來自微信公眾號 騰訊科技(ID:qqtech),作者:郭曉靜,微新創(chuàng)想經(jīng)授權(quán)轉(zhuǎn)載
“大力出奇跡”、“暴力美學(xué)”,這兩個詞一直伴隨ChatGPT的討論出現(xiàn)。而“大力”和“暴力”,除了“巨大的算力”之外,還有海量的數(shù)據(jù)。a16z 創(chuàng)始人 Marc Andreessen在Data+AI大會上也提出,二十幾年來互聯(lián)網(wǎng)積累的海量數(shù)據(jù),是這一次新的AI浪潮興起的重要原因,因為前者為后者提供了可以用來訓(xùn)練的數(shù)據(jù)。
據(jù)OpenAI披露,GPT-3.5的文本語料多達(dá)45TB,相當(dāng)于 472 萬套中國四大名著,而 GPT-4 在 GPT-3 和 GPT-3.5 訓(xùn)練數(shù)據(jù)集的基礎(chǔ)上又增加了多模態(tài)數(shù)據(jù)。而7月18日,F(xiàn)acebook母公司Meta發(fā)布首個開源可商用的大語言模型的Llama2,預(yù)訓(xùn)練預(yù)料高達(dá)2 萬億token。
有能力獲得海量的、高質(zhì)量的數(shù)據(jù),被看做未來大模型公司的核心競爭力之一,也是各大巨頭AI軍備競賽的必爭之地。數(shù)據(jù)也被看作決定未來發(fā)展的關(guān)鍵生產(chǎn)要素。根據(jù)《數(shù)字中國發(fā)展報告(2022年)》統(tǒng)計,數(shù)據(jù)要素所能釋放的數(shù)字經(jīng)濟(jì)潛力將無比巨大,我國2022年數(shù)據(jù)產(chǎn)量達(dá)到8.1ZB,全球占比10.5%,位居世界排名第二,數(shù)字經(jīng)濟(jì)發(fā)展處于領(lǐng)先優(yōu)勢。
然而,數(shù)據(jù)作為全新的生產(chǎn)要素,也帶來一系列亟待解決的問題:究竟如何理解數(shù)據(jù)?如何對數(shù)據(jù)確權(quán)?如何挖掘數(shù)據(jù)的價值?是否真的能交易流通?數(shù)據(jù)是否能真的作為一種資產(chǎn),計入到企業(yè)的財務(wù)報表中?安全性如何管理?為此,我們對話了北京郵電大學(xué)科學(xué)技術(shù)研究院副院長曾雪云教授,請她深度解答了相關(guān)問題。
以下為對話實錄:
騰訊科技:普通人可能會關(guān)心,大模型訓(xùn)練的數(shù)據(jù)從哪里來?有沒有用我的個人數(shù)據(jù),這些數(shù)據(jù)是否會有確權(quán)的問題?
曾雪云教授:大模型計算的這些數(shù)據(jù)是個人數(shù)據(jù)。個人數(shù)據(jù)相對于企業(yè)數(shù)據(jù)來說,它有一個權(quán)屬問題。原則上,我的數(shù)據(jù)我做主。比如說社交軟件上生成的數(shù)據(jù),原則上來說,社交軟件所屬的公司不能使用我的個人數(shù)據(jù),雖然這些公司已經(jīng)通過默認(rèn)授權(quán)的方式,實際上控制了這些數(shù)據(jù),但具體數(shù)據(jù)怎么用是要受《個人信息保護(hù)法》來規(guī)范的。
那如果要用于大模型計算,該怎么來使用呢?在技術(shù)上需要進(jìn)行隱名化處理,在經(jīng)營上還需要有一個市場主體,就是要賦予某某公司一種合法的去經(jīng)營這些數(shù)據(jù)的權(quán)利,換句話說,給這些數(shù)據(jù)找到一個市場化主體。當(dāng)這個市場化主體拿到這個數(shù)據(jù)之后,需要投入人力、時間、智力、資本,去生產(chǎn)數(shù)據(jù),這些我們都可以稱為勞動投入。經(jīng)過勞動投入之后,就把屬于個人的數(shù)據(jù)信息衍生為公司的一種再生數(shù)據(jù),或者叫次生數(shù)據(jù)。然后,次生數(shù)據(jù)生成過程性數(shù)據(jù),再到數(shù)據(jù)的產(chǎn)品、數(shù)據(jù)的服務(wù)。這個時候,就把原生的以個人為數(shù)據(jù)擁有者的個體數(shù)據(jù)變?yōu)槠髽I(yè)的數(shù)據(jù)產(chǎn)品和數(shù)據(jù)服務(wù)。這是一個產(chǎn)品化的過程。
騰訊科技:是不是可以這樣理解,互聯(lián)網(wǎng)公司通過授權(quán)獲取個人的數(shù)據(jù),經(jīng)過這些公司的流程化處理之后,就可以變成這個公司的某種數(shù)據(jù)資產(chǎn)?
曾雪云教授:也可以這樣理解,我們個人在互聯(lián)網(wǎng)上生成大量的數(shù)據(jù),就好像自然界的各種自然資源。比如說,土地上可以生長出很多的花草樹木,可以有很多資源在生長。這種資源是一種公共資源,是可以去開發(fā)和利用的,但不可以直接買賣。利用和加工之后生成的是企業(yè)的資產(chǎn),這是允許的,我們也應(yīng)該鼓勵這樣來開發(fā)數(shù)據(jù)生產(chǎn)要素。
騰訊科技:從個體角度出發(fā),如何保護(hù)我們的個人數(shù)據(jù),讓它們按照我們想要的方式去流動?
曾雪云教授:人工智能的時代,人們的隱私越來越難以被保護(hù)了。因為人們的一切行為都在被記錄,地理位置的移動、生活、工作、飲食、起居,都在被記錄。一旦被記錄下來,這些原本屬于我們個人的信息,就不再能為行為人所控制。所以,這個時候隱私泄露的風(fēng)險很大,數(shù)據(jù)保護(hù)的任務(wù)也很重,數(shù)據(jù)保護(hù)的難度也很大。
人們怎么樣來維護(hù)自己的數(shù)據(jù)權(quán)益?其實各個國家也有一些商業(yè)化的辦法。第一種,像日本,用的數(shù)據(jù)銀行,就是每個人可以像在銀行存款一樣,把數(shù)據(jù)存放在數(shù)據(jù)銀行。數(shù)據(jù)銀行,是一個數(shù)據(jù)的保管者,它本身也可以作為一個數(shù)據(jù)價值的原始開發(fā)者,然后個人也能獲得一定的收益。這個就說,它能讓一部分愿意一定限度下公開和利用自己數(shù)據(jù)的這一部分人,可以有一種商業(yè)模式,以一種自選擇的方式來解決數(shù)據(jù)保護(hù)問題。也就是,構(gòu)造合法的數(shù)據(jù)流通、合法的數(shù)據(jù)的開發(fā)和利用模式,這是一塊。
另外一部分,就是說我個人不愿意,那么就不授權(quán)給數(shù)據(jù)占有人。不授權(quán)的情況下,國家就要加強數(shù)據(jù)保護(hù)。如果誰要非法去開發(fā)這部分?jǐn)?shù)據(jù),那就要進(jìn)行懲戒,要進(jìn)行法律監(jiān)管,可以用區(qū)塊鏈技術(shù)跟蹤此類行為。比如說,我們的數(shù)據(jù)有沒有被泄露,被泄露到哪了,去進(jìn)行數(shù)據(jù)流轉(zhuǎn)的跟蹤。還可以進(jìn)行數(shù)據(jù)血緣關(guān)系的跟蹤和分析,現(xiàn)在已經(jīng)有數(shù)據(jù)血緣技術(shù)。大概就是說,數(shù)據(jù)它從哪里來,到哪里去,數(shù)據(jù)血緣分析實際上是一種數(shù)據(jù)的相關(guān)分析,以及數(shù)據(jù)的溯源,用血緣這個詞就是非常形象地講述了數(shù)據(jù)的來龍去脈。一切都在被記錄,所以記錄別人的這種數(shù)據(jù)和技術(shù),它也能被記錄下來,也能被公開下來,也能被穿透。
我國 《民法典》在人格權(quán)篇中對個人信息保護(hù)做出了專門規(guī)定。《民法典》第127條則將數(shù)據(jù)與網(wǎng)絡(luò)虛擬財產(chǎn)并列,凸顯了數(shù)據(jù)的財產(chǎn)屬性。在地方性立法中,《上海市數(shù)據(jù)條例》第12條的規(guī)定直接體現(xiàn)了“人財兩分”的權(quán)利配置模式。該條規(guī)定:“本市依法保護(hù)自然人對其個人信息享有的人格權(quán)益。”“本市依法保護(hù)自然人、法人和非法人組織在使用、加工等數(shù)據(jù)處理活動中形成的法定或者約定的財產(chǎn)權(quán)益,以及在數(shù)字經(jīng)濟(jì)發(fā)展中有關(guān)數(shù)據(jù)創(chuàng)新活動取得的合法財產(chǎn)權(quán)益。”
2021年8月20日,十三屆全國人大常委會第三十次會議表決通過《中華人民共和國個人信息保護(hù)法》,自2021年11月1日起施行。具體內(nèi)容在網(wǎng)上能查到。《個人信息保護(hù)法》中個人信息的司法性質(zhì)也是人格權(quán)益保護(hù),幾乎不涉及個人信息的財產(chǎn)權(quán)益。
騰訊科技:對大模型訓(xùn)練起到重要作用的高質(zhì)量數(shù)據(jù),究竟指的是哪些數(shù)據(jù)?
曾雪云教授:數(shù)據(jù)應(yīng)該是人類經(jīng)濟(jì)、社會、生產(chǎn)、經(jīng)營、商業(yè),甚至軍事活動的全部記錄。這樣的一個記錄,它生產(chǎn)于各個行業(yè)、各個領(lǐng)域、各個方面。就原生數(shù)據(jù)而言,它有高質(zhì)量、也有低質(zhì)量。比如說,上市公司的財務(wù)報表,財務(wù)數(shù)據(jù),就是一種高質(zhì)量的數(shù)據(jù),而且是一種結(jié)構(gòu)化的數(shù)據(jù)。因為這種財務(wù)報表和財務(wù)信息都是經(jīng)過社會審計,經(jīng)過注冊會計師審計的,有證監(jiān)會來監(jiān)管信息披露,所以是高質(zhì)量數(shù)據(jù)。再比如說,中國知網(wǎng)里的論文數(shù)據(jù)也是高質(zhì)量數(shù)據(jù)。但是,互聯(lián)網(wǎng)上生成的這些數(shù)據(jù),它是非結(jié)構(gòu)化的數(shù)據(jù),也是非標(biāo)準(zhǔn)化的數(shù)據(jù)。這樣的數(shù)據(jù)就是一種原始的、比較雜亂的、沒有規(guī)范的數(shù)據(jù),它就需要在計算前進(jìn)行顆粒度上的清洗,所以高質(zhì)量數(shù)據(jù)通常都有從非結(jié)構(gòu)化到結(jié)構(gòu)化這樣的一個加工過程。
騰訊科技:既然高質(zhì)量數(shù)據(jù)可以被不斷生產(chǎn),為什么會有“高質(zhì)量的數(shù)據(jù)快用完了”這種說法?
曾雪云教授:我認(rèn)為是對數(shù)據(jù)的生產(chǎn)加工的能力跟不上人們對于數(shù)據(jù)的需求,做數(shù)據(jù)生產(chǎn)加工的整個供應(yīng)鏈價值鏈這一端,它的生產(chǎn)力還比較弱。因為我們知道數(shù)據(jù)是在不斷爆發(fā),但是高質(zhì)量數(shù)據(jù)快用完了,它只是說從數(shù)據(jù)到高質(zhì)量數(shù)據(jù)的過程當(dāng)中,我們?nèi)狈σ环N生產(chǎn)力,一種整合的能力。這個時候就需要有數(shù)據(jù)商,我們現(xiàn)在很多數(shù)據(jù)商,只是在做數(shù)據(jù)的直接利用,但對于數(shù)據(jù)的生產(chǎn)和加工,對于如何生產(chǎn)高質(zhì)量數(shù)據(jù),這一塊的能力或者說商業(yè)模式的設(shè)計還是很不夠的。
其實 OpenAI 的 GPT-4,就采用了大量前一代模型 GPT-3.5 生產(chǎn)的數(shù)據(jù)來進(jìn)行訓(xùn)練。OpenAI的創(chuàng)始人也在近期的采訪中說過,“合成數(shù)據(jù)是解決大模型數(shù)據(jù)短缺的有效方法。而其中的關(guān)鍵在于,有一整套體系來區(qū)分 AI 生成的數(shù)據(jù)中,哪些可用,哪些不可用,并不斷根據(jù)訓(xùn)練后模型的效果進(jìn)行反饋”。這家公司并不只是能融到錢,能支配很多的算力這么簡單,對于數(shù)據(jù)的產(chǎn)品技術(shù)能力,也是這家公司的核心競爭力之一。
騰訊科技:為了提高高質(zhì)量的數(shù)據(jù)生產(chǎn)力,產(chǎn)業(yè)設(shè)計需要有哪些必要的環(huán)節(jié)?
曾雪云教授:關(guān)于這個問題,首先要理解數(shù)據(jù)是什么?我們有哪些數(shù)據(jù)?以及要用這些數(shù)據(jù)去做什么?也就是說,生產(chǎn)高質(zhì)量的數(shù)據(jù),它不是有生產(chǎn)能力,就能有高質(zhì)量數(shù)據(jù),也不是有生產(chǎn)的意愿,就有高質(zhì)量數(shù)據(jù)。它一定需要從源頭來理解數(shù)據(jù),要用數(shù)據(jù)去解決社會上的什么問題?市場對數(shù)據(jù)的需求端在哪里。然后,從原始數(shù)據(jù)到需求端,中間應(yīng)該怎么去生產(chǎn)?這一系列的問題需要有產(chǎn)業(yè)設(shè)計在里面,目前整體的思考都是不夠的。
騰訊科技:產(chǎn)業(yè)不成熟是一方面,是不是也意味著這個產(chǎn)業(yè)還是一片藍(lán)海?
曾雪云教授:非常早期的一片藍(lán)海。更早期存在一些違規(guī)的直接買賣數(shù)據(jù)的情況,后來國家立法不再能夠直接買賣數(shù)據(jù)本身,不再去交易原始數(shù)據(jù)。數(shù)據(jù)是不能做原始交易的,應(yīng)該是對自己的生產(chǎn)投入的結(jié)果去做交易,而不是說占有了什么數(shù)據(jù),我直接去賣數(shù)據(jù),這是不可以的。
2022年(12月份)出臺了《數(shù)據(jù)二十條》,《數(shù)據(jù)二十條》其中就提出數(shù)據(jù)的權(quán)屬分置要求,將數(shù)據(jù)的所有權(quán)、經(jīng)營權(quán)、受益權(quán)進(jìn)行多權(quán)屬的分置,其中提到數(shù)據(jù)要進(jìn)行這個分層分類管理。這是數(shù)據(jù)治理的頂層設(shè)計,是一個整體藍(lán)圖。也可以說,是未來數(shù)據(jù)產(chǎn)業(yè)規(guī)范化發(fā)展的開端。這個時候,人們意識到數(shù)據(jù)不是一個整體,而且要去理解數(shù)據(jù)究竟有哪些權(quán)益,這也是對原來以法學(xué)為基礎(chǔ)的研究推進(jìn)到以經(jīng)濟(jì)學(xué)為基礎(chǔ)的研究。要去建立數(shù)據(jù)市場,市場一定是經(jīng)濟(jì)行為。這種經(jīng)濟(jì)行為,要用很多經(jīng)濟(jì)學(xué)的工具、經(jīng)濟(jì)學(xué)的理論,所以現(xiàn)在從對數(shù)據(jù)科學(xué)的研究、國家對數(shù)據(jù)的治理,到學(xué)術(shù)界對數(shù)據(jù)的研究、產(chǎn)業(yè)界對數(shù)據(jù)的利用都是一個藍(lán)海,都是一個剛開始的狀態(tài)。
騰訊科技:這樣看來,數(shù)據(jù)可以作為企業(yè)的某種資產(chǎn)存在,數(shù)據(jù)屬于哪類資產(chǎn)?
曾雪云教授:數(shù)據(jù)分類是學(xué)術(shù)界非常熱門的話題。多數(shù)情況下,人們會覺得數(shù)據(jù)是無形的,看不見、摸不著,叫無形資產(chǎn)。但實際上從國際電聯(lián)的分類來看,數(shù)據(jù)它更接近于存貨資產(chǎn),因為數(shù)據(jù)也涉及到生產(chǎn)、加工這樣一個過程。而且數(shù)據(jù)本身它是一種電子化的有形資產(chǎn),為什么它是電子化有形資產(chǎn)?數(shù)據(jù)它會占用物理空間,很多數(shù)據(jù)本身也有實物形態(tài),它是在網(wǎng)絡(luò)端的一個實物形態(tài)。圖片,能看得見這張電子圖片;聲音,能聽到這個聲音,人像,能看到這個人像,所以數(shù)據(jù)它是數(shù)字化的有形資產(chǎn)。
我們知道,數(shù)據(jù)資產(chǎn)是一種非常特殊的資產(chǎn)類別。有的會提出來說,數(shù)據(jù)可以類比于無形自然做攤銷,或者類比于固定資產(chǎn)做折舊。其實,要先對數(shù)據(jù)去做分層分類,看這些數(shù)據(jù)屬于哪一類。有的類型的數(shù)據(jù),它還具有可生長性可融合性。比如說,中國聯(lián)通所有的通話數(shù)據(jù),如果能和個人的銀行存款投資數(shù)據(jù)融合在一起,就能生成關(guān)于這種人從投融資到他的通信以及到職業(yè)的更多信息的畫像。這個時候,就有數(shù)據(jù)與數(shù)據(jù)之間融合產(chǎn)生數(shù)據(jù)價值的累加效應(yīng),這個時候數(shù)據(jù)就具有可融合性和可生長性。還有一部分?jǐn)?shù)據(jù),確實具有時效性,隨著時間的推移,它的價值就衰減了。所以,我們還是要更具體地來分析數(shù)據(jù)本身的特性,才能知道它的核算價值,并且數(shù)據(jù)價值的核算,具有更多的可變性和不確定性,它不像固定資產(chǎn),固定資產(chǎn)形成時候的資產(chǎn)價值是確定的,隨著時間的推移,價值是逐漸遞減的,但數(shù)據(jù)不一定隨時間遞減,數(shù)據(jù)有更加復(fù)雜的資產(chǎn)形態(tài)。
騰訊科技:未來數(shù)據(jù)是不是AI企業(yè)的核心競爭力之一?數(shù)據(jù)資產(chǎn)是否有可能量化體現(xiàn)在企業(yè)的估值中?
曾雪云教授:對于一家人工智能的企業(yè)來說,數(shù)據(jù)就是它最核心的關(guān)鍵競爭力所在。對于一家AI公司來說,產(chǎn)品的體驗決定了這個企業(yè)的商業(yè)價值,而數(shù)據(jù)的能力,決定了產(chǎn)品的體驗。對于一個國家來說,數(shù)據(jù)是未來的關(guān)鍵競爭力,也是未來的黃金,就像石油是工業(yè)時代的黃金,數(shù)據(jù)就是互聯(lián)網(wǎng)經(jīng)濟(jì)時代的黃金。
但是目前,世界各國其實在數(shù)據(jù)治理方面遇到困難,還沒有一個國家率先取得突破,怎么解決數(shù)據(jù)安全、數(shù)據(jù)治理與數(shù)據(jù)開發(fā)利用三者之間的平衡。
在這方面,中國已經(jīng)敏銳地意識到了數(shù)據(jù)的重要性。各個國家也都意識到數(shù)據(jù)是一種新的生產(chǎn)力,但數(shù)據(jù)怎么利用,它需要有市場主體,需要有智能科技,還需要有國家規(guī)制,所以,它不是一個簡單可以解決的問題,它是個系統(tǒng)復(fù)雜性問題。
中國的國家治理是從中央到地方的相對集中式的安排,所以我們天然就有優(yōu)勢,可以去整合全國范圍內(nèi)的大數(shù)據(jù),但這個優(yōu)勢現(xiàn)在還沒有體現(xiàn)出來,是在于數(shù)據(jù)的估值和估價存在問題,還有數(shù)據(jù)進(jìn)入會計報表核算的問題沒有解決。這個問題,在全世界范圍內(nèi)也都沒有很好的解決辦法。
如果說數(shù)據(jù)能從表外資產(chǎn)進(jìn)入到表內(nèi)資產(chǎn),那么數(shù)據(jù)治理的價值核算以及數(shù)據(jù)價值的管理就都能解決好,數(shù)據(jù)的交易就有了一個客觀的基礎(chǔ)。現(xiàn)在我們的企業(yè)數(shù)據(jù),基本上是表外資產(chǎn),沒有進(jìn)行估值,也沒有在資產(chǎn)負(fù)債表上做計量和報告,因此并不清楚企業(yè)究竟掌握了多少的數(shù)據(jù)量,以至于數(shù)據(jù)的經(jīng)濟(jì)價值是多少也很難做統(tǒng)計。數(shù)據(jù)沒有進(jìn)入表內(nèi),那么它的交易也就缺乏一個合理基礎(chǔ),所以數(shù)據(jù)入表是一個關(guān)鍵性問題。對于數(shù)據(jù)量的統(tǒng)計、數(shù)據(jù)價格的核算、對于數(shù)據(jù)交易的計價,從量的統(tǒng)計到價的核算再到交易的基礎(chǔ),它需要以數(shù)據(jù)進(jìn)入資產(chǎn)負(fù)債表、利潤表,進(jìn)入財務(wù)報表的核算為底層設(shè)施。這個底層設(shè)施還沒有解決好。
騰訊科技:數(shù)據(jù)產(chǎn)權(quán)立法,國際目前已經(jīng)有哪些先例?
曾雪云教授:研究數(shù)據(jù)產(chǎn)權(quán)立法。現(xiàn)在全球各主要國家針對數(shù)據(jù)保護(hù)的法案基本具備,而且日漸清晰地定位于推進(jìn)數(shù)據(jù)物權(quán)中的人格權(quán)保護(hù)法案,但是針對數(shù)據(jù)利用的法案法規(guī)基本缺失,日本在這方面有一定先進(jìn)性,我國相當(dāng)重視推進(jìn)數(shù)據(jù)要素流通,但并無法規(guī)的支持、規(guī)范、引導(dǎo),而主要依靠行政性文件,這依然存在很大的立法缺失。當(dāng)前迫切需要在加快數(shù)據(jù)產(chǎn)權(quán)的規(guī)制與數(shù)據(jù)要素流通方面,創(chuàng)新性地引領(lǐng)全球法規(guī)建設(shè)的新方向。國內(nèi)外情況如下:
國際方面:歐盟2016年通過的《一般數(shù)據(jù)保護(hù)條例》(GDPR),是目前最為全面、影響力最大的數(shù)據(jù)隱私法。《條例》朝著強化數(shù)據(jù)主體權(quán)利、確保對個人數(shù)據(jù)使用控制的方向、兼顧數(shù)據(jù)安全和數(shù)據(jù)自由流通的兩個方向發(fā)展。GDPR在確認(rèn)和完善個人的既有權(quán)利的基礎(chǔ)上,規(guī)定了刪除權(quán)(第17條)和可攜帶權(quán)(第20條)等,以實現(xiàn)數(shù)據(jù)主體對其個人數(shù)據(jù)的更有效控制,但條文并沒有對個人數(shù)據(jù)的權(quán)屬流轉(zhuǎn)及財產(chǎn)權(quán)益分配進(jìn)行明確。
雖然美國較早開始數(shù)據(jù)權(quán)屬法律保護(hù)的制度和理論探索,但相關(guān)規(guī)范大多分散于各類法案。各州立法并不相容,但覆蓋領(lǐng)域較廣,在實際糾紛解決中具備一定的靈活性以鼓勵數(shù)據(jù)利用。比如,2018年出臺的《2018年加州消費者隱私法案》和2020年出臺的《2020年加州隱私權(quán)法》都加大了對數(shù)據(jù)權(quán)利的確定力度,覆蓋了訪問權(quán)、刪除權(quán)、知情權(quán)等消費者人格隱私權(quán)利,強化了數(shù)據(jù)在流轉(zhuǎn)中對數(shù)據(jù)主體的權(quán)益保護(hù),這也從側(cè)面反映出美國對數(shù)據(jù)經(jīng)濟(jì)價值利用的許可。日本在 2017年制定了《數(shù)據(jù)使用權(quán)限合同指引》,指引充分考慮了數(shù)據(jù)合同對數(shù)據(jù)創(chuàng)造的貢獻(xiàn)、存儲和管理的成本負(fù)擔(dān)等因素,規(guī)范了數(shù)據(jù)交易合同以促進(jìn)數(shù)據(jù)交易,這是一個大的進(jìn)步,但仍未有對數(shù)據(jù)產(chǎn)權(quán)的清晰界定。
在歐洲,《歐盟基本權(quán)利憲章》及《通用數(shù)據(jù)保護(hù)條例》將個人數(shù)據(jù)受保護(hù)權(quán)視為一種由數(shù)據(jù)主體享有的特殊權(quán)利,其中不包含任何財產(chǎn)權(quán)利。雖然《通用數(shù)據(jù)保護(hù)條例》等歐盟法令沒有明確規(guī)定數(shù)據(jù)控制者享有以數(shù)據(jù)為客體的財產(chǎn)權(quán)利,但其數(shù)據(jù)財產(chǎn)權(quán)益可通過數(shù)據(jù)庫保護(hù)、版權(quán)法保護(hù)、商業(yè)秘密保護(hù)、合同法保護(hù)、競爭法保護(hù)等方式得到保護(hù)。此外,歐盟委員會發(fā)布的文件《建立歐洲數(shù)據(jù)經(jīng)濟(jì)》致力于引入“數(shù)據(jù)生產(chǎn)者權(quán)利”,賦予數(shù)據(jù)控制者對非個人數(shù)據(jù)及匿名化個人數(shù)據(jù)的對世性財產(chǎn)權(quán)利,使其有權(quán)對此等數(shù)據(jù)進(jìn)行排他利用,其中包括許可他人利用此等數(shù)據(jù)的權(quán)利。在美國,雖然法學(xué)界有學(xué)者認(rèn)為應(yīng)當(dāng)賦予個人對個人信息的財產(chǎn)權(quán)利,但是法院對于此等財產(chǎn)權(quán)利通常不予承認(rèn)。而在部分情形中,美國法院認(rèn)為企業(yè)對其持有的數(shù)據(jù)享有財產(chǎn)權(quán)益。國內(nèi)外關(guān)于數(shù)據(jù)財產(chǎn)的法治經(jīng)驗表明,“人財兩分”應(yīng)當(dāng)成為構(gòu)建我國數(shù)據(jù)財產(chǎn)權(quán)制度的核心理論主張。
本文為專欄作者授權(quán)微新創(chuàng)想發(fā)表,版權(quán)歸原作者所有。文章系作者個人觀點,不代表微新創(chuàng)想立場,轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問,請聯(lián)系http://www.i0562.net/。