一小時(shí) 12 元,我在北歐監(jiān)獄里訓(xùn)練 AI
聲明:本文來(lái)自于微信公眾號(hào) InfoQ(ID:infoqchina),作者 | MORGAN MEAKER 譯者 | 張樂(lè) 審校 | 平川 策劃 | 凌敏,授權(quán)微新創(chuàng)想轉(zhuǎn)載發(fā)布。
芬蘭工資水平普遍較高,并且很少有人從事互聯(lián)網(wǎng)行業(yè)。外媒 wired 實(shí)地走訪(fǎng)發(fā)現(xiàn),一家名為 Metroc 的大模型創(chuàng)業(yè)公司發(fā)現(xiàn)了一種新型勞動(dòng)力——囚犯。
芬蘭囚犯的新工作:
幫創(chuàng)業(yè)公司訓(xùn)練大模型
在一個(gè)沒(méi)有窗戶(hù)的房間里,隔著一張消過(guò)毒的白色桌子,我被介紹給了一位四十多歲的女性,她有著方形下巴,用一個(gè)淡藍(lán)色的發(fā)帶把金色的頭發(fā)扎成了馬尾。她說(shuō):“大家都叫我果醬”,讓我也這么稱(chēng)呼她。
一個(gè)星期三的早晨,在這座芬蘭的監(jiān)獄里,果醬給我們演示了一種新型的監(jiān)獄勞動(dòng)形式。
桌子上只有一小塑料瓶水和一臺(tái) HP 筆記本電腦。她們每三小時(shí)輪班一次,每小時(shí)可以獲得1.54歐元(約合12元人民幣)的報(bào)酬。這臺(tái)筆記本電腦用來(lái)向果醬展示關(guān)于房地產(chǎn)的短文,并就她剛剛讀到的內(nèi)容問(wèn)她是或否的問(wèn)題。其中一個(gè)問(wèn)題是:“上面這段話(huà)說(shuō)的是房地產(chǎn)決策而不是申請(qǐng),對(duì)嗎?”
“有點(diǎn)無(wú)聊,”果醬聳了聳肩,她也不太清楚這項(xiàng)任務(wù)的目的。她認(rèn)為,"也許她正在幫助創(chuàng)建一個(gè)客服聊天機(jī)器人"。
事實(shí)上,她正在訓(xùn)練一款由芬蘭創(chuàng)業(yè)公司 Metroc 開(kāi)發(fā)的大型語(yǔ)言模型。該公司創(chuàng)建了一個(gè)搜索引擎,旨在幫助建筑公司找到新批準(zhǔn)的建設(shè)項(xiàng)目。為了做到這一點(diǎn),Metroc 需要標(biāo)注員幫助其模型理解新聞和市政文件中關(guān)于即將開(kāi)展的建設(shè)項(xiàng)目的線(xiàn)索。例如,人工智能必須能夠區(qū)分已經(jīng)委托給建筑師或正在安裝窗戶(hù)的醫(yī)院項(xiàng)目和可能仍在招人的項(xiàng)目。
在全球范圍內(nèi),有數(shù)百萬(wàn)所謂的“網(wǎng)絡(luò)工作者”在訓(xùn)練人工智能模型,教機(jī)器區(qū)分行人和棕櫚樹(shù),或者描述暴力或性侵害的詞語(yǔ)組合。通常,這類(lèi)工作人員來(lái)自南半球,因?yàn)槟抢锏墓べY比較低。例如,OpenAI 就用了一家外包公司,該公司在肯尼亞、烏干達(dá)和印度招聘了網(wǎng)絡(luò)工作者。這種安排非常適合美國(guó)公司,因?yàn)樗鼈兪褂萌蚴褂米顝V泛的語(yǔ)言英語(yǔ),但在南半球很難找到講芬蘭語(yǔ)的人。
這就是為什么 Metroc 轉(zhuǎn)向了監(jiān)獄勞動(dòng)力。該公司獲得了廉價(jià)的、會(huì)講芬蘭語(yǔ)的工人,而監(jiān)獄系統(tǒng)則可以為囚犯提供就業(yè)機(jī)會(huì),也為他們出獄后進(jìn)入數(shù)字化領(lǐng)域工作做好準(zhǔn)備。利用囚犯來(lái)訓(xùn)練人工智似乎有點(diǎn)像科技領(lǐng)域下游經(jīng)常存在的對(duì)廉價(jià)勞動(dòng)力的剝削。但在芬蘭,這個(gè)項(xiàng)目得到了廣泛的支持。
“數(shù)據(jù)勞動(dòng)力是一個(gè)全球性的概念。但如果你仔細(xì)觀察一下就會(huì)發(fā)現(xiàn),芬蘭的情況截然不同。”來(lái)自赫爾辛基大學(xué)的研究員圖卡·萊赫蒂尼米(Tuukka Lehtiniemi)說(shuō),他一直在研究芬蘭監(jiān)獄中的數(shù)據(jù)勞動(dòng)力。
果醬在哈米納林納監(jiān)獄已經(jīng)呆了四個(gè)月。這座現(xiàn)代化的建筑有著很大的窗戶(hù)。空曠的走廊上,色彩豐富的藝術(shù)品正努力營(yíng)造出愉快的氛圍。要不是因?yàn)楹裰氐幕疑踩T(mén)擋住了每個(gè)進(jìn)出口,你很容易就會(huì)以為,這些房間屬于一所毫無(wú)靈魂的大學(xué)。
芬蘭監(jiān)獄的開(kāi)放性是出了名的,囚犯可以在附近的城鎮(zhèn)工作或?qū)W習(xí),但哈米納林納監(jiān)獄不屬于這一類(lèi)。相反,哈米納林納監(jiān)獄是芬蘭安全級(jí)別最高的監(jiān)獄,只收容女性囚犯。果醬被判了六年。根據(jù)監(jiān)獄的隱私規(guī)定,wired 不能發(fā)布她的真實(shí)姓名、確切年齡或其他任何可能讓人識(shí)別出她身份的信息。在這個(gè)無(wú)期徒刑囚犯服刑12年后就可以申請(qǐng)刑滿(mǎn)釋放的國(guó)家里,六年是重刑。和其他100名住在這里的囚犯一樣,她也不被允許離開(kāi)監(jiān)獄。
當(dāng)果醬第一次來(lái)到監(jiān)獄的時(shí)候,她會(huì)看著其他女囚每天早上起床去工作:她們可以自愿做清潔、洗衣或縫紉。每六小時(shí)輪班一次,她們可以獲得大約6歐元(約合46.6元人民幣)的報(bào)酬。但果醬無(wú)法忍受這些工作。“我會(huì)覺(jué)得非常累,”她說(shuō)。為此,有很長(zhǎng)一段時(shí)間,她就呆在牢房里,直到有一位監(jiān)獄輔導(dǎo)員建議她嘗試“人工智能工作”。三小時(shí)一輪班吸引了她,至于報(bào)酬,有總比沒(méi)有強(qiáng)。“雖然不多,但比呆在牢房里強(qiáng),”她說(shuō)。截至目前,她只輪過(guò)三次班,但已經(jīng)獲得了成就感。
這所監(jiān)獄允許囚犯通過(guò)數(shù)據(jù)工作賺錢(qián)。在芬蘭,這樣的監(jiān)獄只有三所。每所監(jiān)獄都備有三臺(tái)筆記本電腦,供囚犯參與這項(xiàng)人工智能工作時(shí)使用。這項(xiàng)工作沒(méi)有具體的目標(biāo),囚犯按小時(shí)取酬,而不是按工作速度或質(zhì)量。
在哈米納林納監(jiān)獄,大約有20名囚犯嘗試過(guò)這項(xiàng)工作。監(jiān)獄工作導(dǎo)師米娜·英基寧(Minna Inkinen)留著紅色的短發(fā),她坐在果醬旁邊和我們交談。她說(shuō):“有些人確實(shí)比其他人更喜歡人工智能工作。”當(dāng)我在一個(gè)星期三的早晨到到達(dá)這所監(jiān)獄時(shí),縫紉室已經(jīng)忙碌了起來(lái)。囚犯?jìng)兓蛎χ僮骺p紉機(jī),或在織物旁商量事情。但在果醬到達(dá)之前,開(kāi)展人工智能工作的小房間里空無(wú)一人。英基寧解釋說(shuō):”總共只有三名囚犯自愿定期參加人工智能工作,而另外兩人目前正在上法庭。“果醬補(bǔ)充說(shuō):“我更喜歡在一個(gè)團(tuán)隊(duì)中做事。”她房間的門(mén)一直敞開(kāi)著,這樣她就可以在回答問(wèn)題的間隙,與隔壁正在縫紉的獄友聊天。
那些問(wèn)題是我在監(jiān)獄以南100公里外的赫爾辛基的一家現(xiàn)代化共享辦公室內(nèi)手寫(xiě)的。在那里,我見(jiàn)到了個(gè)子高挑、少年感十足的 Metroc 創(chuàng)始人兼首席執(zhí)行官尤西·維爾納拉(Jussi Virnala)。他帶著我路過(guò)一排室內(nèi)秋千、一張臺(tái)球桌和一群西裝革履的男士,來(lái)到一個(gè)異常悶熱的電話(huà)間。他解釋說(shuō),這一周真讓人興奮,公司剛剛完成了一輪200萬(wàn)歐元(約合1554萬(wàn)元人民幣)的融資,他計(jì)劃用這筆錢(qián)來(lái)擴(kuò)展北歐市場(chǎng),投資者對(duì)公司與芬蘭監(jiān)獄的關(guān)系很感興趣。他說(shuō):“每個(gè)人都激動(dòng)不已,對(duì)這種創(chuàng)新方式很感興趣,我認(rèn)為從產(chǎn)品方面來(lái)看,這非常有價(jià)值。”
數(shù)據(jù)標(biāo)注是個(gè)好工作嗎?
將囚犯發(fā)展為勞動(dòng)力的想法是維爾納拉提出的。他們公司需要母語(yǔ)為芬蘭語(yǔ)的人來(lái)幫助他們改進(jìn)其大型語(yǔ)言模型理解建筑行業(yè)特有的語(yǔ)言。但在像芬蘭這樣的高薪經(jīng)濟(jì)體中,很難找到這樣的數(shù)據(jù)勞動(dòng)力。芬蘭的福利體系可以提供可觀的失業(yè)救濟(jì)金,這就意味著很少有芬蘭人會(huì)主動(dòng)在類(lèi)似亞馬遜網(wǎng)絡(luò)交易平臺(tái)這樣的網(wǎng)絡(luò)工作平臺(tái)上注冊(cè)。“上面沒(méi)有多少芬蘭語(yǔ)工作人員,”維爾納拉說(shuō),同時(shí)他還補(bǔ)充道,“自動(dòng)翻譯工具仍然不能很好地處理芬蘭語(yǔ),畢竟以芬蘭語(yǔ)為母語(yǔ)的人總共也才500萬(wàn)。”
當(dāng)維爾納拉向芬蘭監(jiān)獄和青少年教養(yǎng)所的智能監(jiān)獄項(xiàng)目負(fù)責(zé)人皮婭·普拉卡(Pia Puolakka)提出他的想法時(shí),她立刻表現(xiàn)出了濃厚的興趣。她說(shuō),在人工智能火起來(lái)之前,另一家名為 Vainu 的芬蘭科技公司曾經(jīng)也試過(guò)用囚犯做數(shù)據(jù)勞動(dòng)力,但其聯(lián)合創(chuàng)始人之間的分歧導(dǎo)致項(xiàng)目負(fù)責(zé)人圖奧馬斯·拉西拉(Tuomas Rasila)離開(kāi)了公司,Vainu 也就退出了這個(gè)項(xiàng)目。
到2022年維爾納拉提出他的提議時(shí),普拉卡非常想恢復(fù)人工智能工作。她的工作是設(shè)法加強(qiáng)芬蘭監(jiān)獄與互聯(lián)網(wǎng)之間的聯(lián)系,使監(jiān)獄更接近日益數(shù)字化的外部世界。到目前為止,監(jiān)獄的獨(dú)立牢房一直都配有筆記本電腦,以便囚犯可以瀏覽有限的網(wǎng)站并申請(qǐng)視頻通話(huà)許可。她認(rèn)為,數(shù)據(jù)勞動(dòng)力也是這項(xiàng)任務(wù)的一部分。
這項(xiàng)工作的目的不是為了取代傳統(tǒng)的監(jiān)獄勞動(dòng)力,比如制作道路標(biāo)志或園藝工作,它的目標(biāo)是為囚犯提供更多的工作類(lèi)型。數(shù)據(jù)標(biāo)注員三小時(shí)就輪一次班。“如果一天八小時(shí)都只做這種工作,可能會(huì)讓人覺(jué)得很累,”她補(bǔ)充說(shuō),如果囚犯可以將數(shù)據(jù)標(biāo)注與其他類(lèi)型的監(jiān)獄工作并行開(kāi)展,那就更好了。她說(shuō),“這項(xiàng)工作是面向未來(lái)的,如果要為囚犯出獄后的生活做準(zhǔn)備,那么這些技能至少與監(jiān)獄提供的傳統(tǒng)工作類(lèi)型一樣重要”。
然而,數(shù)據(jù)標(biāo)注可以為囚犯提供多少可用于出獄后的工作技能還不清楚。作為 Vainu 公司聯(lián)合創(chuàng)始人之一的圖奧馬斯·拉西拉(Tuomas Rasila)曾在那里管理了一年的監(jiān)獄項(xiàng)目,他承認(rèn)自己沒(méi)有這方面的證據(jù)。他說(shuō),這個(gè)項(xiàng)目的運(yùn)行時(shí)間還不足以收集證據(jù),“我認(rèn)為,讓可能與社會(huì)脫節(jié)的人去學(xué)習(xí)現(xiàn)代社會(huì)最先進(jìn)的技術(shù)是一個(gè)不錯(cuò)的賦能理念。”
其他人認(rèn)為,這種新形式的監(jiān)獄勞動(dòng)力可能會(huì)加劇人工智能革命所帶來(lái)的廉價(jià)勞動(dòng)力問(wèn)題。“我們正朝著一個(gè)更便捷高效的全自動(dòng)化社會(huì)發(fā)展,但這往往掩蓋了這樣一個(gè)事實(shí),即許多系統(tǒng)實(shí)際上都是依賴(lài)于人的”,來(lái)自人權(quán)觀察的人工智能高級(jí)研究員阿莫斯·陶(Amos Toh)如是說(shuō)。
在陶看來(lái),對(duì)于網(wǎng)絡(luò)工作者需求的增加已經(jīng)引發(fā)了一種趨勢(shì),即公司更多地轉(zhuǎn)向了那些幾乎沒(méi)有其他選擇的人群:難民、國(guó)家陷入經(jīng)濟(jì)危機(jī)的人,現(xiàn)在是囚犯。
“這種情況很常見(jiàn),”陶說(shuō),“我們這里看到的只是一個(gè)更廣泛的現(xiàn)象的一部分,即企業(yè)正在將技術(shù)開(kāi)發(fā)背后的工作外包給可能在剝削性工作條件下勞動(dòng)的工人。”
對(duì)于數(shù)據(jù)工作是否能幫助囚犯培養(yǎng)數(shù)字技能,陶還也是持懷疑態(tài)度。“在監(jiān)獄里,囚犯有很多提升自己的方式,比如考取證書(shū)和參加高等教育,”他說(shuō),“但我覺(jué)得,以每小時(shí)一歐元的價(jià)格為一家公司標(biāo)注數(shù)據(jù)未必能幫他們?nèi)〉糜幸饬x的進(jìn)步。”哈米納林納監(jiān)獄確實(shí)為囚犯提供了人工智能在線(xiàn)課程,但當(dāng)工作人員試圖解釋其好處的時(shí)候,果醬坐在那里,面無(wú)表情。
在我與來(lái)自赫爾辛基大學(xué)的研究員萊赫蒂尼米見(jiàn)面后,我對(duì)于監(jiān)獄項(xiàng)目的優(yōu)點(diǎn)有些不那么確定了。從監(jiān)獄來(lái)到 Metroc 的辦公室,監(jiān)獄里的女性干著每小時(shí)1.54歐元的工作,而公司正在慶祝200萬(wàn)歐元的融資輪,這感覺(jué)非常不協(xié)調(diào)。在赫爾辛基大教堂對(duì)面的一家咖啡館里,萊赫蒂尼米耐心地聽(tīng)我描述了這種感覺(jué)。
但對(duì)囚犯的采訪(fǎng)讓萊赫蒂尼米有了不同的看法——他對(duì)這個(gè)項(xiàng)目總的來(lái)說(shuō)是持積極態(tài)度的。至于薪酬差距,他認(rèn)為,這些人是在監(jiān)獄里,并不是主流社會(huì)中的普通勞動(dòng)力。“將我作為研究員所獲得的報(bào)酬與囚犯在監(jiān)獄里勞動(dòng)所獲得的報(bào)酬進(jìn)行比較,是沒(méi)有意義的,”他說(shuō),“我唯一聽(tīng)到的負(fù)面意見(jiàn)是這樣的工作不夠多,只有很少的人可以做。”他提到了每所監(jiān)獄只有三臺(tái)筆記本電腦這個(gè)限制。
“當(dāng)我們提起數(shù)據(jù)勞動(dòng)力時(shí),我們往往會(huì)想到網(wǎng)絡(luò)交易平臺(tái),全球南部或美國(guó)農(nóng)村的人,”他說(shuō)。但對(duì)他來(lái)說(shuō),這是數(shù)據(jù)勞工的一個(gè)獨(dú)特的本地版本,它帶來(lái)了有益于社會(huì)的轉(zhuǎn)變。與其他監(jiān)獄勞動(dòng)力相比,它為囚犯提供了認(rèn)知刺激的工作,同時(shí)也代表了芬蘭語(yǔ)言在人工智能革命中的地位。
萊赫蒂尼米擔(dān)心,如果沒(méi)有這種主動(dòng)性,英語(yǔ)之外的語(yǔ)言將被下一代技術(shù)所淘汰,智能音箱仍然難以理解芬蘭語(yǔ)。“并非所有芬蘭人都能說(shuō)一口流利的英語(yǔ),所以在當(dāng)?shù)剡M(jìn)行的數(shù)據(jù)標(biāo)注還是有必要的,”萊赫蒂尼米說(shuō)。Metroc 并不是唯一一家被迫尋找芬蘭數(shù)據(jù)勞動(dòng)力的公司。2011年,國(guó)家圖書(shū)館發(fā)明了一款游戲,以激勵(lì)志愿者幫助他們數(shù)字化其歸檔資料。2020年,廣播公司 YLE 與赫爾辛基大學(xué)及國(guó)家發(fā)展公司 VAKE 合作,請(qǐng)求志愿者捐贈(zèng)他們的芬蘭語(yǔ)錄音。
在某種意義上,芬蘭的監(jiān)獄項(xiàng)目只是一個(gè)開(kāi)始。有些人擔(dān)心,這可能會(huì)開(kāi)創(chuàng)一個(gè)先例:在監(jiān)獄中引入更具爭(zhēng)議的數(shù)據(jù)標(biāo)簽類(lèi)型,比如弱化暴力內(nèi)容。“即使目前在芬蘭進(jìn)行的數(shù)據(jù)標(biāo)注沒(méi)有爭(zhēng)議,我們也必須考慮它所開(kāi)創(chuàng)的先例,”陶說(shuō),“有什么能防止公司將有創(chuàng)傷性和不雅內(nèi)容的數(shù)據(jù)標(biāo)注外包給監(jiān)獄中的人,尤其是如果他們認(rèn)為那是一個(gè)待開(kāi)發(fā)的勞動(dòng)力資源?”
芬蘭的監(jiān)獄以幫助犯人改過(guò)自新而聞名,不知道芬蘭監(jiān)獄里的勞動(dòng)條件在其他司法沒(méi)那么先進(jìn)的國(guó)家是否同樣適用。根據(jù)公民權(quán)利團(tuán)體美國(guó)公民自由聯(lián)盟(ACLU)的數(shù)據(jù),76% 的囚犯說(shuō)監(jiān)獄勞動(dòng)是強(qiáng)制性的。拉西拉說(shuō),“美國(guó)的監(jiān)獄系統(tǒng)與芬蘭或北歐國(guó)家有很大的不同,理念完全不同。在芬蘭,人們會(huì)積極推動(dòng)這個(gè)項(xiàng)目,因?yàn)槊總€(gè)人都知道這是自愿的。”
人工智能公司需要的數(shù)據(jù)勞動(dòng)力只會(huì)越來(lái)越多,為了跟上發(fā)展的步伐,它們就不得不尋找非同尋常的勞動(dòng)力。隨著 Metroc 規(guī)劃擴(kuò)展到北歐以及芬蘭以外的語(yǔ)言,維爾納拉正在考慮是否將監(jiān)獄勞動(dòng)力項(xiàng)目擴(kuò)展到其他國(guó)家,她說(shuō)“這是我們需要探索的事情”。
原文鏈接:
https://www.wired.com/story/prisoners-training-ai-finland