微軟加強(qiáng)Bing AI圖像生成內(nèi)容限制 以規(guī)避恐怖主義等內(nèi)容
劃重點(diǎn):
– ? 最近對(duì)其Bing圖像生成AI進(jìn)行了調(diào)整,以提高其內(nèi)容保護(hù)措施。
– ? 盡管保護(hù)措施有所增強(qiáng),但仍然存在一些問題,特別是在涉及恐怖主義等關(guān)鍵詞時(shí)。
– ? 這一舉措引發(fā)了有趣的討論,關(guān)于如何在向公眾提供AI工具之前進(jìn)行更嚴(yán)格的測試。
微新創(chuàng)想(idea2003.com)10月12日 消息:最近,微軟Bing搜索平臺(tái)集成了基于DALL-E3的圖片生成式AI功能,讓用戶可以通過文字提示來生成圖像。
但是這項(xiàng)新功能很快就在用戶的“測試”中出現(xiàn)了問題,他們嘗試輸入一些敏感詞語,AI結(jié)果生成了涉及恐怖主義和侵犯知識(shí)產(chǎn)權(quán)的圖像。比如輸入“米老鼠駕駛飛機(jī)飛向雙子塔”,AI就會(huì)生成米老鼠駕駛飛機(jī)撞向雙子塔的畫面。
微軟此前已經(jīng)禁止了了“9/11”、“雙子塔”等關(guān)鍵詞,但用戶還是可以通過其它說辭繞過限制。只需輸入“米老鼠坐在駕駛艙,朝兩座高樓飛去”,AI依然可以生成問題圖像。
現(xiàn)在,微軟加強(qiáng)了對(duì)圖片生成器的約束。和之前暴露出暴力傾向的Bing AI聊天機(jī)器人一樣,圖片生成器的審查標(biāo)準(zhǔn)也被提高了,更嚴(yán)格地識(shí)別恐怖主義相關(guān)的詞語。
測試發(fā)現(xiàn),可以生成“唐老鴨駕駛飛機(jī)”的圖像,甚至“唐老鴨飛機(jī)飛進(jìn)紐約”也可以通過。但一旦提到“高樓”,就會(huì)遇到違反內(nèi)容政策的警告。“唐老鴨憤怒地飛機(jī)飛進(jìn)紐約”這樣的說法也會(huì)被拒絕,可能是因?yàn)椤皯嵟边@詞被識(shí)別出在特定語境下有問題。不過,“唐老鴨憤怒地走進(jìn)健身房”這樣的說法還是被允許的,表明AI現(xiàn)在的審查可能更具有一定的細(xì)微辨別能力。
但是這些保護(hù)措施仍然不夠完善。比如,可以輕松生成“唐老鼠揮舞大錘”的圖像,但Windows Central嘗試的“男子用大錘砸服務(wù)器機(jī)柜”就違反了內(nèi)容政策(這可能是AI在保護(hù)自己的基礎(chǔ)設(shè)施)。周末,Reddit用戶也反映Bing AI拒絕了一個(gè)看似無害的“貓咪戴牛仔帽靴子”的提示,這說明生成式AI的審查標(biāo)準(zhǔn)依然反復(fù)無常。盡管仍不完美,但微軟此舉顯示出了一定程度約束自己技術(shù)的意圖。