人人人免费人人专区人人,欧美精品不卡,欧美大片无尺码在线观看,久久精品小视频,成人免费黄色大片,欧美+亚洲+精品+三区

谷歌發言人:隱私政策更新沒有從根本上改變其訓練人工智能模型的方式

站長之家(ChinaZ.com) 7月6日消息:谷歌已更新其隱私政策以確認從互聯網上獲取公開數據來訓練其人工智能模型和服務,包括其聊天機器人 Bard 和現在可以實時生成查詢答案的搜索引擎。

谷歌隱私政策的 PDF 版本中寫道:「谷歌使用信息來改善我們的服務,并開發惠及我們的用戶和公眾的新產品、功能和技術。例如,我們使用公開可獲取的信息來幫助訓練谷歌的人工智能模型,并構建 Google 翻譯、Bard 和 Cloud AI 等產品和功能。」

這些變化定義了谷歌在人工智能訓練方面的范圍。此前,該政策只提到了「語言模型」并涉及到 Google 翻譯。但現在的措辭已被修改為涵蓋「AI 模型」,并包括 Bard 和其他在其云平臺上構建的應用系統。

一位谷歌發言人稱,這次更新并未從根本上改變他們訓練人工智能模型的方式。該發言人在一份聲明中表示:「我們的隱私政策一直透明地說明谷歌使用公開網絡上的可獲取信息來訓練 Google 翻譯等服務的語言模型。此次更新只是明確了 Bard 等較新的服務也包含在內。我們根據我們的 AI 原則在開發 AI 技術時融入隱私原則和保護措施。」

多年來,開發人員一直通過從互聯網、相冊、圖書、社交網絡、源代碼、音樂和文章等收集訓練數據來開發 AI 系統。然而,這個過程是有爭議的,因為這些材料通常受版權、使用條款和許可證的保護,整個過程也導致了訴訟。

有些人對自己的內容不僅被用于構建復制其作品的機器學習系統感到不滿,從而可能危及其生計,而且模型的輸出與版權或許可證侵權過于接近,因為其不加修改地重復了這些訓練數據。

AI 開發人員可能會辯稱他們的努力屬于合理使用(fair use)范疇,并且模型的輸出是一種新的作品,實際上并不是原始訓練數據的復制。這是一個備受爭議的問題。

例如,Stability AI 就因為從其庫存圖像網站非法收集和濫用數百萬張圖片來訓練其文本到圖像工具而被 Getty Images 起訴。與此同時,OpenAI 及其所有者微軟也面臨多起訴訟,指控他們不當從互聯網、「圖書、文章、網站和帖子——包括未經同意獲得的個人信息」中獲取「3000 億字」的內容,并從公共代碼庫中提取源代碼,以創建 AI 協作編程工具 GitHub Copilot。

谷歌的發言人拒絕澄清該廣告和搜索巨頭是否會從公開受版權或許可的數據或社交媒體帖子中獲取數據來訓練其系統。

現在人們對于如何訓練人工智能模型有了更多了解,一些互聯網企業已經開始向開發者收費以獲取其數據。例如,Stack Overflow、Reddit 和 Twitter 今年推出了通過 API 訪問其內容的收費或新規定。其他網站如 Shutterstock 和 Getty 則選擇將其圖像授權給 AI 模型構建者,并與 Meta 和英偉達等公司合作。

您可能還喜歡...

發表回復

您的郵箱地址不會被公開。 必填項已用 * 標注