B站UP主用1300條B站熱門標(biāo)題訓(xùn)練AI 自制“賽博主編”
微新創(chuàng)想(idea2003.com)9月12日 消息:近日,B站UP主“差評(píng)君”發(fā)布了一條名為“我們用1300條B站熱門視頻,做了一個(gè)能讀懂B站的取標(biāo)題機(jī)器人”的視頻。視頻中,他通過(guò)訓(xùn)練生成了一個(gè)能自動(dòng)生成標(biāo)題的AI“賽博主編”,該AI能夠根據(jù)過(guò)往的熱門視頻內(nèi)容和觀眾口味生成符合B站觀眾口味的標(biāo)題。
據(jù)了解,為了解決取標(biāo)題的難題,“差評(píng)君”選擇了使用B站過(guò)往的熱門視頻作為語(yǔ)料,經(jīng)過(guò)人工數(shù)據(jù)處理和清洗后,將其投喂給千帆大模型平臺(tái)進(jìn)行訓(xùn)練。經(jīng)過(guò)訓(xùn)練后的AI能夠生成符合B站觀眾口味的標(biāo)題。這一應(yīng)用引起了廣泛關(guān)注,截至目前,該視頻播放量達(dá)72.4萬(wàn),獲贊2.1萬(wàn)。
類似這樣的“專用AI”正成為不少玩家和開發(fā)者青睞的應(yīng)用。然而,對(duì)于普通玩家來(lái)說(shuō),“如何獲得訓(xùn)練AI的數(shù)據(jù)”是整個(gè)過(guò)程最大的難點(diǎn)。往往項(xiàng)目中需要的數(shù)據(jù)無(wú)法直接喂給AI,需要大量的預(yù)處理工作,會(huì)花費(fèi)很多功夫。而“差評(píng)君”在視頻中提到,1300條的樣本量還是比較少,只是略微超過(guò)了標(biāo)注數(shù)據(jù)的參考閾值。
但隨著大模型預(yù)置的數(shù)據(jù)集越來(lái)越豐富,訓(xùn)練AI的門檻將會(huì)越來(lái)越低。相信未來(lái),還有更多網(wǎng)友訓(xùn)練出不同玩法的AI應(yīng)用。這種技術(shù)的出現(xiàn)將極大地方便了人們的生活和工作,同時(shí)也為AI技術(shù)的發(fā)展提供了新的可能性。