被賣家追著跑,這一波AI商拍真香了?
編者按:本文來(lái)自微信公眾號(hào) 白鯨出海(ID:baijingapp),作者:趙思堯,編輯:殷觀曉,微新創(chuàng)想經(jīng)授權(quán)發(fā)布。
2022 年年末,OpenAI 推出 ChatGPT,人們對(duì)于 AI 的認(rèn)知受到巨大沖擊,從此大量資源和資金涌入這個(gè)行業(yè)。想起前兩個(gè)月和做 AI 識(shí)別的創(chuàng)業(yè)者聊天,他說(shuō)“AIGC 這一波熱潮,除了激發(fā)新一波的創(chuàng)業(yè),更調(diào)動(dòng)起了甲方老板們的積極性,好像自己不擁抱 AIGC,就要下牌桌了一般”。
舉一個(gè)比較典型的例子,前段時(shí)間,某全球知名化妝品集團(tuán)“全網(wǎng)”尋找一家體量不大的公司,問(wèn)到了我們這里來(lái),而打聽(tīng)一圈下來(lái)我們發(fā)現(xiàn),這家服務(wù)商好像忙到?jīng)]時(shí)間回消息。
被“追逐”的主角是 zmo.ai,2020 年成立。成立時(shí)間雖短,卻已經(jīng)獲得不少優(yōu)質(zhì)投資機(jī)構(gòu)背書(shū)。CrunchBase 顯示,zmo.ai 最近一次融資在 2022 年 5 月,獲得高瓴創(chuàng)投領(lǐng)投的 800 萬(wàn)美元,紀(jì)源資本和金沙江創(chuàng)投也有參與。
而 zmo.ai 被打聽(tīng)最多的服務(wù)就是利用 AI 幫助時(shí)尚品牌生成高質(zhì)量產(chǎn)品圖片。之所以有這么多品牌想積極嘗試 AI 成圖,與商拍成本不低且流程繁瑣直接相關(guān)。
一個(gè)品牌如果要制作效果不錯(cuò)且有模特出鏡的產(chǎn)品圖,需要根據(jù)風(fēng)格和主題提前招募挑選模特、預(yù)約拍攝地點(diǎn)和設(shè)備,拍攝后需要后期處理、挑選、審核圖片,流程上需要幾天到幾周不等。一年中這樣的拍攝可能得有好幾次。
而根據(jù)品牌對(duì)成片的要求,費(fèi)用波動(dòng)也很大。一家提供 AI 商拍工具的企業(yè) weshop.ai 業(yè)務(wù)負(fù)責(zé)人吳海波告訴筆者,行業(yè)內(nèi)部有這樣一個(gè)大概認(rèn)知,一個(gè)品牌每年在素材準(zhǔn)備中的花費(fèi)大約會(huì)在年 GMV 的 2%-5%。如果按照這個(gè)區(qū)間,一個(gè)電商賣家一年的 GMV 如果是 200 萬(wàn)美元,那么每年在素材上的花費(fèi)大約會(huì)是 4-10 萬(wàn)美元,也就是 30-70 萬(wàn)人民幣,其實(shí)也是一筆不小的支出。
按道理,一個(gè) AI 生圖的服務(wù),如果成片能夠同等代替原來(lái)素材,且訂閱費(fèi)用低于原來(lái)的素材拍攝花費(fèi),應(yīng)該是能在市場(chǎng)上跑通的。事實(shí)又是怎樣的呢?zmo.ai 被品牌追捧,是個(gè)例還是普遍現(xiàn)象?
于是我們打算從 AI 商拍產(chǎn)品切入,以窺行業(yè)一角。
靜態(tài)產(chǎn)品圖生成功能已經(jīng)開(kāi)卷
筆者測(cè)試了 6 款提供 AI 商拍工具的產(chǎn)品,其中 2 款效果不佳,這里不多著筆墨。
多數(shù)產(chǎn)品會(huì)提供 3 類功能,靜態(tài)產(chǎn)品圖生成、真人模特?fù)Q臉、基于產(chǎn)品/假模生成模特圖。其中靜態(tài)產(chǎn)品圖生成功能難度最低,每一款產(chǎn)品在細(xì)分功能上都已經(jīng)做得比較成熟。而假模生成模特圖功能有的暫未開(kāi)放,有的需要直接聯(lián)系銷售或加入候補(bǔ)名單。
生成靜態(tài)產(chǎn)品圖功能的使用路徑基本相同,“上傳圖片——摳產(chǎn)品——選擇背景參考模板生成新背景/輸入 prompt 生成新背景”。
筆者在 4 款產(chǎn)品中上傳了相同的“手托酒瓶”圖片。
zmo.ai:
zmo.ai 只支持自動(dòng)摳圖(自動(dòng)識(shí)別產(chǎn)品邊框后摳圖),因此筆者被迫保留了手的部分,但對(duì)于電商賣家來(lái)說(shuō),這是個(gè)挺大的 bug。在生成新背景環(huán)節(jié),zmo.ai 提供了 3 個(gè)功能,選擇背景模板、輸入 prompt 生成背景、上傳參考背景圖后 zmo.ai 根據(jù)參考圖生成類似背景。對(duì)比下來(lái),zmo.ai 的可選模板不算多,但根據(jù)參考圖變形的功能十分好用。
在生成圖片后,zmo.ai 支持用戶調(diào)節(jié)圖片參數(shù),使成圖效果更自然和有質(zhì)感。
WeShop:
WeShop 會(huì)將用戶上傳的原圖分為多個(gè)色塊,用戶可以勾選想要保留的區(qū)域,或者上傳一張蒙版圖。雖然色塊被切割得很細(xì),但筆者在只勾選酒瓶部分后,生成的圖片里還是會(huì)看到原圖手部的影子。了解后得知,是 WeShop 為了讓生成圖中商品與背景融合得更好,在 AI 生成時(shí)會(huì)以原背景作為生成基礎(chǔ),在筆者測(cè)試 WeShop 的真人圖和人臺(tái)圖時(shí)也會(huì)發(fā)現(xiàn)相同的情況,這里建議 WeShop 上線一個(gè)摳圖后清除背景的功能,更加方便用戶使用~
在生成新背景步驟,WeShop 也提供 3 個(gè)功能,背景模板、輸入 prompt 生成背景、高級(jí)自定義。前 2 個(gè)功能與 zmo.ai 類似。高級(jí)自定義功能則是讓用戶輸入正反向咒語(yǔ),也就是背景圖中希望出現(xiàn)的元素和不希望出現(xiàn)的元素,通過(guò)正反向咒語(yǔ)讓 WeShop 更快生成符合用戶期待的圖片。
xiangji.ai:
在筆者看來(lái),摳圖這一步做得最好的是 xiangji.ai,因?yàn)?xiangji.ai 在智能摳圖外支持精細(xì)摳圖,通過(guò)原圖上描點(diǎn)的方式選定保留或去除的部分,在 4 個(gè)工具的試用過(guò)程中,只有用 xiangji.ai 生成的圖片完全看不到原圖手部的影子。
這里有兩個(gè)點(diǎn)值得說(shuō)一下,首先對(duì)于商用來(lái)說(shuō),賣家在拍產(chǎn)品圖的時(shí)候,大概會(huì)降低“手”這類影響元素,所以是否能手動(dòng)摳圖可能并不是特別一個(gè)嚴(yán)重的問(wèn)題。
另外,其實(shí)很多修圖 App 的摳圖功能,已經(jīng)能做到和 xiangji.ai 同等水平、甚至更好。
在背景生成環(huán)節(jié),用戶可以通過(guò)選擇模板并添加線稿圖(即選擇添加希望出現(xiàn)的元素)來(lái)控制背景生成,此外也可以調(diào)節(jié)圖片參數(shù),讓成圖效果更好。
強(qiáng)行修改 prompt 內(nèi)容后生成的圖片沒(méi)有出現(xiàn)爆米花
每選擇一個(gè)模板或線稿圖元素(類似于一朵花),prompt 輸入框中就會(huì)自動(dòng)加入標(biāo)簽。筆者雖然可以強(qiáng)硬修改標(biāo)簽內(nèi)容,例如我將“優(yōu)雅餐具在側(cè)”改寫(xiě)成“爆米花在側(cè)”,但系統(tǒng)似乎并不會(huì)執(zhí)行改變后的指令,所以 xiangji.ai 的場(chǎng)景融繪框大概率只起到展示用戶選擇的內(nèi)容的作用,并不支持輸入 prompt 生成背景。
nolibox.com:
nolibox.com 的靜態(tài)產(chǎn)品圖生成功能基本融合了上述 3 款產(chǎn)品的功能,支持選擇背景模板、輸入 prompt 生成背景,可以像 zmo.ai 一樣 2 張圖變形后合成新圖、調(diào)整圖片參數(shù),也可以像 xiangji.ai 一樣添加線稿元素。
不難看出,在靜態(tài)產(chǎn)品圖生成這一功能上,由于操作步驟大差不差,服務(wù)商們已經(jīng)開(kāi)始在細(xì)節(jié)上做文章,這就要看誰(shuí)更能洞察到電商從業(yè)者們的細(xì)節(jié)需求了。
而事實(shí)上,廠商要做出生成靜態(tài)產(chǎn)品圖這樣的功能,門檻似乎也不在技術(shù)層面。
從產(chǎn)生 idea到第一版產(chǎn)品落地只需 1 個(gè)月
為了弄清 AI To 電商的應(yīng)用現(xiàn)狀,我們聯(lián)系到了 WeShop 的負(fù)責(zé)人吳海波,吳海波告訴筆者,“要推出底層模型需要足夠的人力和資金,所以你看到這些廠商會(huì)是 OpenAI、Midjourney。而多數(shù)廠商并沒(méi)有能力搭建模型,包括我們。WeShop 的團(tuán)隊(duì)不到 20 人,所以我們采用了擁抱開(kāi)源的方式”。
WeShop 現(xiàn)階段采用了開(kāi)源的 Stable Diffusion(以下簡(jiǎn)稱 SD)作為底層模型。從底層模型到 WeShop 1.0 版本只需要兩步走。
吳海波介紹,“2022 年 10 月的時(shí)候 Stability AI 推出了 SD 1.5 版本,之后其實(shí)也陸續(xù)推出了幾個(gè)新的版本,但大家都認(rèn)為不及 1.5 版本好用。是因?yàn)?GitHub 社區(qū)中有大量的人才已經(jīng)基于 SD 1.5、針對(duì)不同場(chǎng)景優(yōu)化出了更好用的模型。SD 1.5 的生態(tài)是非常豐富的,你基本可以在社區(qū)上找到任何能想到的針對(duì)某一特定功能優(yōu)化過(guò)的新模型,比如優(yōu)化人像、比如提升動(dòng)漫效果”。
WeShop 團(tuán)隊(duì)已經(jīng)明確了要做 AI 商拍圖的目標(biāo),因此可以很輕易地確定需要優(yōu)化的功能,并在社區(qū)中找到在這一分支上優(yōu)于 SD 1.5 的最好的模型(check point)。“而只要是基于 SD 1.5 的模型,經(jīng)過(guò)測(cè)試和調(diào)參,就可以很好地 mix。這是我們的第一步,產(chǎn)品類似于一個(gè)縫合怪,但耗時(shí)非常短”。
而即便是站在人才們的肩膀上做縫合,也還只是一個(gè)普適的產(chǎn)品,無(wú)法完全滿足電商需求。例如,利用 AI 生成圖片過(guò)程中,成圖和原圖如果出現(xiàn)服裝紋理、材質(zhì)的變化,在學(xué)術(shù)上是被允許的,但在電商領(lǐng)域,就變成了貨不對(duì)版的嚴(yán)重錯(cuò)誤。要讓產(chǎn)品符合電商從業(yè)者的需求,還需要做進(jìn)一步優(yōu)化。
吳海波介紹,“SD 1.5 的底層模型是基于 20 億圖片訓(xùn)練出來(lái)的,我們?cè)诘诙A段則是用了 20 億的百分之幾的數(shù)據(jù)量級(jí)去對(duì)模型做了微調(diào)”。
筆者對(duì)技術(shù)一竅不通,聽(tīng)到幾十倍的數(shù)據(jù)投喂量級(jí)差距,首先會(huì)覺(jué)得太少了。對(duì)此吳海波解釋,“投喂的數(shù)據(jù)自然是越多越好,但挑選數(shù)據(jù)、打標(biāo)和審核需要很長(zhǎng)時(shí)間,要先保證數(shù)據(jù)質(zhì)量”。
WeShop 被投喂的數(shù)據(jù)基本來(lái)自蘑菇街近年在電商領(lǐng)域積累到的圖片,例如運(yùn)營(yíng)社區(qū)時(shí)從賣家處獲得的圖片、從簽約的 KOL 處獲得的圖片、在國(guó)內(nèi)外收集到的全品類產(chǎn)品圖等等。這些前期準(zhǔn)備也使 WeShop 的落地時(shí)間控制在了 1 個(gè)多月,大概比真正從 0-1 的廠商用時(shí)會(huì)短一些。
不過(guò)再怎么看,這項(xiàng)生意的技術(shù)壁壘都不算高。更早起步,通過(guò)不斷投喂優(yōu)質(zhì)數(shù)據(jù)、以及用戶交互之后帶來(lái)的技術(shù)迭代和功能優(yōu)化,可能是這場(chǎng)競(jìng)賽中比較重要的一環(huán)。
吳海波從做產(chǎn)品的角度,則認(rèn)為“在 AIGC 應(yīng)用層面的創(chuàng)業(yè),技術(shù)甚至不是最重要的,最重要的是對(duì)產(chǎn)業(yè)需求的理解。互聯(lián)網(wǎng)行業(yè)就有非常多的例子,比如說(shuō)算法推薦不是字節(jié)發(fā)明的,但是字節(jié)系的產(chǎn)品把這項(xiàng)技術(shù)與內(nèi)容產(chǎn)業(yè)結(jié)合到了極致。WeShop 是切商拍場(chǎng)景的工具,對(duì)這個(gè)需求的洞察源于過(guò)去 12 年蘑菇街在電商領(lǐng)域的積累。我們了解商家需要什么樣的商拍圖、甚至我們可以教那些中小商家怎么用 WeShop 把商品圖做得比原來(lái)更好,這些對(duì)產(chǎn)業(yè)的理解倒推我們?cè)诜浅6嗟募?xì)節(jié)上去滿足客戶的需求。所以這波 AI 創(chuàng)業(yè),真正的競(jìng)爭(zhēng)壁壘在于去滿足用戶甚至自己都沒(méi)意識(shí)到的需求,把每一個(gè)細(xì)節(jié)做到極致”。
不論是從上面的初步測(cè)試結(jié)果、還是產(chǎn)品的研發(fā)周期,都會(huì)發(fā)現(xiàn),大家的確是都在跑步入場(chǎng),平臺(tái)功能現(xiàn)階段可能并不完善,市面上的同類產(chǎn)品也是如此。在模特?fù)Q臉圖和假模生圖功能上,這種功能不成熟更加明顯。
模特圖生成功能:缺乏絕對(duì)強(qiáng)者
由于 xiangji.ai 和 nolibox.com 的模特?fù)Q臉功能無(wú)法體驗(yàn),筆者只測(cè)試了 zmo.ai 和 WeShop。
筆者上傳了冷臉女孩展示黑色 T-恤的圖片。
在選定變化區(qū)域后,zmo.ai 直接讓用戶通過(guò)輸入 prompt 自由發(fā)揮,但出圖效果很不錯(cuò)。
WeShop 則進(jìn)一步降低了用戶的使用門檻,用戶可以從模板中選擇人種和場(chǎng)景快速成圖。
而對(duì)從業(yè)者最友好的則是筆者測(cè)試期間 WeShop 新推出的“復(fù)刻任務(wù)”功能,用戶可以直接將已經(jīng)完成的任務(wù)用在新任務(wù)上。有了這個(gè)功能,商家可以制作同個(gè)模特不同姿勢(shì)角度的組圖。不過(guò)吳海波告訴筆者,盡管這一直是賣家們呼聲很高的功能,但因?yàn)槿四樄潭ù嬖陔[私及版權(quán)風(fēng)險(xiǎn),因此直到現(xiàn)在才推出。“我們團(tuán)隊(duì)近期剛剛通過(guò)技術(shù)方案解決這個(gè)問(wèn)題,即限制用戶只能使用 WeShop 生成的人臉固定模特面容,無(wú)法使用外部肖像。這樣能規(guī)避肖像隱私問(wèn)題和肖像版權(quán)問(wèn)題。”
從靜態(tài)產(chǎn)品圖到模特?fù)Q臉再到基于產(chǎn)品生成模特圖,難度逐層加高。目前 zmo.ai 和 nolibox.com 的 AI 時(shí)尚模特功能無(wú)法直接體驗(yàn),因此筆者只測(cè)試了 WeShop。
準(zhǔn)確地來(lái)說(shuō),WeShop 需要用戶上傳產(chǎn)品的人臺(tái)圖(真人比例的假人模特穿上產(chǎn)品的圖片)。筆者嘗試上傳了一套女裝和一套男裝的人臺(tái)圖,生成的圖片效果不太穩(wěn)定,有時(shí)會(huì)出現(xiàn)服裝與產(chǎn)品不符(男裝)或 AI 模特的身體部位不真實(shí)的情況,需要多試幾次,才會(huì)有效果不錯(cuò)的成圖出現(xiàn)。
由于沒(méi)有更多測(cè)試對(duì)象,因此在模特圖生成功能對(duì)比上可能存在偏頗,但僅從現(xiàn)有的產(chǎn)品出圖效果可以看出,這一功能還有很多地方亟待加強(qiáng)。不過(guò),即便是當(dāng)前不夠成熟的產(chǎn)品,也已經(jīng)有用戶能夠有效用起來(lái)了。
AI 商拍圖工具涌現(xiàn),首先最大化利用的是中小出海賣家
“現(xiàn)在市場(chǎng)利好的一面是,所有人都對(duì) AI 充滿熱情,所以樂(lè)于嘗試的從業(yè)者不少,包括一些體量很大的國(guó)內(nèi)和出海品牌都會(huì)來(lái)咨詢”,吳海波透露。
一位了解不少服裝出海品牌的從業(yè)者 Bruce 也說(shuō),“一些企業(yè)其實(shí)缺少一個(gè)既懂業(yè)務(wù)、又了解 AI 的高管,這導(dǎo)致它們雖然急著結(jié)合 AI,但不知道具體怎么做,所以市面上出現(xiàn)一個(gè)什么產(chǎn)品就會(huì)去先了解一下,獲得一些思路”。
而大企業(yè)要真正融合 AI 產(chǎn)品并不是容易的事,已經(jīng)將市面上這些 AI 商拍圖產(chǎn)品用于業(yè)務(wù)中的主要用戶其實(shí)并非大廠。
吳海波告訴筆者,“結(jié)合 WeShop 現(xiàn)在的產(chǎn)品力,我們發(fā)現(xiàn),將 WeShop 利用得最好的人群有 2 類,一類是做跨境的中小賣家,另一類是國(guó)內(nèi)位于經(jīng)銷鏈路起點(diǎn)的檔口賣家,后者所占的比例最近明顯上升”。
進(jìn)一步具象這些人群時(shí),吳海波解釋道“體量小的跨境賣家,機(jī)動(dòng)性反而高。且對(duì)于年 GMV 幾百萬(wàn)元的賣家,他的 SKU 不會(huì)很多,每個(gè)月花費(fèi) 298 元購(gòu)買基礎(chǔ)套餐就足夠了,并不需要付出很大的成本。
國(guó)內(nèi)市場(chǎng)的電商鏈路更成熟,相關(guān)服務(wù)成本更低,所以目標(biāo)市場(chǎng)在國(guó)內(nèi)的這部分賣家他們?cè)谶x購(gòu) AI 商拍圖產(chǎn)品時(shí)其實(shí)更看重生圖效果,價(jià)格反而不是首要考慮因素了。為了滿足用戶需求,我們常常得一天迭代好幾個(gè)新版本”。
這里附上各產(chǎn)品的會(huì)員價(jià)格(從上至下:zmo.ai、weshop.ai 海外、weshop.com 國(guó)內(nèi)、xiangji.ai)(WeShop 國(guó)內(nèi)及海外版本收費(fèi)不同)
大量的同類產(chǎn)品一起競(jìng)爭(zhēng),雖然在功能有些許細(xì)微差異下,但疊加并不高的服務(wù)價(jià)格和當(dāng)下中國(guó)的 SaaS 環(huán)境,廠商們依然需要繼續(xù)往前探索。而放大視角去看,我們發(fā)現(xiàn)上述產(chǎn)品背后的廠商在做的事情并不完全相同。
根據(jù)官網(wǎng)介紹,zmo.ai 希望利用 AI 改變內(nèi)容創(chuàng)作的方式,未來(lái)大概率也不會(huì)只聚焦于電商。xiangji.ai 本身有象寄翻譯、AI 文案撰寫(xiě)等矩陣產(chǎn)品,似乎是打算基于 AI 為電商從業(yè)者提供更多類型的工具。nolibox.com 目前已經(jīng)推出了AI 繪畫(huà)、AI 商品圖以及智能設(shè)計(jì)產(chǎn)品,目標(biāo)用戶看上去和 zmo.ai 交集更大。
關(guān)于 WeShop,吳海波則告訴筆者,“AI 不斷進(jìn)步,我認(rèn)為未來(lái)會(huì)有很多公司將 AI 視為自己的員工,發(fā)展出新的工作模式。那個(gè)時(shí)候 AI 和人類員工各自的業(yè)務(wù)流如何構(gòu)建和協(xié)同就會(huì)變成一個(gè)亟待解決的問(wèn)題。WeShop 是我們探索新型工作流的起點(diǎn)”。
在筆者成稿期間,又陸續(xù)發(fā)現(xiàn)了不少提供類似功能的產(chǎn)品,但距離這一細(xì)分領(lǐng)域出現(xiàn)寡頭恐怕還要很久很久。更優(yōu)的底層模型出現(xiàn)、產(chǎn)品功能和定價(jià)模式優(yōu)化以及企業(yè)本身指定的發(fā)展方向都可能改變競(jìng)爭(zhēng)格局,入局者可以做的還有很多。讀者們還有什么 AI 商拍圖產(chǎn)品,以及其他優(yōu)質(zhì)的 AI 在細(xì)分領(lǐng)域的應(yīng)用案例推薦,歡迎在評(píng)論區(qū)推薦給我們,我們都會(huì)一一測(cè)試。
本文為專欄作者授權(quán)微新創(chuàng)想發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表微新創(chuàng)想立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問(wèn),請(qǐng)聯(lián)系http://www.i0562.net/。