如果近期路過上海南京西路、陸家嘴等地鐵站,乘客留意會發(fā)現(xiàn),站內(nèi)的廣告牌有多幅AI生成的繪畫作品。這些繪畫作品都是由國內(nèi)的生成式AI平臺Tiamat提供的。
在海外,當(dāng)下熱度最高的AI生成平臺非Midjourney莫屬,近段時間,人們用Midjourney生成了各種以假亂真的圖片:特朗普被追捕、馬斯克成為一名蘇聯(lián)工程師、中國男足獲得了世界杯冠軍……隨便拿出一張都能做到以假亂真的程度。
(資料圖片)
在國內(nèi),成立于2021年的Tiamat相比起來低調(diào)不少,但屬于國內(nèi)最早做AI生成的平臺之一,其自研的MorpherVLM是國內(nèi)首個基于概念融合范式提出的近百億級跨模態(tài)生成模型,與海外技術(shù)節(jié)點(diǎn)、開源社區(qū)保持同頻。
Tiamat創(chuàng)始團(tuán)隊非常年輕,但在2022年10月,Tiamat已完成數(shù)百萬美元的天使輪融資,在今年2月,緊接著宣布完成近千萬美元 A 輪融資,由DCM和綠洲資本聯(lián)合領(lǐng)投。
年輕團(tuán)隊,加上國內(nèi)首家AI生成平臺的標(biāo)簽,讓背后的創(chuàng)業(yè)故事顯得非常傳奇。第一財經(jīng)此前拜訪了位于上海張江創(chuàng)業(yè)工坊的Tiamat辦公室,附近是一條AI街區(qū),幾棟高樓林立,更多的大廈正在動工修建,Tiamat的氣質(zhì)與這里有些相似:雖然目前稍顯冷清,但指向未來。
踩中時代風(fēng)口
以Text-to-image生成模式、Diffusion模型為顯著特點(diǎn)的圖像生成平臺,正在顛覆傳統(tǒng)的內(nèi)容創(chuàng)作和藝術(shù)設(shè)計領(lǐng)域。
而學(xué)了十年美術(shù),大學(xué)轉(zhuǎn)學(xué)計算機(jī)科學(xué)技術(shù)的創(chuàng)始人兼CEO青柑,剛好踩在了時代的風(fēng)口,成立了Tiamat AI繪畫平臺。
Tiamat 團(tuán)隊從2021年開始進(jìn)行模型訓(xùn)練,以自研并自主訓(xùn)練底層模型的方式,與海外技術(shù)節(jié)點(diǎn)、開源社區(qū)等保持著同頻。青柑表示,在一開始融資的時候,他們還需要花很多精力教育市場,解釋什么是AI 生成,什么是多模態(tài)。彼時,距離 Stable Diffusion、Midjourney這些引領(lǐng)著行業(yè)革新的產(chǎn)品上線還有幾個月左右的時間。
作為國內(nèi) AI 生成第一批團(tuán)隊,Tiamat 如今也成為了為數(shù)不多成功融資并實現(xiàn)了商業(yè)化的平臺。
“因為我們一方面有自研的底層模型,另一方面商業(yè)化跑得也比較快,在這個基礎(chǔ)上又是國內(nèi)做得比較早的,對這個技術(shù)也比較敏感,所以我們的兩輪融資是比較快就結(jié)束了。”青柑表示。
2022年10月,Tiamat完成了數(shù)百萬美元天使輪融資,投資方為DCM。23年初,Tiamat緊接著宣布完成近千萬美元 A 輪融資,由DCM和綠洲資本聯(lián)合領(lǐng)投。
綠洲資本創(chuàng)始合伙人張津劍此前對第一財經(jīng)表示,投資的考慮在于,Tiamat團(tuán)隊在技術(shù)上有一定的領(lǐng)先性,創(chuàng)始人也很年輕,學(xué)習(xí)能力也很強(qiáng),同時這個技術(shù)中美之間的差異較小,團(tuán)隊利用這個技術(shù)結(jié)合中國的審美有一些迭代和創(chuàng)新。
“我們這么年輕的履歷擺在這里,大家也會愿意去相信我們,是因為我們確實有實打?qū)嵉募夹g(shù)在,能夠和別人拉開差距,能夠有很好的資源。”青柑表示,自己和團(tuán)隊其他核心成員來自于中科院上??萍即髮W(xué)以及倫敦藝術(shù)大學(xué),在AI圖片引擎、數(shù)字孿生等方面,團(tuán)隊都有技術(shù)積淀。
青柑介紹,創(chuàng)始人團(tuán)隊在大學(xué)的時候就已經(jīng)形成,在大四就拿到了第一筆種子類融資,在有技術(shù),且有學(xué)校支持的情況下,團(tuán)隊創(chuàng)業(yè)做AI生成是順理成章的。
創(chuàng)始團(tuán)隊早期在開源技術(shù)社區(qū)里面待了很久,當(dāng)時AIGC的概念還沒有興起,青柑對第一財經(jīng)表示,“在21年下半年的時候,當(dāng)時在社區(qū)里面有一些技術(shù)大佬提出了大模型的可能性,當(dāng)時很敏銳第一時間關(guān)注到了,那個時候還不叫AIGC,就是單純發(fā)現(xiàn)了一個新的技術(shù),覺得這個事情很有意思,所以我們非常早就在開源技術(shù)社區(qū)里面去做很多相關(guān)的技術(shù)研發(fā)。”
做得早、與海外開源技術(shù)社區(qū)同頻,是Tiamat的優(yōu)勢,青柑表示,“Tiamat在自研和內(nèi)測的系統(tǒng)和Midjourney的內(nèi)測幾乎是同時的,可能相差不過半個月,因為他們的負(fù)責(zé)人和大家在技術(shù)社區(qū)里會互相討論一些問題。”
在推出后,Tiamat在4個月內(nèi)全網(wǎng)曝光量達(dá)到了5000萬,這些全都是自然流量,Tiamat表示,一直都沒有在營銷上花錢投廣。
一開始因為圖片審美質(zhì)量較高,Tiamat更多是在符合調(diào)性的小紅書上火起來的,在發(fā)布了內(nèi)測圖片后,Tiamat引起了非常大的關(guān)注,至今#Tiamat人工智能藝術(shù)#在小紅書上還有2300多萬的持續(xù)點(diǎn)擊和瀏覽。有趣的是,很多品牌方和資方也是通過小紅書找到團(tuán)隊的。
據(jù)團(tuán)隊介紹,目前Tiamat已經(jīng)與央視網(wǎng),以及《時尚芭莎》、《嘉人》等一線時尚大刊建立長期合作關(guān)系,并與眾多頭部游戲公司開展了戰(zhàn)略合作。在產(chǎn)品一側(cè),已經(jīng)實現(xiàn)了內(nèi)測高活躍用戶數(shù)千人、月度新增數(shù)萬人,社區(qū)用戶涵蓋國內(nèi)設(shè)計、藝術(shù)創(chuàng)作、多模態(tài)技術(shù)等頭部博主。
“我們應(yīng)該是國內(nèi)AI圖像領(lǐng)域在商業(yè)化方面跑得最快的。去年 Q4,我們有幾百萬元的合同訂單。”青柑表示。目前,Tiamat 20%的用戶群體是小B端的設(shè)計師,60%是泛設(shè)計行業(yè)人群,其他則是對新技術(shù)和新數(shù)據(jù)更感興趣的人。
何以立足
雖然做得很早,但在當(dāng)下AI生成平臺涌現(xiàn)的情況下,Tiamat憑借什么立足,AI繪畫能否建立護(hù)城河?
青柑認(rèn)為,與海外熱度最高的Midjourney、Stable Diffusion等對比,Tiamat的模型和社區(qū)優(yōu)勢主要體現(xiàn)在中文自然語言處理上的持續(xù)積累,以及能夠提供更適合國內(nèi)用戶需求特點(diǎn)的圖像,并將核心用戶定位于專業(yè)人群。Tiamat生成的圖片有相對獨(dú)特的審美和風(fēng)格。
文本圖像生成領(lǐng)域是從2022年二三月開始公開測試,去年七八月,SD(Stable Diffusion)這一類開源模型放出來之后,緊接著就有大量的創(chuàng)業(yè)者入局。青柑觀察到,很多公司可以不通過訓(xùn)練而直接將SD的模型封裝起來使用,大大降低了AI生成的門檻,這也是平臺涌現(xiàn)的原因。
但這一類已經(jīng)訓(xùn)練好的模型,在具體的商業(yè)化上會有一些局限性。在圖像的商業(yè)化方面,會更關(guān)注的是精準(zhǔn)性、可控性這些指標(biāo),能不能更好地讓圖像展現(xiàn)出人類理想的構(gòu)圖、或者一致性的角色等。
青柑解釋,開源開的是已經(jīng)訓(xùn)練好的模型,但這個東西具體是怎么訓(xùn)練的,數(shù)據(jù)訓(xùn)練上的細(xì)節(jié)是很難被大家知道并模仿的,在這個基礎(chǔ)上進(jìn)一步去做圖像的精準(zhǔn)性、可控性和商業(yè)化,就很難,這也是Tiamat為什么要堅持自研模型的原因。
“在國內(nèi)市場經(jīng)常會遇到的一些情況是,一些廠商需要圖像生成的供應(yīng)商,可能會找到一些用了開源模型的公司,發(fā)現(xiàn)沒法達(dá)到好的效果,然后再來找我們。”青柑提到,自研也是Tiamat商業(yè)化比較順利的理由之一,因為非自研的服務(wù)商始終不能特別直接地生成一個行業(yè)想要的東西。
以服裝領(lǐng)域為例,如果需要 AI 來代替設(shè)計師或者幫設(shè)計師尋找靈感,首先他們的輸入方式一定是服裝設(shè)計領(lǐng)域的“黑話”,如領(lǐng)口版式、版型,不一定是外行能夠理解到的行業(yè)知識。所以團(tuán)隊在去做行業(yè)模型的時候會先去理解設(shè)計師之間的溝通語言,再去理解對應(yīng)的圖片,在此過程中需要重新去構(gòu)建一些圖像文本作為訓(xùn)練數(shù)據(jù)集,基于大模型去調(diào)整,然后才能做行業(yè)的專有模型。
但在這個基礎(chǔ)上,眾多有實力的大廠也在入局 AI生成,是否會對團(tuán)隊帶來一些壓力?青柑認(rèn)為,就圖像生成來說,并沒有觀察到像文本領(lǐng)域一樣由參數(shù)量引發(fā)的質(zhì)變,因此,在數(shù)據(jù)清洗和數(shù)據(jù)選擇這一方面,大廠要去經(jīng)歷的流程和創(chuàng)業(yè)公司沒有太大區(qū)別。
此外,對于大廠來說,基于產(chǎn)品生態(tài),在訓(xùn)練語料的數(shù)據(jù)量上會有一定優(yōu)勢,但可用性上不一定更強(qiáng)。再加上中文的語匯環(huán)境特點(diǎn)更加復(fù)雜,數(shù)據(jù)清洗難度很大,目前實際可用性的文本量級并沒有這么高,可能僅為英文語境可用性的 1/20。
而相比于ChatGPT這樣的文字大模型,一次訓(xùn)練可能會花掉幾十到幾百萬美元,AI 生成模型需要的參數(shù)量級在十億左右,要低將近 100 倍,成本壓力相對較小,這也是創(chuàng)業(yè)團(tuán)隊的機(jī)會。
“從一個比較直觀的感受切入,如果文本出現(xiàn)了一些邏輯上的錯誤或?qū)υ捝系氖д?,用戶可以很快地感受到,而不像對于圖片的細(xì)微瑕疵可能會有更好的包容度。”青柑表示,在文字大模型上花費(fèi)的時間精力和算力是遠(yuǎn)大于AI Art 領(lǐng)域的,對于Tiamat來說,不停地把模型的參數(shù)量級進(jìn)行擴(kuò)張并不是最重要的指標(biāo),而是更多的關(guān)注這個圖像本身的可控性。
最新資訊
關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 供稿服務(wù)| 友情鏈接
咕嚕網(wǎng) m.ulq4xuwux.cn 版權(quán)所有,未經(jīng)書面授權(quán)禁止使用
Copyright©2008-2020 By All Rights Reserved 皖I(lǐng)CP備2022009963號-10
聯(lián)系我們: 39 60 29 14 2@qq.com