雖然元宇宙概念因大模型的火熱而短暫熄火,但元宇宙內(nèi)的“門面人物”虛擬數(shù)字人作為人工智能技術(shù)產(chǎn)物,得益于算力提升,迎來低成本、規(guī)模化落地的可能。
4月25日,騰訊云智能“數(shù)智人媒體溝通會”上,騰訊云智能小樣本數(shù)智人生產(chǎn)平臺首次對外發(fā)布,平臺具有訓(xùn)練樣本小、生產(chǎn)效率高、自動化生產(chǎn)等特性,可以輕松實現(xiàn)“自助式”數(shù)智人生產(chǎn)制作。
(資料圖)
采訪中,騰訊優(yōu)圖實驗室研究總監(jiān)汪鋮杰對第一財經(jīng)記者表示,以前行業(yè)做的數(shù)智人效果未必好,有的一看就知道特別假;現(xiàn)在的數(shù)智人看一眼,還要猜測它們到底是真還是假。
技術(shù)發(fā)展帶動數(shù)智人產(chǎn)業(yè)落地
伴隨人工智能技術(shù)的發(fā)展,國內(nèi)偶像綜藝、品牌代言人、熱門網(wǎng)紅等行業(yè)相繼出現(xiàn)由數(shù)字人扮演的角色,同時數(shù)量不斷增加。各家大廠也陸續(xù)發(fā)布了自己的數(shù)字人、虛擬人、數(shù)智人產(chǎn)品。
不論名字如何形容,其本質(zhì)都是通過計算機圖形學(xué)技術(shù)(Computer Graphic,CG)創(chuàng)造出與人類形象接近的數(shù)字化形象,并賦予其特定的人物身份設(shè)定,在視覺上拉近和人的心理距離,為人類帶來更加真實的情感互動。據(jù)相關(guān)機構(gòu)預(yù)測,到2030年,我國數(shù)字人整體市場規(guī)模將達到2700億元。
騰訊則直接推出數(shù)智人的生產(chǎn)平臺。騰訊方面介紹稱,騰訊云智能小樣本數(shù)智人生產(chǎn)平臺依托騰訊自研AI能力和技術(shù)經(jīng)驗,需要3分鐘真人口播視頻、100句語音素材,平臺便可通過音頻、文本多模態(tài)數(shù)據(jù)輸入,實時建模并生成高清人像,在24小時內(nèi)制作出與真人近似的“數(shù)智人”。
另外,成本方面,該生產(chǎn)平臺已將成本降低到千元級別,制作周期縮短至小時級,大幅降低數(shù)字人使用門檻。但是,3D超寫實、高精定制等高技術(shù)要求的數(shù)智人仍要求高成本,以及具體針對客戶需求進行定制。
騰訊云智能數(shù)智人產(chǎn)品總經(jīng)理陳磊表示,小樣本數(shù)智人支持半身、全身形象展示,手勢動作會根據(jù)內(nèi)容靈活調(diào)整,也支持錄制背景任意更換,適用于直播帶貨等更廣泛的商用場景。
相較于2D真人精品數(shù)字人,陳磊認(rèn)為小樣本數(shù)智人無需專業(yè)影棚錄制素材,成本更低;相較于照片生成、僅能呈現(xiàn)面部形態(tài)的數(shù)字人,小樣本數(shù)智人可根據(jù)文本設(shè)計手勢,唇動、口型、表情復(fù)現(xiàn)真人風(fēng)格。
東方證券研報分析認(rèn)為,虛擬數(shù)字人的驅(qū)動可分為由真人扮演(業(yè)內(nèi)稱為“中之人”)驅(qū)動和 AI 驅(qū)動。過去 AI 驅(qū)動數(shù)字人的痛點在于成本較高、交互效果不佳,因此由真人扮演驅(qū)動更為常見,此類路線背后的商業(yè)模式內(nèi)核是偶像娛樂工業(yè)、虛擬主播帶貨等,如字節(jié)跳動旗下游戲品牌朝夕光年和樂華娛樂共同打造的虛擬偶像女團A-SOUL。
另外,隨著近期AI 領(lǐng)域的技術(shù)突破、文本、圖像等領(lǐng)域的大模型應(yīng)用的快速落地,AI 驅(qū)動的數(shù)字人的制作門檻和成本有望降低,例如外貌合成、動作合成等環(huán)節(jié)均可借助 AI 技術(shù);數(shù)字人的對話能力有望得到質(zhì)的提升,擁有更加接近真人的對話能力。可以推測,AI 與數(shù)字人的結(jié)合,將使數(shù)字人的應(yīng)用場景及范圍明顯擴大,例如通過語音合成、表情合成以及深度學(xué)習(xí)等技術(shù),打造的虛擬客服、服務(wù)助手等已在實際生活、工作場景中進入大規(guī)模應(yīng)用。
行業(yè)尚未形成穩(wěn)定競爭格局
4月下旬,浙江省人民政府印發(fā)《關(guān)于進一步擴大消費促進高質(zhì)量發(fā)展若干舉措的通知》,其中提出:搶抓電子商務(wù)直播快速發(fā)展機遇,發(fā)展數(shù)字人虛擬主播、元宇宙新消費場景等新業(yè)態(tài)新模式。發(fā)展“跨境電子商務(wù)+直播”模式,打造跨境保稅倉直播總部基地,舉辦保稅倉實景直播帶貨等活動。
東方證券研報分析稱,短視頻、直播電商是數(shù)字人應(yīng)用的核心場景之一。數(shù)字人目前的主要應(yīng)用場景包括營銷代言、電商帶貨、客服等。其中,數(shù)字人進行電商直播帶貨的優(yōu)勢在于降低人工成本、不間斷直播、可控性強。
人工成本是直播/短視頻電商中的重要成本構(gòu)成(且人力成本的增加是未來趨勢),虛擬人可代替真人在電商直播或者視頻拍攝中出鏡從而降低人工成本的支出。另外,時長是直播電商產(chǎn)能的重要衡量指標(biāo),數(shù)字人可以和真人主播配合,例如真人主播在黃金時段直播,而虛擬人主播則在流量低谷時替代真人主播,實現(xiàn) 7×24 小時全天直播,可實現(xiàn)最大限度的客戶觸達。以及數(shù)字人形象和人設(shè)相對穩(wěn)定,出錯概率低,相對可控。
陳磊在采訪中透露,目前已有好幾個合作伙伴接入騰訊數(shù)智人,也上線了各大平臺。另外,電商直播只是落地場景中一個小場景,作為個人數(shù)智分身,各行各業(yè)都有,只要是時間寶貴的行業(yè)都有這個需求。
天眼查數(shù)據(jù)顯示,我國現(xiàn)有“虛擬人”“數(shù)字人”的相關(guān)企業(yè)66.2萬余家。其中,超九成的虛擬人企業(yè)成立于5年之內(nèi),成立于1年內(nèi)的相關(guān)企業(yè)占比41.9%。尤其是目前低技術(shù)門檻的數(shù)智人批量生產(chǎn),極易造成同質(zhì)化競爭局面。對此,汪鋮杰對第一財經(jīng)記者表示,在一些舊的生產(chǎn)模式往新的生產(chǎn)模式走的過程,大家都會找到自己的定位。
另外,陳磊對第一財經(jīng)表示,騰訊的數(shù)智人產(chǎn)品從2018年開始找各個行業(yè)與場景尋找落地價值,解決客戶實際問題痛點,所做的事情更多是產(chǎn)生實際價值這個點。通過小樣本,從整體的發(fā)展階段來看,讓成本有足夠的降低,讓小樣本數(shù)智人將企業(yè)歷史沉淀算力,包括管線化能力在內(nèi)的訓(xùn)練一站式,變成自助式工具化手段,賦能給行業(yè)的合作伙伴,幫助他們拓展場景,成就垂直場景的價值。
另外,客戶企業(yè)選擇也有自身的要求與標(biāo)準(zhǔn)。頭豹研究院分析稱,企業(yè)在選擇虛擬數(shù)字人廠商時主要會考量幾個因素:廠商的技術(shù)實力、報價預(yù)算、虛擬數(shù)字人后期運維服務(wù),以及廠商和企業(yè)之間既定的互信合作關(guān)系,例如在銀行業(yè),人工智能服務(wù)涉及商業(yè)數(shù)據(jù)或客戶隱私,企業(yè)傾向于交由熟悉的外包公司,而不是頭部技術(shù)廠商來完成。
除此之外,頭豹研究院分析表示,業(yè)內(nèi)頭部廠商在人像驅(qū)動、智能對話和語音交互等技術(shù)領(lǐng)域并無較大差距,差異化主要集中在兩大方面:首先是知識圖譜方面,虛擬偶像、虛擬帶貨主播、虛擬銀行客服、虛擬財務(wù)員工和虛擬醫(yī)生等不同場景下應(yīng)用的知識圖譜各不相同,同一場景下不同業(yè)務(wù)涉及的知識庫也存在差異,以金融業(yè)為例,要求虛擬數(shù)字人廠商沉淀豐富的業(yè)務(wù)場景能力,針對金融企業(yè)的營銷、風(fēng)控、客服等場景均具備成熟的產(chǎn)品方案能力;其次是廠商和企業(yè)之間先行的互信合作關(guān)系,如客戶向信賴的廠商提出需求,確定虛擬數(shù)字人的形象、功能、任務(wù)框架和知識圖譜,由廠商進行后續(xù)的開發(fā)。
因此整體來看,國內(nèi)虛擬人行業(yè)尚未形成穩(wěn)定的競爭格局,市面也尚未出現(xiàn)成熟高端的應(yīng)用產(chǎn)品,行業(yè)仍需持續(xù)投入底層技術(shù)研發(fā),并在垂直行業(yè)爭奪市場份額。
關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 供稿服務(wù)| 友情鏈接
咕嚕網(wǎng) m.ulq4xuwux.cn 版權(quán)所有,未經(jīng)書面授權(quán)禁止使用
Copyright©2008-2020 By All Rights Reserved 皖I(lǐng)CP備2022009963號-10
聯(lián)系我們: 39 60 29 14 2@qq.com