隨著Sora爆火,國(guó)內(nèi)運(yùn)營(yíng)商企業(yè)也開(kāi)始與快手等公司一起“卷”AI 視頻賽道了。2024 年 12 月 3 日,在中國(guó)電信 “2024 數(shù)字科技生態(tài)大會(huì)” 上,中電信人工智能科技有限公司和中國(guó)電信人工智能研究院(TeleAI)發(fā)布了首個(gè)央企全自研視頻生成大模型. 以下是對(duì)該事件及相關(guān)預(yù)測(cè)的具體介紹:
- 核心技術(shù)領(lǐng)先:該模型實(shí)現(xiàn)了從文字到分鏡圖和從分鏡圖到視頻的端到端生成,在主體目標(biāo)時(shí)空一致性、個(gè)體復(fù)雜動(dòng)作精準(zhǔn)控制、交互式動(dòng)作精確控制及角色動(dòng)作符合物理規(guī)律等核心技術(shù)上達(dá)到全國(guó)領(lǐng)先水平.
- 應(yīng)用場(chǎng)景廣泛:可通過(guò)整合語(yǔ)義、語(yǔ)音、文生圖、文生視頻等全棧大模型能力,打通短視頻及影視劇制作的各個(gè)環(huán)節(jié),覆蓋文字腳本撰寫(xiě)、分鏡腳本繪制、視頻拍攝及剪輯、配音及音效合成等全流程,提升視頻創(chuàng)作效率,實(shí)現(xiàn)降本增效,主要應(yīng)用于高質(zhì)量可控短劇生成,賦能文宣產(chǎn)業(yè)創(chuàng)新發(fā)展.
- 評(píng)測(cè)排名第一:目前,該視頻生成大模型在權(quán)威視頻生成評(píng)測(cè)榜單 VBench 中排名第一,在 VBench 的 16 個(gè)評(píng)分項(xiàng)目中,一舉奪得 9 項(xiàng)第一,覆蓋了模型的畫(huà)面穩(wěn)定性、語(yǔ)義一致性、空間場(chǎng)景以及視覺(jué)風(fēng)格等幾個(gè)核心能力,其中有 5 項(xiàng)得分超過(guò) 99%.
中電信人工智能公司還構(gòu)建了視覺(jué)大模型產(chǎn)用一體化平臺(tái),作為央企首個(gè)自主研發(fā)的視覺(jué)大模型產(chǎn)用一體化系統(tǒng),為政務(wù)、應(yīng)急、工業(yè)、能源等多個(gè)行業(yè)的開(kāi)發(fā)人員提供全方位賦能,實(shí)現(xiàn)全流程提效.
據(jù) Fortune Business Insights 數(shù)據(jù),2032 年全球 AI 視頻生成市場(chǎng)規(guī)模將超過(guò) 180 億元,增至 25.629 億美元(約合人民幣 186.36 億元),年復(fù)合增長(zhǎng)率 19.5%,市場(chǎng)前景廣闊.從近期實(shí)踐來(lái)看,AI手機(jī)、AI PC等智能終端逐步走進(jìn)日常生活,行業(yè)大模型在金融、工業(yè)、醫(yī)療等領(lǐng)域加快落地,借助大模型解決生產(chǎn)實(shí)際問(wèn)題逐步形成共識(shí)。 |