歡迎來到合肥浪訊網(wǎng)絡(luò)科技有限公司官網(wǎng)
  咨詢服務(wù)熱線:400-099-8848

阿里巴巴研發(fā)中文語言數(shù)據(jù)集 Youku-mPLUG,語料數(shù)據(jù)來自優(yōu)酷 興趣認(rèn)證

發(fā)布時(shí)間:2023-06-09 文章來源:本站  瀏覽次數(shù):2130

6月8日訊,據(jù) arxiv上的一篇論文顯示,達(dá)摩院近來為了推進(jìn)視覺言語預(yù)練習(xí)以及多模態(tài)大言語模型在中文社區(qū)的發(fā)展,發(fā)布了一款視頻言語數(shù)據(jù)集 Youku-mPLUG。

這個(gè)數(shù)據(jù)集的一切內(nèi)容均來自優(yōu)酷,對其間的安全性、多樣性和內(nèi)容質(zhì)量有著非常嚴(yán)厲的標(biāo)準(zhǔn)。據(jù)達(dá)摩院介紹,Youku-mPLUG中包含了45種不同類型的1000萬個(gè)視頻文本,這些視頻文本從4億個(gè)原始視頻中篩選而出,首要用于大規(guī)模預(yù)練習(xí)。

達(dá)摩院表示,Youku-mPLUG可以幫助研制人員在未來進(jìn)行更深入的多模態(tài)研究,開宣布更好的應(yīng)用。

上一條:小鵬轎車請求 XGPT ...

下一條:TikTok Shop跨...