比 ChatGPT 更強(qiáng)大,微軟推出全能型人工智能模型 Kosmos-1 |
發(fā)布時(shí)間:2023-03-05 文章來源:本站 瀏覽次數(shù):2288 |
3 月 4 日音訊,基于 ChatGPT 的必應(yīng)聊天曾經(jīng)讓不少用戶感遭到了 AI 的強(qiáng)大,而微軟于近日推出了更為強(qiáng)悍的全能型 AI--Kosmos-1。ChatGPT 是純文本 LLM,而它是更強(qiáng)大的多形式大型言語模型(MLLM)。
Kosmos-1 能夠剖析圖像的內(nèi)容、處理視覺難題、執(zhí)行視覺文本辨認(rèn)、經(jīng)過視覺智商測(cè)試以及了解自然言語指令等等。 IT之家從報(bào)道中得悉,Kosmos-1 能夠處置文本、音頻、圖像和視頻等內(nèi)容,構(gòu)建一個(gè)全能型的人工智能,能夠像人類思想一樣來處置任務(wù)。 研討人員在他們的學(xué)術(shù)論文中寫道:“作為智能的根本組成局部,多模態(tài)感知是完成人工智能的必要條件”。Kosmos-1 論文中的視覺示例顯現(xiàn)模型剖析圖像并答復(fù)有關(guān)圖像的問題,從圖像中讀取文本,為圖像編寫標(biāo)題,并以 22-26% 的精確度停止視覺智商測(cè)試。 微軟表示,它方案向開發(fā)人員提供 Kosmos-1,雖然該論文援用的 GitHub 頁面在本文發(fā)表時(shí)沒有明顯的 Kosmos 特定代碼。 |
|