智能數(shù)字虛擬人帶給生活更多可能——邁吉客科技專注跨模態(tài)人工智能技術(shù)應(yīng)用 |
|||
來源: 海淀報(bào) 發(fā)布時(shí)間: 2023年05月16日 | |||
隨著人工智能技術(shù)的飛速發(fā)展,,生成式AI涌入了我們的日常生活,,比如常見的虛擬數(shù)字人,再比如虛擬偶像初音未來,相信大家并不感到陌生,。生成式人工智能作為一種新型的人工智能技術(shù),,在自然語言處理,、圖像生成,、音頻合成等領(lǐng)域取得了顯著的進(jìn)展,引起了廣泛關(guān)注,。 近日,,記者來到一家聚焦智能數(shù)字資產(chǎn)和智能生成領(lǐng)域的跨模態(tài)人工智能技術(shù)的公司——邁吉客科技,探索數(shù)智虛擬人的企業(yè)是怎樣實(shí)現(xiàn)人機(jī)交互的,。 邁吉客科技創(chuàng)始人伏英娜介紹:“世界范圍內(nèi)的智能生成領(lǐng)域從TransformerGPT開始到Diffusion(擴(kuò)散算法),,在整個(gè)國際市場上開源的創(chuàng)新都非常熱烈,大家也看到了,,現(xiàn)在ChatGPT越來越火,,我國的智能生成技術(shù)情況主要還是在應(yīng)用層面。在跨模態(tài)領(lǐng)域,,我們長期的積累就是AI+CG,,這是個(gè)最難的方向,CG本身就是三維的,,我們還有時(shí)間維度,,實(shí)時(shí)互動(dòng)的多模態(tài)跨模態(tài)的內(nèi)容,以及一對一的,、個(gè)性化的,、千人千面智能互動(dòng)的內(nèi)容,這是邁吉客一直以來聚焦的五維的AIGC,,它既是跨模態(tài)的又是跨維度的,。” “模態(tài)”一詞,,是指生物憑借感知器官與經(jīng)驗(yàn)來接收信息的通道,,如人類有視覺,、聽覺、觸覺,、味覺和嗅覺模態(tài),。而多模態(tài)是指將多種感官進(jìn)行融合,而多模態(tài)交互是指人通過聲音,、肢體語言,、信息載體(文字、圖片,、音頻,、視頻)、環(huán)境等多個(gè)通道與計(jì)算機(jī)進(jìn)行交流,,充分模擬人與人之間的交互方式,。一直以來,邁吉客專注的就是多模態(tài)人機(jī)交互技術(shù),。 伏英娜認(rèn)為OpenAI的ChatGPT是語言智能和數(shù)理邏輯智能,但人類的多元智能不止這兩個(gè)部分,,還有人際關(guān)系智能,、情商、情感等等人類更感性的層面的,,以及身體運(yùn)動(dòng),、身體控制的智能,還有空間感知智能,、音樂韻律的智能等等,,也就是人類的多元智能,這些都是目前AI做不到的,。邁吉客從最初就在考慮如何構(gòu)建多元智能,,企業(yè)級的多元智能,為每家企業(yè)構(gòu)建自己的商業(yè)大腦,。 利用多元智能構(gòu)建商業(yè)大腦,這樣的思路已經(jīng)應(yīng)用在了諸多場景中。目前,,邁吉客的產(chǎn)品線和應(yīng)用場景覆蓋短視頻內(nèi)容生產(chǎn),、智能虛擬直播、智能數(shù)字服務(wù)及數(shù)智營銷等,,已服務(wù)消費(fèi)品牌,、電商零售、媒體政府,、金融和大健康等領(lǐng)域,。 隨著AI逐步落地,,產(chǎn)業(yè)需求不斷深入,技術(shù)進(jìn)一步發(fā)展,,多模態(tài)成為了AI技術(shù)和產(chǎn)業(yè)發(fā)展的新方向,。多模態(tài)人工智能在場景泛化性、對數(shù)據(jù)的依賴性等方面都取得了巨大的技術(shù)突破,。比如,,聊天機(jī)器人或者智能助手上,多模態(tài)技術(shù)將幫助智能機(jī)器人綜合處理圖像,、聲音和文字信息,,同時(shí)可以進(jìn)行綜合模態(tài),甚至包括情感等特征信息的輸出與表達(dá),。邁吉客正是運(yùn)用多模態(tài)技術(shù),,同時(shí)基于三維、實(shí)時(shí)和智能,,來構(gòu)建核心技術(shù),。 “三維、實(shí)時(shí)和智能,,基于這樣三個(gè)關(guān)鍵詞,,我們在構(gòu)建我們的核心技術(shù),對應(yīng)在三維層面是個(gè)WEB3D的,、實(shí)時(shí)渲染的三維引擎,、圖形引擎。在AI層面,,我們構(gòu)建的是多元的,、跨模態(tài)的、高維度的,、AI和CG結(jié)合的智能和算法平臺(tái),,這個(gè)智能算法平臺(tái),我們不是用超大規(guī)模語言模型的方式構(gòu)建的,,而是拆解的智能算法和預(yù)訓(xùn)練的小模型的組合來構(gòu)建的,。”伏英娜表示,。 通過運(yùn)用預(yù)訓(xùn)練小模型和智能算法的組合,,邁吉客提供給企業(yè)彈性的解決方案,滿足不同場景的需要,,同時(shí)基于這兩塊核心技術(shù),,構(gòu)建了企業(yè)的SAAS(軟件運(yùn)營服務(wù))和PAAS(服務(wù)器平臺(tái)服務(wù)),這是邁吉客獨(dú)創(chuàng)的三位一體的核心技術(shù)延展出來的服務(wù),。這項(xiàng)技術(shù)除了應(yīng)用在智能虛擬直播,、智能數(shù)字服務(wù)等方面,,還可以拓展應(yīng)用在更多領(lǐng)域。 比如文旅,、文博,、文創(chuàng)、文娛,,甚至藝術(shù),、教育等等?!拔覀円苍诟鷸|升科技園探索,,如何把技術(shù)用在園區(qū)的數(shù)字化升級里面,我們的技術(shù)積累怎樣持續(xù)的挖掘和產(chǎn)生價(jià)值,,也就是技術(shù)的普適價(jià)值,,怎么能結(jié)合這些千行百業(yè),面向第三代互聯(lián)網(wǎng)的數(shù)字化升級的需要,,來提供解決方案,、提供產(chǎn)品、提供智能軟件服務(wù),?!狈⒛妊a(bǔ)充道。 基于第三代互聯(lián)網(wǎng)的數(shù)字化升級的需要,,邁吉客利用智能虛擬化技術(shù),,通過創(chuàng)造技術(shù)驅(qū)動(dòng),,將現(xiàn)實(shí)智能化的內(nèi)容生產(chǎn),、分發(fā),升級智能數(shù)字形象,,動(dòng)態(tài)視覺化和智能化的展示表達(dá)及實(shí)時(shí)互動(dòng),,同時(shí)探索更多應(yīng)用場景和應(yīng)用領(lǐng)域,助力打造更高維度的數(shù)字化新空間,。 邁吉客科技首席運(yùn)營官梁守星表示:“我們現(xiàn)在看哪些行業(yè)可以使用到我們的整個(gè)服務(wù),,可以為哪些行業(yè)提升一些效率,我們首先會(huì)從數(shù)字人跟AIGC這一方面,,去做深入開拓跟發(fā)展,,希望慢慢呈現(xiàn)出為未來的元宇宙,呈現(xiàn)更多的解決方案,?!?/p> 人工智能的最終目的是讓機(jī)器模擬人類的行為,通過對不同模態(tài)數(shù)據(jù)同時(shí)的融合,,模擬人類可以分析推理復(fù)雜問題的能力,,最終實(shí)現(xiàn)理想化的“人工智能”,。未來,人工智能能夠更加彌合物理世界和數(shù)字領(lǐng)域之間的差距,,讓我們的生活充滿無限可能,。(記者 謝春陽) |
|||
|
|