頂流AI大模型集結海淀——海淀融媒記者打卡2024智源大會展區(qū) |
|||
來源: 海淀報 發(fā)布時間: 2024年06月17日 | |||
在人工智能漫長的征程中,大模型的出現(xiàn)無疑是一座閃耀的里程碑,。6月14日上午,,2024北京智源大會在中關村國家自主創(chuàng)新示范區(qū)展示中心開幕,。大會現(xiàn)場,,具身智能機器人Galbot和國內(nèi)主流大模型展覽區(qū)備受關注,。 Galbot“身手不凡” “Galbot幫我拿一盒奧利奧”“Galbot我想要一瓶水”…… 在展覽區(qū),,記者看到銀河通用首代具身智能機器人Galbot正忙著為嘉賓“送吃送喝”,。收到指令后,,Galbot自主導航到貨架,,通過“視覺”鎖定貨架上的目標,用右手的吸盤準確抓取商品并放置到指定位置,,整套動作一氣呵成,。 另一邊,Galbot正在進行家居收納展示,。桌子上擺放著橙子,、香蕉,可樂,、口紅,、玩具等物品,在收到指令后,,Galbot會根據(jù)物品的不同形狀,、材質(zhì),自主判斷抓取角度,,抓取物品后自動收納到指定位置,。 Galbot采用了由北京智源研究院和銀河通用共同研發(fā)的Galbot的大腦大模型,通過大小腦配合,,大腦層進行通用指令理解和場景感知,,完成規(guī)劃后調(diào)用小腦能力驅(qū)動身體完成取貨、放置,、收納等任務,。 “我們帶來了三臺機器人,一臺在現(xiàn)場進行展示,,另外兩臺機器人分別演示在日常生活場景中拿取收納物品和在商業(yè)環(huán)境下幫助人完成從接單到找食品,,抓食品,送食品等一系列流程的演示,?!爆F(xiàn)場工作人員告訴記者,,“在日復一日大數(shù)據(jù)加持的交互學習中,具身大模型機器人訓練出決策的‘大腦’和執(zhí)行的‘小腦’,,指揮日漸靈巧的‘手’,,能夠獨立完成越來越多的工作。在未來,,Galbot將走進商超,、零售、工業(yè),、物流,、社區(qū)家庭等場景落地應用?!?/span> 大模型眼中的海淀 AI大模型眼中的海淀是什么樣的,?帶著這個問題,記者來到了國內(nèi)主流大模型展覽區(qū),。 “在我眼中,,海淀區(qū)是北京市的一個重要區(qū)域,它不僅具有豐富的歷史文化底蘊,,還是科技創(chuàng)新和人才聚集的高地……”智譜AI大模型回答記者,。 智譜AI是由清華大學計算機系技術成果轉(zhuǎn)化而來的公司,致力于打造新一代認知智能通用模型,。公司合作研發(fā)了雙語千億級超大規(guī)模預訓練模型GLM-130B,,并構建了高精度通用知識圖譜,形成數(shù)據(jù)與知識雙輪驅(qū)動的認知引擎,,基于此模型打造了ChatGLM,。 同樣的問題,百度文心一言大模型帶來了更加詳盡的回答:“首先,,海淀是科技創(chuàng)新的搖籃,。其次,海淀是教育資源的聚集地,。此外,,海淀還是文化的繁榮之地。最后,,海淀還是一個宜居的城區(qū)……綜上所述,,海淀在我眼中是一個充滿活力和魅力的城區(qū),它不僅在科技創(chuàng)新,、教育資源和文化繁榮方面取得了顯著成就,還為市民提供了宜居的生活環(huán)境,。我相信在未來的發(fā)展中,,海淀將繼續(xù)保持其獨特的魅力和優(yōu)勢,,為北京乃至全國的發(fā)展作出更大貢獻?!?/span> 文心一言是百度全新一代知識增強大語言模型,,文心大模型家族的新成員能夠與人對話互動、回答問題,、協(xié)助創(chuàng)作,,高效便捷地幫助人們獲取信息、知識和靈感,。文心一言從數(shù)萬億數(shù)據(jù)和數(shù)千億知識中融合學習,,得到預訓練大模型,在此基礎上采用有監(jiān)督精調(diào),、人類反饋強化學習,、提示等技術,具備知識增強,、檢索增強和對話增強的技術優(yōu)勢,。 來到快手展區(qū),工作人員向記者介紹了快手“快意”大模型,??煲獯竽P褪怯煽焓肿匝械奈纳拇笳Z言模型,設計有13B,、66B,、175B三種參數(shù)規(guī)模,在每個參數(shù)規(guī)模下包含預訓練模型和對話模型兩個版本,。 在今年智源大會的分論壇上,,快手還為大家?guī)砹耸讉€效果對標Sora且已面向用戶開放的文生視頻大模型“可靈”,已經(jīng)在6月6日正式開放內(nèi)測,。 據(jù)介紹,,“可靈”具備強大的概念組合能力和想象力,通過文字描述生成的視頻符合物理運動規(guī)律,,能夠模擬物理世界的特性,。同時,生成的視頻分辨率高達1080p,,最長可達2分鐘(幀率30fps),,且支持自由的寬高比。 “快手在短視頻技術方面有著多年的深入積累,,公司從2023年開始啟動新的AI戰(zhàn)略,,目前公司已全面布局大模型能力矩陣,涵蓋了包括大語言模型,、視覺生成模型,、音頻大模型,、多模態(tài)大模型等核心技術方向,并基于快手豐富的業(yè)務場景,,將生成式AI與多模態(tài)內(nèi)容理解,、短視頻/直播創(chuàng)作、社交互動,、商業(yè)化AIGC,、創(chuàng)新應用等業(yè)務形態(tài)深度結合?!惫ぷ魅藛T向記者介紹,。 (記者 王萌 文/攝) |
|||
|
|