2024中國(guó)數(shù)字人大會(huì)|嘉賓精彩觀點(diǎn)集萃(二)
2024年09月29日 10:11
9月23日—24日,由中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)主辦的2024首屆中國(guó)數(shù)字人大會(huì)在北京中關(guān)村國(guó)家自主創(chuàng)新示范區(qū)展示交易中心-會(huì)議中心舉辦,大會(huì)主題為“數(shù)字人應(yīng)用與未來(lái)”。北京市海淀區(qū)人民政府為特別支位。
大會(huì)期間舉辦了開(kāi)幕大會(huì)、六場(chǎng)分論壇及一場(chǎng)交流會(huì)。會(huì)上,來(lái)自中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)、中國(guó)信息通信研究院、北京智源研究院、公安部第一研究所、中國(guó)電信人工智能研究院、中國(guó)信通院人工智能研究所、中國(guó)傳媒大學(xué)數(shù)字人研究院、百度、阿里巴巴、騰訊智影、快手、商湯等單位的嘉賓圍繞關(guān)系數(shù)字人發(fā)展的戰(zhàn)略、技術(shù)、應(yīng)用、安全等話題進(jìn)行了深入分享和交流,以凝聚發(fā)展共識(shí)、強(qiáng)化產(chǎn)業(yè)協(xié)同,推進(jìn)中國(guó)數(shù)字人保持全球領(lǐng)先態(tài)勢(shì)。約2000余人次參加大會(huì)。
快手萬(wàn)鵬飛
快手視覺(jué)生成與互動(dòng)中心負(fù)責(zé)人萬(wàn)鵬飛在開(kāi)幕大會(huì)作主旨演講《多模態(tài)數(shù)字人的技術(shù)創(chuàng)新與產(chǎn)業(yè)應(yīng)用》。他表示,經(jīng)過(guò)多年的技術(shù)研發(fā),快手基于自研數(shù)字人采集建模、綁定、動(dòng)捕驅(qū)動(dòng)、大模型生成互動(dòng)、交互渲染等技術(shù),全面打造多模態(tài)數(shù)字人解決方案,可應(yīng)用于商業(yè)化、本地生活、電商、招聘等多元場(chǎng)景。
以快手官方虛擬主播“關(guān)小芳”為例,作為身份型數(shù)字人的典型應(yīng)用,其打通了ASR、VLM、LLM等多個(gè)自研大模型能力,具備多模態(tài)感知、決策、生成能力,互動(dòng)延時(shí)低于2秒且支持用戶打斷。卓越的性能表現(xiàn)和極低的推理時(shí)延使其廣泛應(yīng)用于快手財(cái)報(bào)解讀等多種場(chǎng)景,并在快手平臺(tái)吸引了超200萬(wàn)粉絲的關(guān)注。針對(duì)服務(wù)型數(shù)字人,快手打造了“快手智播”生成式數(shù)字人平臺(tái),支持超1000種數(shù)字人形象,用戶只需提供3分鐘視頻素材,即可完成個(gè)性化數(shù)字人的生成。
聯(lián)想武亞強(qiáng)
聯(lián)想集團(tuán)高級(jí)總監(jiān),聯(lián)想研究院主任研究員,數(shù)字人總經(jīng)理武亞強(qiáng)作主旨演講《數(shù)字化伙伴:生成式技術(shù)開(kāi)拓?cái)?shù)字人新紀(jì)元》。他強(qiáng)調(diào),近幾年生成式的人工智能對(duì)于各行各業(yè)都是個(gè)巨大變化,在數(shù)字人方面,生成式技術(shù)讓數(shù)字人不僅僅停留在形象階段,而是同時(shí)在美麗的皮囊和智慧的靈魂兩個(gè)維度都讓數(shù)字人技術(shù)再次進(jìn)行升級(jí)。具體來(lái)說(shuō),表現(xiàn)在以下幾個(gè)方面:首先,生成式技術(shù)顯著提高了數(shù)字人模型的制作效率。其次,生成式技術(shù)讓每個(gè)人都能擁有獨(dú)特的數(shù)字人。最后,大模型智能體拓展了數(shù)字人的能力和應(yīng)用范圍,聯(lián)想基于豐富且專業(yè)的設(shè)備相關(guān)經(jīng)驗(yàn),通過(guò)將復(fù)雜的生成算法進(jìn)行端側(cè)化部署,實(shí)現(xiàn)了數(shù)字人+智能體在設(shè)備上運(yùn)行,極大的降低數(shù)字人方案的成本,讓其有更廣泛的實(shí)用價(jià)值。隨著大模型和智能體的加入,數(shù)字人技術(shù)實(shí)現(xiàn)了從形象到人的蛻變,這一進(jìn)程不僅是技術(shù)革新的標(biāo)志,更是價(jià)值創(chuàng)造的開(kāi)始,智能體的整合不僅使數(shù)字人變得更加智能化,而且極大增強(qiáng)了其在各種復(fù)雜場(chǎng)景下的實(shí)用性和適應(yīng)性。未來(lái),隨著智能體技術(shù)的不斷進(jìn)化和優(yōu)化,數(shù)字人將能夠在更多的行業(yè)和領(lǐng)域內(nèi)承擔(dān)重要角色。
聯(lián)通在線曾超
聯(lián)通在線廣州公司市場(chǎng)部總經(jīng)理曾超出席AIGC數(shù)字人技術(shù)創(chuàng)新論壇,并作題為《聯(lián)通數(shù)字人全棧產(chǎn)品及全場(chǎng)景應(yīng)用》的主題演講。
曾超將數(shù)字人的發(fā)展總結(jié)為六大趨勢(shì):數(shù)字人會(huì)更加逼真;更智能化、個(gè)性化;在to B、to C各行業(yè)中都將得到廣泛應(yīng)用;大模型帶來(lái)的多模態(tài)交互會(huì)給數(shù)字人進(jìn)行充分賦能;數(shù)字人將與各領(lǐng)行業(yè)域融合發(fā)展。他表示,數(shù)字人正往“功能型、實(shí)用型、服務(wù)型”發(fā)展,市場(chǎng)應(yīng)用潛力巨大,全真及虛擬數(shù)字人均進(jìn)入大規(guī)模應(yīng)用期,更多行業(yè)需求與應(yīng)用場(chǎng)景被挖掘。
作為數(shù)字技術(shù)融合創(chuàng)新排頭兵,聯(lián)通在線以文化為內(nèi)核、以AI為驅(qū)動(dòng),打造“AI+人貨場(chǎng)”的數(shù)字文化消費(fèi)新場(chǎng)景和“AI+云網(wǎng)端”的文化數(shù)字化新產(chǎn)業(yè),夯實(shí)“1234”數(shù)字文化平臺(tái)架構(gòu),構(gòu)建2B2C2I協(xié)調(diào)發(fā)展體系,奮力打造科技型數(shù)字文化公司。
中國(guó)移動(dòng)研究院吳娜
中國(guó)移動(dòng)研究院主任研究員、人工智能與智慧運(yùn)營(yíng)中心行業(yè)總監(jiān)吳娜在開(kāi)幕大會(huì)作題為《九天筑基 體系化賦能數(shù)字人產(chǎn)業(yè)應(yīng)用》的主旨演講。吳娜詳細(xì)闡述了面向通用人工智能時(shí)代,中國(guó)移動(dòng)錨定供給者、匯聚者、運(yùn)營(yíng)者新定位開(kāi)展的戰(zhàn)略布局和創(chuàng)新實(shí)踐。作為供給者,一是提供基礎(chǔ)設(shè)施,建設(shè)投產(chǎn)多個(gè)超萬(wàn)卡規(guī)模的智算中心,北京在內(nèi)的12個(gè)區(qū)域智算中心。二是提供數(shù)據(jù)服務(wù)。打造梧桐大數(shù)據(jù)平臺(tái),建成數(shù)據(jù)要素流通基礎(chǔ)設(shè)施數(shù)聯(lián)網(wǎng)(DSSN),促進(jìn)數(shù)據(jù)高效安全供給、流通、利用。三是提供模型。九天全模態(tài)大模型包含語(yǔ)言大模型、視覺(jué)大模型、語(yǔ)音大模型、結(jié)構(gòu)化數(shù)據(jù)大模型、多模態(tài)大模型等,模型參數(shù)已從百億級(jí)提升到千億級(jí)以上。與其他大模型相比,九天大模型具備復(fù)雜系統(tǒng)智能化、全模態(tài)多信源、聚焦行業(yè)、安全可信可控四個(gè)特點(diǎn),同時(shí)深耕40款行業(yè)大模型,創(chuàng)新AI智能體、AI+DICT一體化服務(wù),為數(shù)字人產(chǎn)業(yè)發(fā)展提供筑基賦能。作為運(yùn)營(yíng)者,中國(guó)移動(dòng)圍繞運(yùn)營(yíng)服務(wù)、新型生產(chǎn)、新型創(chuàng)造等,打造了“靈犀”伴隨式助理、九天·九九個(gè)人智能體、九天·善學(xué)合作者智能體等多樣化形態(tài)的數(shù)字人應(yīng)用,為個(gè)人客戶、家庭用戶提供全新的服務(wù)體驗(yàn),為行業(yè)新質(zhì)生產(chǎn)力的提升注入了強(qiáng)勁動(dòng)力,推動(dòng)數(shù)字經(jīng)濟(jì)與實(shí)體經(jīng)濟(jì)的深入融合。
中國(guó)電信人工智能研究院賈曉博
中國(guó)電信人工智能研究院AI研發(fā)總監(jiān)賈曉博在“AI數(shù)字人應(yīng)用推進(jìn)主論壇”作了題為《基于中國(guó)電信大模型的下一代人機(jī)交互探索》的主題演講。他認(rèn)為,“數(shù)字人是人機(jī)交互系統(tǒng)、空間計(jì)算等場(chǎng)景的重要入口,只有實(shí)時(shí)自然交互的數(shù)字人,才具有大規(guī)模推廣的市場(chǎng)價(jià)值,新一代數(shù)字人交互范式亟需在多模態(tài)大模型與端云協(xié)同渲染引擎等技術(shù)融合下發(fā)展?!敝袊?guó)電信四川公司聯(lián)合中國(guó)電信人工智能研究院(TeleAI),首次推出文旅產(chǎn)業(yè)創(chuàng)新產(chǎn)品“TeleTrip - 星辰文旅”,以阿壩州為試點(diǎn),創(chuàng)建3D智能數(shù)字熊貓“蘇琳”。其基于大語(yǔ)言模型,融合實(shí)時(shí)渲染與三維重建、多模態(tài)AI智能體等多項(xiàng)前沿技術(shù),通過(guò)查閱出生于1936年阿壩汶川國(guó)際大熊貓譜系編號(hào)001的熊貓“蘇琳”為原型的真實(shí)圖片和影像數(shù)據(jù),以超高精度三維重建與實(shí)時(shí)渲染技術(shù),實(shí)現(xiàn)動(dòng)、靜態(tài)高逼真交互,依托自研大模型的自然語(yǔ)言處理和多模態(tài)理解能力,實(shí)現(xiàn)豐富的多模態(tài)交互,同時(shí)學(xué)習(xí)阿壩海量歷史文化、風(fēng)土人情等知識(shí)庫(kù),讓“蘇琳”成為知識(shí)淵博得智能導(dǎo)游,能為游客提供更加豐富深入的旅游體驗(yàn)。針對(duì)實(shí)時(shí)分析難、交互不流暢、真實(shí)感實(shí)時(shí)渲染難等關(guān)鍵挑戰(zhàn),該團(tuán)隊(duì)通過(guò)先進(jìn)的數(shù)據(jù)存儲(chǔ)策略和智能路由查詢引擎,大幅提升了檢索效率,并有效降低推理成本,保證了毫秒級(jí)交互。中國(guó)電信希望以阿壩州為示范,推動(dòng)文旅產(chǎn)業(yè)數(shù)字化、智能化創(chuàng)新,引領(lǐng)文化旅游產(chǎn)業(yè)的全新風(fēng)向標(biāo)。
智譜華章杜冀中
智譜華章數(shù)字人團(tuán)隊(duì)負(fù)責(zé)人杜冀中在“AIGC數(shù)字人技術(shù)創(chuàng)新論壇”上圍繞AIGC數(shù)字人技術(shù)作交流分享。杜冀中分享了智譜數(shù)字人的廣泛應(yīng)用場(chǎng)景和成果案例,如英特爾數(shù)字人展廳、基于清言智能體的AI老羅等。
杜冀中展示了為央視頻打造的AI虛擬主持人——AI馬凡舒,這一案例也成功入選了《中國(guó)數(shù)字人發(fā)展報(bào)告(2024)》典型案例集。AI馬凡舒是智譜采用2.5D真人形象復(fù)刻技術(shù)及超高清圖像采集處理技術(shù),打造的高仿真、可控虛擬數(shù)字人。其獨(dú)特之處在于解決了口型匹配難題,通過(guò)深度學(xué)習(xí)匹配音頻信號(hào),生成自然口型動(dòng)畫(huà),讓數(shù)字人發(fā)聲栩栩如生。相較于真人驅(qū)動(dòng),該技術(shù)成本低、仿真度高、可控性強(qiáng),能按需生成視頻,激發(fā)創(chuàng)作者無(wú)限創(chuàng)意,呈現(xiàn)豐富多元的視聽(tīng)效果。
泰爾英福曾西平
泰爾英福常務(wù)副總經(jīng)理曾西平在“面向人工智能的數(shù)字身份體系研究論壇”作了題為《ID for AI:面向人工智能的自主可控?cái)?shù)字身份》的主題演講。
曾西平表示,國(guó)際社會(huì)層面正在積極探索內(nèi)容標(biāo)識(shí)方法和路徑,并制定相應(yīng)的法規(guī)、標(biāo)準(zhǔn)與政策,以確保AI技術(shù)的健康發(fā)展與安全應(yīng)用。AI標(biāo)識(shí)將成為AIGC治理的重要抓手。AI標(biāo)識(shí)是對(duì)AI模型、訓(xùn)練數(shù)據(jù)、提示詞和生成內(nèi)容等賦予唯一的編碼,對(duì)其身份和來(lái)源進(jìn)行標(biāo)注、解析、識(shí)別和追溯,實(shí)現(xiàn)對(duì)人工智能生成內(nèi)容的追蹤溯源和版權(quán)保護(hù)。AI標(biāo)識(shí)從技術(shù)層面激發(fā)AIGC產(chǎn)業(yè)的活力,進(jìn)而推動(dòng)整個(gè)AIGC產(chǎn)業(yè)的健康有序發(fā)展。
魔琺科技杜子航
魔琺科技AIGC業(yè)務(wù)負(fù)責(zé)人杜子航在“AIGC數(shù)字人技術(shù)創(chuàng)新論壇”向參會(huì)領(lǐng)導(dǎo)和嘉賓展示了魔琺科技的自研的3D數(shù)字人技術(shù)產(chǎn)品,對(duì)傳統(tǒng)3D內(nèi)容制作成本、門檻和效率的革命性改進(jìn)。魔琺有言作為文生3D視頻的產(chǎn)品,用戶僅需三步,輸入文本,選擇3D場(chǎng)景,選擇3D數(shù)字人,即可一鍵生成企業(yè)級(jí)的高質(zhì)量視頻。"魔琺有言"內(nèi)置了數(shù)千個(gè)高質(zhì)量的3D數(shù)字人形象,用戶可以自由定制妝容、發(fā)型和服裝,以及個(gè)性化捏臉。同時(shí)憑借魔琺自研的“文生動(dòng)作大模型”、AI運(yùn)鏡及3D場(chǎng)景,靈活適配企業(yè)和個(gè)人的上百種視頻應(yīng)用場(chǎng)景,如發(fā)布會(huì)、社媒運(yùn)營(yíng)、產(chǎn)品種草、欄目采訪、企業(yè)培訓(xùn)等,真正為企業(yè)和個(gè)人實(shí)現(xiàn)了低門檻、高效率、批量化地制作專業(yè)級(jí)視頻的需求。同時(shí)還分享了中金財(cái)富、東吳證券、海爾智家等眾多行業(yè)頭部企業(yè)的應(yīng)用落地案例。
成都明途肖雪松
成都明途科技有限公司創(chuàng)始人、董事長(zhǎng)肖雪松在“AI數(shù)字人應(yīng)用推進(jìn)主論壇”作了題為《智能體推進(jìn)產(chǎn)業(yè)轉(zhuǎn)型升級(jí)》的分享。他表示,人工智能的發(fā)展如火如荼,基于強(qiáng)化學(xué)習(xí)的智能體模型,是AI技術(shù)深度應(yīng)用到各種場(chǎng)景的關(guān)鍵方向。我們將WorkBrain模型能力劃分為自然語(yǔ)言對(duì)話、智能代理和具身智能三大領(lǐng)域,在崗位角色控制、私有數(shù)據(jù)保護(hù)、任務(wù)自動(dòng)執(zhí)行、群體協(xié)同創(chuàng)新等方面有獨(dú)特等優(yōu)勢(shì)。同時(shí),突破了傳統(tǒng)的“一人一智能助理“模式,提出了“私域數(shù)字人群“的創(chuàng)新理念,組織可以根據(jù)業(yè)務(wù)需要,打造數(shù)字人服務(wù)矩陣。在企業(yè)領(lǐng)域,實(shí)現(xiàn)智能生產(chǎn)、智慧營(yíng)銷,在政務(wù)領(lǐng)域,助力智慧決策、提升公共服務(wù)質(zhì)效,在教育領(lǐng)域,創(chuàng)新教學(xué)模式,助力產(chǎn)教融合應(yīng)用,在健康領(lǐng)域,輔助問(wèn)詢、就醫(yī)、康復(fù)、養(yǎng)生等服務(wù),在文旅領(lǐng)域,助力產(chǎn)業(yè)經(jīng)濟(jì)發(fā)展。
中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)將依托“中國(guó)數(shù)字人大會(huì)”平臺(tái),以“中國(guó)數(shù)字人領(lǐng)航計(jì)劃”為紐帶,打造全年常態(tài)化活動(dòng)機(jī)制,在催化技術(shù)創(chuàng)新、助推應(yīng)用落地、研制標(biāo)準(zhǔn)規(guī)范、夯實(shí)安全保障、做好人才支撐等方面開(kāi)展工作,助力數(shù)字人產(chǎn)業(yè)健康發(fā)展。
【中國(guó)數(shù)字人領(lǐng)航計(jì)劃工作聯(lián)系人】
宋老師(協(xié)會(huì)創(chuàng)新發(fā)展與人才工作部)
19910088887 010-57234929-1062
李老師(協(xié)會(huì)創(chuàng)新發(fā)展與人才工作部)
13919461691 010-57234929-1055