知識科普類直播借助AI數(shù)字人也迎來了新突破。在教育領(lǐng)域,不同學(xué)科的數(shù)字人教師能夠針對學(xué)生的個性化學(xué)習(xí)需求開展直播課程。比如,在數(shù)理化等理科學(xué)習(xí)中,數(shù)字人教師可以利用虛擬實驗工具,在直播時現(xiàn)場演示復(fù)雜的化學(xué)實驗、物理原理驗證實驗,學(xué)生們即便在家中,也能通過高清屏幕看到如同身處實驗室般清晰的實驗步驟與現(xiàn)象,遇到不懂的地方,隨時在彈幕提問,數(shù)字人教師會迅速給予準(zhǔn)確解答,依據(jù)學(xué)生的提問頻率與類型,實時調(diào)整講解重點,強化難點知識的闡釋。在人文社科領(lǐng)域,針對歷史文化主題直播,數(shù)字人教師身著古裝,身處虛擬的歷史場景,如古代宮殿、戰(zhàn)場遺址等,生動講述歷史故事、文化傳承脈絡(luò),讓知識學(xué)習(xí)變得生動有趣。這種隨時隨地、個性化的知識科普直播,讓學(xué)習(xí)不再局限于課堂,為知識傳播開辟了更廣闊的路徑。文旅 AI 數(shù)字人講古跡故事,讓文化遺產(chǎn) “開口” 說話。北京文旅AI數(shù)字人
AI數(shù)字人,即具有數(shù)字化外形的AI數(shù)字人物。AI數(shù)字人宜具備以下三方面特征:一是擁有人的外觀,具有特定的相貌、性別和性格等人物特征;二是擁有人的行為,具有用語言、面部表情和肢體動作表達的能力;三是擁有人的思想,具有識別外界環(huán)境、并能與人交流互動的能力。當(dāng)前,AI數(shù)字人仍處于快速發(fā)展時期,尚未形成統(tǒng)一的系統(tǒng)框架。我們引用了人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟的框架,將AI數(shù)字人的通用系統(tǒng)分為五個部分:人物形象,語音生成,動畫制作,音視頻,合成顯示器和交互。交互模塊是擴展項目,可以智能識別用戶意圖,決定其后續(xù)語音和動作并驅(qū)動數(shù)字人的下一輪互動。根據(jù)是否有交互模塊分為非互動AI數(shù)字人和交互式AI數(shù)字人,后者將基于驅(qū)動方式的不同分為真人驅(qū)動和計算驅(qū)動。非交互AI數(shù)字人相對簡單,運行過程較早。目前有更多的制造商部署它們。但是,未來的發(fā)展趨勢總體上仍將著重于交互式AI數(shù)字人。金融AI數(shù)字人開發(fā)在大型商超,AI 數(shù)字人線上導(dǎo)購,為顧客提供便捷購物指引。
AI數(shù)字人的技術(shù)實現(xiàn)涉及到多個領(lǐng)域和技術(shù),包括計算機圖形學(xué)、計算機視覺、語音識別、自然語言處理、機器學(xué)習(xí)等。以下是一些關(guān)鍵技術(shù)的介紹:計算機圖形學(xué):計算機圖形學(xué)是創(chuàng)建AI數(shù)字人的主要技術(shù)之一。它可以通過建模、紋理映射、光照計算等技術(shù),創(chuàng)建出逼真的虛擬人物形象。同時,計算機圖形學(xué)還涉及到動畫技術(shù)和物理引擎等技術(shù),可以讓虛擬人物的動作更加自然流暢。計算機視覺:計算機視覺是實現(xiàn)AI數(shù)字人智能化交互的關(guān)鍵技術(shù)之一。它可以通過圖像處理、特征提取、目標(biāo)檢測等技術(shù),實現(xiàn)人臉識別、手勢識別等功能,讓虛擬人物能夠識別和理解人類的動作和表情。
AI數(shù)字人主播的另一大優(yōu)勢在于易于批量復(fù)制與快速推廣,尤其適用于連鎖企業(yè)、大型集團開展規(guī)?;辈I銷活動。一家擁有上百家門店的餐飲連鎖企業(yè),想要在全國范圍內(nèi)同時進行新品推廣直播,若依靠傳統(tǒng)主播,很難在同一時間找到如此多形象、風(fēng)格、專業(yè)素養(yǎng)都適配的人員,且培訓(xùn)成本極高;而利用AI數(shù)字人技術(shù),企業(yè)可以依據(jù)品牌統(tǒng)一標(biāo)準(zhǔn),快速定制出上百個數(shù)字人主播,它們身著相同的品牌工作服,帶著親切統(tǒng)一的笑容,同時在各地門店的線上直播間開播。無論是介紹新品菜品特色、優(yōu)惠活動,還是解答當(dāng)?shù)叵M者關(guān)于菜品口味、食材來源的疑問,都能做到標(biāo)準(zhǔn)化、規(guī)范化,確保品牌形象與信息傳遞的一致性。這種批量復(fù)制推廣能力打破了地域與人力限制,讓大規(guī)模、高頻次的直播營銷成為現(xiàn)實,助力企業(yè)在短時間內(nèi)實現(xiàn)品牌聲量與市場銷量的雙重爆發(fā)式增長。AI數(shù)字人系統(tǒng)推動跨文化交流,打破語言文化壁壘。
AI數(shù)字人有何優(yōu)勢?AI數(shù)字人是基于人類的數(shù)字存在,它沒有晝夜之分,不受時間和地理位置限制,可以出現(xiàn)在任何需要它的場景中出現(xiàn),比如企業(yè)的品牌推介會、產(chǎn)品發(fā)布會、展廳、客服接待等等場合,提供24小時在線服務(wù)。雖是虛擬的,但AI數(shù)字人的存在性、社會性和影響力不輸于現(xiàn)實的人,其人設(shè)可塑性強、行為可控且自帶科技感加持,更容易運維和掌控,不會擔(dān)心藝人塌方、解約等造成的負面影響及經(jīng)濟損失。隨著AI技術(shù)和沉浸式技術(shù)的加持,具有良好形象的AI數(shù)字人可以更加智能、人性化地與人互動、交流,感受人的情緒、語言和行動,在虛擬陪伴、心理療養(yǎng)等領(lǐng)域發(fā)揮價值。AI數(shù)字人的應(yīng)用落地給經(jīng)濟發(fā)展帶來重大發(fā)展機遇,企業(yè)也可以擁有專屬的虛擬數(shù)字IP,搶注元宇宙市場。醫(yī)療 AI 數(shù)字人輔助診斷,分析影像數(shù)據(jù),縮短確診時間。北京醫(yī)療AI數(shù)字人報價
社交媒體上,用戶借助 AI 數(shù)字人創(chuàng)作趣味換臉內(nèi)容,增強互動與粉絲黏性。北京文旅AI數(shù)字人
AI數(shù)字人流程制作:(1)明確需求用途和虛擬形象類型:因此在開始虛擬形象設(shè)計之前,首先要明確AI數(shù)字人的形象類型以及品牌用途、使用場景,并結(jié)合品牌調(diào)性以及目標(biāo)客戶群體進行創(chuàng)作是重要基礎(chǔ)。(2)建模設(shè)計、綁定和真人表演捕捉:利用全身的慣性動捕設(shè)備、光學(xué)動捕系統(tǒng),以及面部捕捉系統(tǒng),完成全身的動作捕捉,經(jīng)過角色設(shè)計、角色建模貼圖、角色綁定,實現(xiàn)身體、表情、手勢的實時變化,提升互動感和真實感。(3)實時驅(qū)動渲染和內(nèi)容輸出:借助內(nèi)容制作工具和資源庫,對場景進行實時渲染,構(gòu)建人物和場景實時互動的畫面;之后將復(fù)活的實時數(shù)字人接入實時渲染引擎,為元宇宙模擬現(xiàn)實世界的互動。北京文旅AI數(shù)字人