清華系新創公司發布全球首個4D骨骼動畫框架,實現一鍵將實景轉化為動畫,並且能夠產生個人化角色
蘋果最近宣布將於2月2日推出首款虛擬頭顯設備Vision Pro,預計這款XR設備將引領下一代終端的快速發展。隨著虛擬顯示設備的普及,數位互動將從平面走向立體,立體模型和立體動畫將成為未來主流的內容形式。多維沉浸式互動在虛實融合的趨勢下也將成為潮流。
但從資料規模來看,現階段內容產業的資料累積仍以 2D 影像、平面視訊為主,3D 模型、4D 動畫等資料基礎較為薄弱。其中,4D 動畫是在傳統3D 模型的基礎上引入時間序列,即隨時間變化的3D 模型,可以呈現出動態立體效果,在遊戲動畫、電影特效、虛擬實境等領域具有廣泛的應用,但也是目前內容生態開發中最困難的環節。
因此,面對即將到來的多維沉浸式體驗,建構建構體化的數位內容將成為重要的基礎工作。
面向此前沿領域,清華系創業團隊生數科技進行了系列研究和產品研發,於近期聯合清華大學、同濟大學等高校推出全球首個基於「骨骼動畫」的4D動畫生成框架「AnimatableDreamer」,能夠直接將2D 影片素材一鍵轉成動態立體模型(即4D 動畫),支援自動提取骨骼動作、一鍵轉換動畫效果並可透過文字輸入進行個人化角色生成。
論文網址:https://arxiv.org/pdf/2312.03795.pdf
項目網址:https://animatabledreamer.github.io/
論文標題:AnimatableDreamer: Text-Guided Non-rigid 3D Model Generation and Reconstruction with Canonical Score Distillation

全新內容生產方式
#顛覆立體動畫開發流程
過往業界製作立體動畫,需要經過3D 建模、貼圖渲染、骨骼綁定、動畫製作等複雜流程,需要建模師、動畫師等專業人員參與才能完成,效率低、成本高。根據統計,單一靜態 3D 模型建模的生產週期就在數小時到幾天時間,成本可高達上千美元,再進行動態化處理成本投入將更高。
從官方發布的demo 視頻可以看到,上傳一段松鼠的2D 實景視頻,通過輸入“A squirrel with red sweater”(穿紅色毛衣的松鼠)的文本描述,原本實景的松鼠一鍵轉換成動畫風格,而且完美保留了動作姿勢,同步還可產生360 度視角下的立體動態模型,透過切換文字描述,可以自訂角色,將松鼠任意切換為狐狸、傑尼龜等不同的卡通形象。
「AnimatableDreamer」可自動擷取影片中目標物件(人物、動物等)的骨骼動作,再透過文字描述將該物件轉換為任意的帶骨動畫模型。整個過程不受模版限制,支援任意視訊長度和任意類型動作,具備高度的時間一致性和多視角一致性,並且導出的動態立體模型,能夠在任意 3D 環境中進行渲染。
面向影視動漫等領域的後製,通常需要針對動畫做更多編輯,“AnimatableDreamer”也支持針對已經完成骨骼綁定的模型進行更換或編輯動畫文件,實現更高的自由度。未來相關技術逐漸落地後,遊戲開發、影視動畫等場景的 3D 建模、動畫製作流程,有望變得更有效率。
面向未來
有望形成全新的內容生態
在實現原則上,研究團隊創新地提出了規格得分蒸餾策略(Canonical Score Distillation,簡稱CSD),在隨時間變化的相機空間中對不同幀及不同視角的3D 模型進行渲染及降噪,並統一將梯度回傳至不同相機空間共享的規格空間中進行蒸餾,將4D 生成降維至3D,即將4D 生成問題簡化為3D 空間上的生成。
「AnimatableDreamer」能直接從影片中提取關節動作,透過解耦物體的模型與運動,生成的模型具備高度的時間一致性和幾何合理性,不受視頻長度限制,而且能有效地消除如形狀斷裂、閃爍和多視角不一致等問題。
在有限視角和大幅度運動的場景中,由於引入了Diffusion 模型的先驗知識,即便輸入的視頻未覆蓋完整物體,“AnimatableDreamer”也能自動補全畫面信息,實現較好的生成質量。
可以說,「AnimatableDreamer」的提出直接打通文字到4D 骨骼動畫的生成,建模、貼圖、骨骼綁定、動作驅動一氣呵成!輸入自然語言描述,自動輸出立體動畫視頻,無需專業知識,普通人也能直接上手,輕鬆自訂動畫內容。
以「AnimatableDreamer」為基礎的工作將大大降低3D、4D 數位內容的生產難度,將互動體驗豐富化,讓每個人都能進行創意內容的生成和編輯,將催生出3D 時代下全新的內容娛樂與內容消費模式。
暢想一下,在未來的虛擬世界中,使用者可以快速建立自訂的數位空間,打造個人化的互動體驗。例如:
數字空間下的每個人物可以任意個人化的生成,例如給小朋友穿上超人的衣服、萬聖節隨意切換節日主題服裝等;
養寵物的使用者可以將自家寵物卡通化,例如將其產生虛擬的米老鼠形象。寵物日常就如卡通片一樣,主人跟寵物的日常互動將變得趣味橫生;
人與人的互動方式也變得更豐富,隨時隨地可以來上一場主題派對,即時產生想要的派對環境、人物裝扮等等。
作為一家成立不到一年的新創公司,生數科技團隊長期致力於圖像、3D、視訊等多模態大模型領域,在9 月發布了3D 資產創建工具VoxCraft,在Discord 正式上線,支援文圖引導、分鐘級創建3D 模型、3D 貼圖自訂更換等功能,賦能遊戲開發、影視動畫等場景的3D 建模流程。此次推出的 4D 骨骼動畫生成是生數科技的另一項全新探索工作,未來將在 VoxCraft 的產品中進行整合。
VoxCraft 工具地址:https://voxcraft.ai/
蘋果Vision Pro 的來臨不僅是硬體設備層面的重要革新,同時也將開啟一場內容和體驗革命的序幕。 4D 動畫生成等生成式 AI 的創新能力,除了帶來更好的視覺呈現,還將以全新方式開啟多維數位體驗,為下一代人機互動帶來更多可能。
以上是清華系新創公司發布全球首個4D骨骼動畫框架,實現一鍵將實景轉化為動畫,並且能夠產生個人化角色的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

但可能打不過公園裡的老大爺?巴黎奧運正在如火如荼地進行中,乒乓球項目備受關注。同時,機器人打乒乓球也取得了新突破。剛剛,DeepMind提出了第一個在競技乒乓球比賽中達到人類業餘選手等級的學習型機器人智能體。論文地址:https://arxiv.org/pdf/2408.03906DeepMind這個機器人打乒乓球什麼程度呢?大概和人類業餘選手不相上下:正手反手都會:對手採用多種打法,機器人也能招架得住:接不同旋轉的發球:不過,比賽激烈程度似乎不如公園老大爺對戰。對機器人來說,乒乓球運動

8月21日,2024世界機器人大會在北京隆重召開。商湯科技旗下家用機器人品牌「元蘿蔔SenseRobot」家族全系產品集體亮相,並最新發布元蘿蔔AI下棋機器人-國際象棋專業版(以下簡稱「元蘿蔔國象機器人」),成為全球首個走進家庭的西洋棋機器人。作為元蘿蔔的第三款下棋機器人產品,全新的國象機器人在AI和工程機械方面進行了大量專項技術升級和創新,首次在家用機器人上實現了透過機械爪拾取立體棋子,並進行人機對弈、人人對弈、記譜複盤等功能,

開學將至,該收心的不只即將開啟新學期的同學,可能還有AI大模型。前段時間,Reddit擠滿了吐槽Claude越來越懶的網友。 「它的水平下降了很多,經常停頓,甚至輸出也變得很短。在發布的第一周,它可以一次性翻譯整整4頁文稿,現在連半頁都輸出不了!」https:// www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/在一個名為“對Claude徹底失望了的帖子裡”,滿滿地

在北京舉行的世界機器人大會上,人形機器人的展示成為了現場絕對的焦點,在星塵智能的展台上,由於AI機器人助理S1在一個展區上演揚琴、武術、書法三台大戲,能文能武,吸引了大量專業觀眾和媒體的駐足。在有彈性的琴弦上優雅的演奏,讓S1展現出速度、力度、精準度兼具的精細操作與絕對掌控。央視新聞對「書法」背後的模仿學習和智慧控制進行了專題報道,公司創始人來傑解釋到,絲滑動作的背後,是硬體側追求最好力控和最仿人身體指標(速度、負載等),而是在AI側則採集人的真實動作數據,讓機器人遇強則強,快速學習進化。而敏捷

本屆ACL大會,投稿者「收穫滿滿」。為期六天的ACL2024正在泰國曼谷舉辦。 ACL是計算語言學和自然語言處理領域的頂級國際會議,由國際計算語言學協會組織,每年舉辦一次。一直以來,ACL在NLP領域的學術影響力都名列第一,它也是CCF-A類推薦會議。今年的ACL大會已是第62屆,接收了400餘篇NLP領域的前沿工作。昨天下午,大會公佈了最佳論文等獎項。此次,最佳論文獎7篇(兩篇未公開)、最佳主題論文獎1篇、傑出論文獎35篇。大會也評出了資源論文獎(ResourceAward)3篇、社會影響力獎(

今天下午,鸿蒙智行正式迎来了新品牌与新车。8月6日,华为举行鸿蒙智行享界S9及华为全场景新品发布会,带来了全景智慧旗舰轿车享界S9、问界新M7Pro和华为novaFlip、MatePadPro12.2英寸、全新MatePadAir、华为毕昇激光打印机X1系列、FreeBuds6i、WATCHFIT3和智慧屏S5Pro等多款全场景智慧新品,从智慧出行、智慧办公到智能穿戴,华为全场景智慧生态持续构建,为消费者带来万物互联的智慧体验。鸿蒙智行:深度赋能,推动智能汽车产业升级华为联合中国汽车产业伙伴,为

視覺與機器人學習的深度融合。當兩隻機器手絲滑地互相合作疊衣服、倒茶、將鞋子打包時,加上最近老上頭條的1X人形機器人NEO,你可能會產生一種感覺:我們似乎開始進入機器人時代了。事實上,這些絲滑動作正是先進機器人技術+精妙框架設計+多模態大模型的產物。我們知道,有用的機器人往往需要與環境進行複雜精妙的交互,而環境則可被表示成空間域和時間域上的限制。舉個例子,如果要讓機器人倒茶,那麼機器人首先需要抓住茶壺手柄並使之保持直立,不潑灑出茶水,然後平穩移動,一直到讓壺口與杯口對齊,之後以一定角度傾斜茶壺。這

會議簡介隨著科技的快速發展,人工智慧成為了推動社會進步的重要力量。在這個時代,我們有幸見證並參與分散式人工智慧(DistributedArtificialIntelligence,DAI)的創新與應用。分散式人工智慧是人工智慧領域的重要分支,這幾年引起了越來越多的關注。基於大型語言模型(LLM)的智能體(Agent)異軍突起,透過結合大模型的強大語言理解和生成能力,展現了在自然語言互動、知識推理、任務規劃等方面的巨大潛力。 AIAgent正在接棒大語言模型,成為目前AI圈的熱門話題。 Au
