全球領先的3D大模型出自上海“95后”團隊之手

不斷試錯依然充滿信心,從無人問津到獲千萬美元融資
全球領先的3D大模型出自“95后”團隊之手
過去幾年裡,生成式AI技術已經在文字、圖像、音頻、視頻取得重大進展,而3D生成常被認為是“世界模型”的“最后一塊拼圖”。近日,3D生成大模型公司——影眸科技完成數千萬美元A輪融資。
專注於3D生成大模型技術的影眸科技,是上海科技大學孵化的創業企業。此次融資將用於影眸科技進一步推進3D大模型前沿探索,同時推動以3D生成大模型Rodin為核心的Hyper3D系列產品在全球市場的商業化落地。
據悉,Rodin上線45天后已實現100萬美元年經常性收入,截至目前已獲得數百萬元B端商業化訂單,覆蓋游戲、電商、空間計算、3D打印、影視等多個行業。
令人印象深刻的是,這家公司的團隊成員大多在30歲以下,卻完成了全球領先的3D大模型——Clay的研發。這一成果與團隊同年研發的3D服裝生成模型Dresscode同時獲得SIGGRAPH2024最佳論文榮譽提名,團隊也成為這一領域內唯一在同一個學術頂會上獲得兩項該提名的中國團隊。
實驗室科研,點燃創業源點
影眸科技的首席技術官,也是影眸科技的創始人之一——張啟煊,出生於1999年,是上科大智能視覺與數據中心的一名研究生。
在本科時期,張啟煊便進入實驗室參與科研項目,並逐漸對計算機圖形學和機器視覺方向的相關技術產生濃厚興趣。在導師的指導下,他深入探索3D建模領域的前沿科技。
本科生就能進入實驗室做科研,一直是上科大的一大特色。更為特殊的是,影眸科技創始人吳迪不僅參與實驗室科研,更參與實驗室的籌備工作。“從某種角度來說,實驗室的籌備過程也是一種創業。”吳迪心中,實驗室從無到有的過程本身就是一段寶貴的經歷。“當時,實驗室初創時期的名字叫MARS,張啟煊那時大二,我是大四。”吳迪介紹,實驗室最初的研究方向是——如何把現實世界中的人物和物品映射到虛擬世界中。這就需要光場掃描,因為有十分龐大的數據採集需求,實驗室開始打造完全自研、全球領先的光場拍攝系統、數據採集系統。
經過6年與實驗室伙伴們的共同努力,實驗室搭建了穹頂光場。這個光場的核心在於,全場布滿可控光源和4000幀/秒的超高速相機。通過這些設備,它可以以超高的精度與超快的速度動態掃描面部和物體表面的材質、捕捉表情變化時的肌肉運動。當這些狀態被放到新環境中時,它們的高光、陰影都會隨著環境的變化而變化。“這期間,我們拆掉了一個又一個辛苦搭建完成的裝置,最終研發出了全球最高精度的人臉掃描設備——穹頂光場系統。”吳迪回憶道。
充分的試錯平台
2020年,創始團隊獲得了上海科技大學相關技術IP授權,創辦了影眸科技。雖然有了先進的科研成果,但成果轉化並非一帆風順。
這群年輕的創業者一度認為,終於研發成功了,就等著客戶上門砸錢。然而現實情況是,大多數產品並不符合工業生產標准,更多是“躺在象牙塔裡的科研”,很少考慮真實的市場需求。具體來說,影眸科技當時的技術與傳統的影視、游戲通用的Unity系統並不兼容。所以,在當時很難有客戶買單。
幾經周折之后,公司團隊做了一個痛苦的決定,把所有2D業務線全部砍掉,全面擁抱3D,著重研發新一代穹頂光場,聚焦數字人領域的研發。基於以前試錯的教訓,團隊著重研發與現有影視、游戲業務相兼容的系統技術。通過這項新技術,以前需要3—5個月才能用的人物超寫實復刻,現在3—5天就可以完成,這項技術目前主要服務於影視和游戲客戶。
是什麼讓影眸科技在不斷試錯中,對未來依然充滿信心?在吳迪眼中,“整個學校對創新有極大的包容性,給學生試錯的平台。讓我們能在這裡擁抱科學研究的基本方法和價值觀,互相包容、鼓勵。最重要的是允許彼此失敗,繼而成功,這才給了我們真正的成長空間。”
在商業化的道路上,影眸科技不斷探索市場需求,同時秉持的“讓研發能夠真正地被應用”的理念,將目光逐漸收束到3D大模型上。去年6月,基於Clay開發的Rodin Gen-1上線,以它最貼近行業標准的生成質量,獲得廣泛好評,幫助用戶實現高效便捷的3D創作。同年12月,影眸科技發布Rodin Gen-1.5版本,通過新一代3D原生表達,全面解決了行業內長期存在的薄面與邊緣銳度問題,再次提高3D生成全行業商用標准。這次更新再次引發了全球3D生成領域的關注,鞏固了影眸科技在3D生成技術創新與商業化應用領域的領先地位。(記者 李蕾)
分享讓更多人看到
- 評論
- 關注