近日,國際頂級(jí)會(huì)議ICCV 2025(計(jì)算機(jī)視覺國際大會(huì))公布論文錄用結(jié)果,格靈深瞳共有6篇論文入選,成果涉及視覺基座模型、人臉3D重建、文檔幾何校正、人體動(dòng)作生成、魯棒三維重建等多個(gè)視覺AI研究關(guān)鍵方向。在視覺基座模型方面,格靈深瞳與華為諾亞研究院合作的論文入選。該成果通過引入?yún)^(qū)域Transformer層和高效的區(qū)域聚類判別損失,有效提升視覺模型對(duì)局部區(qū)域信息的感知與表達(dá)能力,使其在OCR、目標(biāo)檢測(cè)和分割等密集視覺任務(wù)中表現(xiàn)突出。
公眾號(hào)
關(guān)注微信公眾號(hào)