為此,清華大學(xué)自動(dòng)化系提出一個(gè)基于高斯世界模型的流式三維語(yǔ)義占用預(yù)測(cè)模型GaussianWorld,現(xiàn)已開(kāi)源。與GaussianWorld相關(guān)的論文成果已投稿CVPR 2025,清華大學(xué)自動(dòng)化系智能視覺(jué)實(shí)驗(yàn)室(IVG)博士生左思成為論文一作。

GaussianWorld采用顯式3D高斯作為場(chǎng)景表示,而不是傳統(tǒng)的隱式 BEV/Voxel 表示,這可以實(shí)現(xiàn)物體運(yùn)動(dòng)的顯式和連續(xù)建模。給定歷史 3D 高斯和當(dāng)前視覺(jué)輸入,GaussianWorld算法模型旨在預(yù)測(cè)場(chǎng)景如何演變并預(yù)測(cè)當(dāng)前的占用情況。
為了證明提出的GaussianWorld算法模型的有效性,在nuScenes數(shù)據(jù)集上進(jìn)行了大量實(shí)驗(yàn)。實(shí)驗(yàn)表明,GaussianWorld 可以有效地預(yù)測(cè)場(chǎng)景演變,并在不引入額外計(jì)算的情況下將單幀占用率預(yù)測(cè)提高 2% 以上(mIoU)。與現(xiàn)有方法相比,該模型在不引入額外計(jì)算開(kāi)銷的前提下,展示了SOTA的性能。

1月13日晚上7點(diǎn),智猩猩邀請(qǐng)到論文一作、清華大學(xué)智能視覺(jué)實(shí)驗(yàn)室(IVG)博士生左思成參與「智猩猩新青年講座自動(dòng)駕駛專題」第42講,主講《基于高斯世界模型的流式3D占用預(yù)測(cè)》。
講者
清華大學(xué)自動(dòng)化系智能視覺(jué)實(shí)驗(yàn)室(IVG)博士生,主要研究方向是計(jì)算機(jī)視覺(jué)和自動(dòng)駕駛。
第 42 講
2、基于世界模型的感知任務(wù)范式
3、基于高斯世界模型的流式OCC預(yù)測(cè)
4、在世界模型與端到端自動(dòng)駕駛上的思考
