GAN
面向医学图像分割的自适应Transformer方法研究
面向多模态语义理解与推理的视觉问答研究
定制化底层视觉基础框架和理论体系
Next3D: 超写实3D数字人生成与驱动
面向开放场景的多模态图像检索方法研究
基于领域泛化的高光谱图像跨场景分类方法研究
动态多视角协同与大场景多粒度视频分析
基于扩散模型的视觉文本渲染
异构联邦学习
图网络在一般数据上的应用
Towards Expressive Human Motion Capture Models and Datasets
基础模型搜索和优化研究
低资源视频手语识别方法
Exploring Sparsity in Image Super-Resolution forEfficient Inference