Yapeng Tian
更新-260416 | 发布-260416
基本信息
- 高校:德克萨斯大学达拉斯分校(The University of Texas at Dallas)(美国)
- 院系:Erik Jonsson School of Engineering and Computer Science Computer Science
- 职称:助理教授
- 性别:男
- 研究领域:计算机视觉/计算机听觉/多模态学习/图像修复
- 博士毕业院校:罗切斯特大学
- 本科毕业院校:西安电子科技大学
个人研究情况
从研究定位来看,他属于非常典型的 计算机视觉 + 多模态学习 + 音视频智能 方向青年老师。个人主页写得很清楚:他的核心兴趣是解决 computer vision、computer audition、machine learning 的基础问题,并将这些方法应用到更广泛的 AI 场景中,包括 multisensory perception、computational photography、AR/VR、accessibility、healthcare。也就是说,他不是只做单一视觉任务,而是更强调“视觉、声音、文本等多模态信息如何共同支撑更智能的感知与生成系统”。他的研究大致可以概括成四条主线。第一条是 音视频场景理解(audio-visual scene understanding),也就是把图像/视频与声音联合起来建模,让系统不仅“看见”,还能“听懂”,从而实现更强的场景理解、事件识别与解释能力。第二条是 音视频生成(audio-visual generation),包括联合音视频生成、空间音频生成、视频与文本引导的声音生成等。第三条是 AI for Accessibility and Healthcare,也就是把视觉与 AI 技术用于可及性和医疗场景,比如面向视障、听障、自闭症辅助和医学影像增强。第四条是 图像与视频处理,包括图像恢复、视频增强,以及延伸到 MRI 等医学影像的质量提升问题。从成果风格看,Yapeng Tian 的研究活跃度很高,而且很有“视觉大组新 PI”的特点。
学术影响力
- 谷歌学术引用:16011
- H指数:78
整体评价
A