Yapeng Tian

更新-260416 | 发布-260416

基本信息

高校：德克萨斯大学达拉斯分校（The University of Texas at Dallas）（美国）
院系：Erik Jonsson School of Engineering and Computer Science Computer Science
职称：助理教授
性别：男
研究领域：计算机视觉/计算机听觉/多模态学习/图像修复
博士毕业院校：罗切斯特大学
本科毕业院校：西安电子科技大学

个人研究情况

从研究定位来看，他属于非常典型的计算机视觉 + 多模态学习 + 音视频智能方向青年老师。个人主页写得很清楚：他的核心兴趣是解决 computer vision、computer audition、machine learning 的基础问题，并将这些方法应用到更广泛的 AI 场景中，包括 multisensory perception、computational photography、AR/VR、accessibility、healthcare。也就是说，他不是只做单一视觉任务，而是更强调“视觉、声音、文本等多模态信息如何共同支撑更智能的感知与生成系统”。他的研究大致可以概括成四条主线。第一条是音视频场景理解（audio-visual scene understanding），也就是把图像/视频与声音联合起来建模，让系统不仅“看见”，还能“听懂”，从而实现更强的场景理解、事件识别与解释能力。第二条是音视频生成（audio-visual generation），包括联合音视频生成、空间音频生成、视频与文本引导的声音生成等。第三条是 AI for Accessibility and Healthcare，也就是把视觉与 AI 技术用于可及性和医疗场景，比如面向视障、听障、自闭症辅助和医学影像增强。第四条是图像与视频处理，包括图像恢复、视频增强，以及延伸到 MRI 等医学影像的质量提升问题。从成果风格看，Yapeng Tian 的研究活跃度很高，而且很有“视觉大组新 PI”的特点。

学术影响力

谷歌学术引用：16011
H指数：78

Yapeng Tian

基本信息

个人研究情况

学术影响力

整体评价

链接