Yapeng Tian

更新-260416 | 发布-260416

基本信息

  • 高校:德克萨斯大学达拉斯分校(The University of Texas at Dallas)(美国)
  • 院系:Erik Jonsson School of Engineering and Computer Science Computer Science
  • 职称:助理教授
  • 性别:男
  • 研究领域:计算机视觉/计算机听觉/多模态学习/图像修复
  • 博士毕业院校:罗切斯特大学
  • 本科毕业院校:西安电子科技大学

个人研究情况

从研究定位来看,他属于非常典型的 计算机视觉 + 多模态学习 + 音视频智能 方向青年老师。个人主页写得很清楚:他的核心兴趣是解决 computer vision、computer audition、machine learning 的基础问题,并将这些方法应用到更广泛的 AI 场景中,包括 multisensory perception、computational photography、AR/VR、accessibility、healthcare。也就是说,他不是只做单一视觉任务,而是更强调“视觉、声音、文本等多模态信息如何共同支撑更智能的感知与生成系统”。他的研究大致可以概括成四条主线。第一条是 音视频场景理解(audio-visual scene understanding),也就是把图像/视频与声音联合起来建模,让系统不仅“看见”,还能“听懂”,从而实现更强的场景理解、事件识别与解释能力。第二条是 音视频生成(audio-visual generation),包括联合音视频生成、空间音频生成、视频与文本引导的声音生成等。第三条是 AI for Accessibility and Healthcare,也就是把视觉与 AI 技术用于可及性和医疗场景,比如面向视障、听障、自闭症辅助和医学影像增强。第四条是 图像与视频处理,包括图像恢复、视频增强,以及延伸到 MRI 等医学影像的质量提升问题。从成果风格看,Yapeng Tian 的研究活跃度很高,而且很有“视觉大组新 PI”的特点。

学术影响力

  • 谷歌学术引用:16011
  • H指数:78

整体评价

A

链接


This site uses Just the Docs, a documentation theme for Jekyll.