删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

大连大学计算机科学与技术研究生导师简介-张奕

大连大学 免费考研网/2016-05-05


姓名:张奕职称:副教授
性别:男出生日期:1978-9-4
Email:zhangyi@dlu.edu.cn联系电话:**
所在专业:计算机科学与技术博士毕业:是
硕士导师:是个人主页:http://blog.sina.com.cn/zhangyidashu

研究方向:多媒体音视频处理,3D语音重建
简介: 多媒体音视频处理分为音频和视频两部分,分别是,基于麦克风阵列的语音处理和基于体感摄像头的视频处理。
基于麦克风阵列的语音处理一般用在视频会议,机器人等领域,典型的应用是音频定位,也就是安装在机器人脑袋上的麦克风阵列模拟人耳的处理方式,仅凭接受的声音信号的差异,就能判断出说话人的位置,然后机器人就会转头看着你,它甚至可以通过回声判断出周围房间的形状配置。
基于体感摄像头的视频处理,是基于微软开发的XBOX设备的体感设备,kinect摄像头,它较之普通摄像头加入了红外感知,从而可以显示三维立体的人像数据。因此kinect摄像头,具有更强的分辨能力,有趣的应用则是肢体控制,也就是说该摄像头可以阅读你的肢体语言,从而根据你肢体发出的命令执行操作,比如ppt演示的时候不需要激光笔鼠标,只需要挥一挥手就可以进行翻页操作,kinect摄像头还有很多有趣的应用,例如三维扫描,距离报警,表情跟踪等。
3D语音重建是一个非常有吸引力的领域,它可以利用固定位置的扬声器虚拟出不同位置的声源,让收听者产生身临其境的感觉,这在战场上和民用的远程音乐会,虚拟现实等应用中起到至关重要的作用。
试想上述技术的结合会产生多么有趣的组合,假设我们产生一个身临其境的虚拟语音,配合三维激光成像技术虚拟出物体,再用kinect摄像头感知你的动作从而做出相应虚拟声音和虚拟物体的变化,如果在在能在手指上安装电脉冲模拟人的触觉,那么,声音是三维逼真的,图像是三维逼真的,你动作和它的互动也是逼真的,甚至你的触觉也是逼真的,那么你一定会迷失在虚拟世界的,你会说这就是真实的世界!
论文及著作:[1] 张奕,殷福亮. 混响和有色噪声环境下的顽健时延估计方法. 通信学报. 2008, 29(5): 6-12(EI 检索**540)
[2] 张奕,殷福亮, 陈喆. 一种基于线性校正总体最小二乘准则的说话人定位算法, 通信学报. 2009,30(12): 106-112.(EI 检索**141)
[3] Yi Zhang, Fuliang Yin. Time delay estimation in spatial noisy and reverberant environments. IEEE International Symposium on Intelligent Information Technology Application. 2008, 3: 459-463.
(EI 检索**601)
[4] Naigao Jin, Yi Zhang, Fuliang, Yin. Audio-visual 3D speaker tracking.IET International Conference on Wireless Mobile and Multimedia Networks Proceedings, 2006, 525: 278-280.
(EI 检索**)
[5] 张奕,殷福亮. 混响和空间噪声环境下的鲁棒时延估计方法, 信号处理. 2009, 25(8): 1233-1236
[6] 张奕,殷福亮. 一种基于归一化峰度的抗非高斯噪声语音VAD检测方法, 信号处理. 2009, 25(11): 1515-1519

[7] Yi Zhang, Yuxia Zhang, Xiaomei Li, Bingnan Pei. Time Delay Estimation in Reverberant Double Sources Environment. IEEE International Conference on Future Computer and Communication 2010. Shanghai, China, September 28-29, 2010, 1: 129-132 (EI检索)

[8] Yi Zhang, Xiaomei Li, Yuxia Zhang. A Normalized Kurtosis based Voice Activity Detection Method under Non-Gaussian Non-stationary Noise. 2011. Kota Kinabalu, Malaysia, July 16-17, 2011, 1: 426-429 (EI 检索)

科研项目:国家自然科学基金委 **“基于人耳听觉启示的麦克阵列语音定位研究”主持人


辽宁省高等学校科研项目计划自然科学类项目《复杂声学环境下的麦克风阵列说话人语音定位系统研究》、 主持人
相关话题/环境 激光 技术 通信 研究方向