中心简介
环绕智能与多模态研究室致力于研究以语音为中心的智能信息系统,开展了从发音到听觉的主要模块的研究,包括:大规模连续语音识别、语音可视化、言语生成计算建模、汉语言产生的脑机制等。自2007年建立以来,承担了包括NSFC重点项目在内的多项国家、省部级项目,形成了一个以特聘教授、海归博士为核心的研究团队,是国内最具实力的语音领域研发基地。 通过多年的努力,我们在语音生成计算模型、语音可视化、复杂声学环境下的语音识别,以及非限定文本的口语发音检测和自动评分等研究方向上开展了深入研究。研究方向抓住了我国科技发展的热点,使得环绕智能研究室快速成长为国内本领域成果突出、特色显著的研究单位。 目前,实验室正在开展包括国家自然基金等7项研究项目,已在语音识别、人机交互、虚拟现实、机器人等相关领域发表国际杂志和会议论文90余篇,授权国家发明专利8项。拥有大量专业录音设备,如森海塞尔耳机,USB声卡,噪声仪等,已购置 Carstens Medizinelectronik EMA三维发音数据采集系统,主要用于三维面部/口腔发音数据的采集和处理。为了加强项目所需的数据资源,实验室新近又购买了OptiTrack 面部动作捕捉系统,该系统分辨率可达0.1mm,采样速度可达250帧/秒。这些实验设备可很好保障实验方案顺利实施。同时组建了实验室高性能计算集群AIMS,其中包括了惠普最新的高性能4核服务器15台,惠普塔式服务器4台,戴尔高性能工作式笔记本和台式机2台,以及20台高性能PC机,并以此为基础搭建了并行大规模计算平台,以支持大规模连续语音识别的相关计算工作。实验室还配有一套64通道EGI脑电采集系统和一套128通道Neuroscan脑电采集系统、眼动仪、电磁发音仪、言语空气动力学系统、Siemens Trio 3.0T MRI 图像系统等等专业仪器设备便于日常研究,同时拥有多台高性能PC机和服务器,搭建了并行计算平台,以支持高性能运算。作为深圳市言语治疗及康复技术工程实验室,我们致力于建立“Speech Learning Home”言语障碍康复全景室,以此用于建立多模态构音障碍言语运动功能数据库;与此同时进一步探索正常和言语障碍者汉语加工的大脑机制;并且同步建成失语症语音数据库和嗓音障碍语音数据库。
|