付中华_教师主页

教师主页移动版

主页 > 陕西省 > 西北工业大学

付中华

个人经历 Personal experience 工作经历 付中华,博士,科大讯飞西安研究院常务副院长,科大讯飞汉中天汉创新研究院院长,陕西省人工智能重点实验室主任,西北工业大学智能声学与临境通信联合实验室副主任,西北工业大学计算机学院副教授,研究方向包括声学主动降噪、超远距离拾音、芯片级降噪解决方案、声纹采集与智能辅助分析、智能声信号处理、多语种识别、多模态人机交互等领域。研究开发的超指向麦克风阵列、超远距离拾音、主动降噪耳机、立体声回声对消等算法和装置已经成功应用于相关产品,设计建设了科大讯飞刑事语音检验实验室(西安)以及语音鉴定工作站系统,牵头研制了IFLYBUDS Pro录音降噪会议耳机、专用有源降噪耳机、工业声学成像仪、声纹采集终端设备、专业监听设备、审讯设备、会议机、超远距离拾音装置、头盔语音唤醒交互芯片等众多产品,广泛应用于工业智能、tws耳机和特种行业耳机头盔、辅听助听耳机、公安刑侦声纹、AI交互、AIOT芯片等领域,其中“谛听”产品荣获陕西省软件行业协会颁发的软件产品认证。在国际著名期刊和会议、 国内核心期刊发表相关论文七十余篇,25项发明专利。承担了科技创新2030-“新一代人工智能”重大项目2项,国家重点研发计划1项,国家高技术研究发展计划(863 计划)、国家自然科学基金项目、陕西省重点产业创新链项目、西安市科技计划项目等。首次建立了基于中国人标准头模的HRTF全数值计算模型,获得ICOT2018最佳论文奖。

教育教学

教育教学 Education and teaching 教育教学 开设课程1)本科生选修课:数字音频原理与应用简介:声音是物理世界的重要现象,也是人与客观世界信息交互的信息载体。音频信号处理涉及声频工程(录音、编码传输、声重放)、声频通信、声目标及声事件的定位跟踪分析、音乐分析检索推荐、音效仿真等。本课程以科普和基本概念为主,介绍声音的基本常识,人耳听觉系统的基本常识,并对音乐声学、声音编辑、音效制作、混音调音、麦克风扬声器等电声设备等相关知识工具进行介绍,还涉及智能音频相关的典型应用和前沿技术。欢迎感兴趣的同学选修,成绩优异的同学可以报考本人的研究生,并进入科大讯飞人工智能研究院实习,获得内推机会。2)研究生专业课:听觉与音频信号处理简介:本课程以听觉和音频信号为对象,介绍音频信号的两大属性(物理声属性和可听声属性)以及音频信号处理的典型应用,包括数字音效、听觉场景分析、麦克风阵列、自适应波束形成、回声对消、语音增强、临境通信等。目的是让学生掌握音频信号以及人耳听觉的特点、现象、规律,熟悉音频信号的典型应用和前沿技术,为将来从事相关领域的专门研究奠定基础。先修课程包括:数字信号处理、多媒体技术,C语言程序设计等。研究生研二进入科大讯飞人工智能研究院实习,直接参与实际系统和产品的研发,研究院提供了完善的研发平台和实验环境,具备强大的工程团队来将最先进的技术变成实际的产品,并在科大讯飞丰富的货架体系和行业赛道中得到应用。

荣誉获奖

综合介绍 General Introduction 一、现状目前已建成专业消声实验室,用于声学校准、测量;声纹采集与鉴定实验室,用于声纹相关的产品与技术研发;多功能声音实验室,用于模拟不同环境下的声学实验;声学硬件设计和检测实验室,用于麦克风阵列、头戴式设备等产品样机研制。l  声学主动降噪以主动降噪耳机为代表的技术和产品研发。已经装备若干型号产品,形成了耳罩式、头戴式、头盔式、入耳式等耳机形态,可广泛应用于航海、航空、交通车辆、厂矿等高噪声领域,对支撑国家战略、工业4.0发展助力良多。l  超远距离拾音以谛听设备为代表的微声监测拾音设备。已经用于公检法司等监控、侦听场所,为打击犯罪提供了强有力的手段。以长缨阵为代表的超远距离拾音系统,将麦克风阵列和锥形反射音罩结合,利用音罩有效地提高了拾音系统接收远场声源的辐射声能,然后利用麦克风阵列设计强散射场下的超强指向波束,并利用后置滤波技术等进一步降低干扰噪声,在室外可以清晰拾取30m 远的语音信号。l  AIoT芯片级降噪解决方案应用于电动车头盔的AIOT芯片(语音唤醒头盔),头盔前方布置单MIC,两侧靠耳附近布置喇叭,内置聆思AIOT芯片CSK3001芯片模组,与手机通过蓝牙连接。骑手可使用唤醒词唤醒头盔,用语音命令控制手机接听和挂断电话操作,保障骑手骑行安全。CSK3001芯片模组内置自研AI降噪算法,可显著抑制回声、风噪。l  声纹采集与辅助鉴定为了支撑反电诈的战略工作,研发了专用的声纹采集终端设备、通用语音翻采设备以及先进的AI辅助声纹检验鉴定系统,该系统支持了真伪检测分析、多种噪声分析与抑制、声纹分析比对、辅助鉴定等一系列业务需求,已经在全国反电诈会战中发挥重要作用。此外还支持多次全国公安系统声纹鉴定技术培训,建立了国内首个“声纹检验实验室样板间”。牵头支撑了科技部和公安部关于深度伪造人工智能对抗领域的课题和业务论证,开辟了深伪对抗技术的研究方向。l  工业智能声学成像仪声学成像仪利用麦克风阵列声场热力图和视觉联合成像技术,已成功应用于电力设备放电、气体管道泄露、电机异响等工业场景的巡检和检测,该设备可以实时高精度的显示异常点所在位置,解决高压电、高温、有毒等人员难以靠近,或人耳难以察觉的故障点检测问题。l  智能助辅听器降噪技术针对助辅听器的低延时、低功耗等核心诉求,研发设计了传统双麦算法和深度学习相结合的智能场景感知和降噪技术,该技术不仅使整个声信号通路的延迟低至5.7ms,满足专业助听器的延迟要求,而且还支持6561种噪声场景自动识别和自适应噪声抑制,降噪深度可达40dB以上,让安静情况下听感更清晰,喧闹环境下听感更舒适。l  近场定向拾音降噪算法近场4麦克风阵列模组,能够仅对正前方近场语音进行有效响应,显著抑制两侧声音,在地铁购票机、服务机器人等复杂环境中进行有效的语音交互,避免误响应、误唤醒、互相干扰等痛点问题,该技术已经成功应用西安地铁十四号线中。l  多模态语音识别利用听视觉融合方法解决复杂场景中的语音交互难题,专注于车载和智慧屏幕场景的应用,在2020年上线了多模态识别模型,已经用于车载智能交互场景,2021年底成功应用于冬奥会智慧大屏。l  多模态人机交互前瞻融合视、听、高光谱、脑电等多种模态信息,探索和研究不同模态信息数据的规律、特点,以及稳健有效的融合方法,以实现更完美的人性化的交互体验。l  其他本地化工作与西飞民机公司深耕航空工业智能信息化命题,推动人工智能技术在工业制造领域的深入应用,在航空多语种制式文档翻译方面取得突破;与陕西省融媒体创新中心研究数字虚拟形象文化创新课题,将陕西厚重的历史文化积淀与人工智能技术相结合,助力文化自信与繁荣。相关课题已经得到陕西省重点产业链创新项目支持。二、未来发展未来,将继续坚持顶天立地的理念,践行“用人工智能建设美好世界”的崇高使命,坚持创新引领,初心不改,在声学前端软硬件联合优化、可穿戴设备语音芯片级解决方案、多语种识别和翻译等领域产出更多的业界领先的技术和成果,打通研究成果到样机和系统研制、产品化制造与交付的壁垒,打造广阔的发展空间。 个人相册

科学研究

学术成果

综合介绍