黄双萍教师主页|华南理工大学华南理工大学电子与信息学院简历|黄双萍招生信息|黄双萍专利信息

教师主页移动版

主页 > 广东省 > 华南理工大学

黄双萍

姓名 黄双萍
性别
学校 华南理工大学
部门 华南理工大学电子与信息学院
学位 教授
学历 教授
职称 教授
联系方式 【发送到邮箱】
邮箱 【发送到邮箱】
人气
软件产品登记测试
软件著作权666元代写全部资料
实用新型专利1875代写全部资料
集群智慧云企服 / 知识产权申请大平台
微信客服在线:543646
急速申请 包写包过 办事快、准、稳

更新日期:2024年1月16日 姓 名 黄双萍 性 别 女 出生年月 1972年10月 籍贯 民 族 汉族 政治面貌 群众 最后学历 博士研究生毕业 最后学位 工学博士 技术职称 教授 导师类别 博、硕导 行政职务 Email eehsp@scut.edu.cn 工作单位 华南理工大学电子与信息学院 邮政编码 通讯地址 逸夫科学馆416 单位电话 个人简介 黄双萍,教授,博导,现任华南理工大学电子与信息学院副院长。主要从事多模态认知计算、计算机视觉、自然语言处理、联邦学习、具身智能、AIGC(数字人生成、风格化手写生成、表格摘要生成等)、图文智能,智慧医疗(影像分析和中医人工智能)等相关领域的理论及应用研究等。任中国图象图形学会文档分析与识别专委会委员,广东省图象图形学会理事,广东省图像图形学学会“计算机视觉”专业委员会委员。主持国家自然科学基金项目,科技部重大专项课题,广东省科技计划、广东省自然基金、广州科信局人工智能重点专项、广州市重大攻关项目以及企业横向项目,总计20余项。最近5年,积累的研究成果在CVPR, ACM MM, Scientific Data, Information Sciences、Pattern Recognition,Neurocomputing等国际顶级会议和期刊上发表,授权发明专利26件。获得“广东省科学技术奖励二等奖”1项,吴文俊人工智能科技进步奖1项。指导学生荣获互联网+国赛金奖,挑战杯广东省特等奖,MICCAI Liver Lesion Diagnosis on Multi-phase MRI比赛第1名,2023全国大数据与计算智能挑战赛获得二等奖(知识图谱QA)和三等奖(表格摘要)各1项,表格结构识别比赛二等奖2项,面向自动阅卷的OCR技术挑战赛文字识别任务一等奖,教育手写公式识别二等奖等。 教育经历 2007年09月~2011年06月  华南理工大学  博士研究生  通信与信息系统专业   智能信息处理2002年09月~2005年06月  华南理工大学  硕士研究生  通信与信息系统专业   视频压缩1991年09月~1995年06月  重庆邮电学院  学士        计算机通信专业 获奖、荣誉称号 1、数字媒体云服务平台创新及应用,2017年度广东省科学技术奖励二等奖2、智能辅助教育技术与应用,2020年吴文俊人工智能科技进步二等奖3、识古通今-OCR技术领航者,第六届互联网+国赛金奖4、2022年粤港澳大湾区(黄埔)国际算法算例大赛二等奖5、基于深度学习的自然场景文本检测,第十四届“ 挑战杯” 广东大学生课外学术科技作品竞赛,自然科学类学术论文组,特等奖6、第二届中国模式识别与计算机视觉大会面向自动阅卷的OCR技术挑战赛文字识别任务一等奖,20197、教育手写公式识别,中国创新挑战赛智慧教育专题三等奖,20208、MICCAI Liver Lesion Diagnosis on Multi-phase MRI比赛,获得第1名,20239、全国大数据与计算智能挑战赛“多粒度时序知识图谱问答”,获得第2名(二等奖),202310、全国大数据与计算智能挑战赛“表格摘要”,获得第5名(三等奖),202311、表格结构识别挑战赛,获得第2名12、粤港澳大湾区国际算法算例大赛“基于语言增强的图像新类别发现”三等奖,202313、粤港澳大湾区国际算法算例大赛“高效可靠的文生图方法”三等奖,2023 社会、学会及学术兼职 1、中国图象图形学会文档分析与识别专委会委员2、广东省图象图形学会理事 研究领域 多模态认知计算,联邦学习,具身智能,深度学习模型可靠性和可解释性,计算机视觉,自然语言处理,图文智能,医学影像理解和报告生成,中医人工智能 科研项目 (1)中医药典籍智能挖掘与古今融合知识体系构建共性关键技术研究及应用,科技部国家重点研发计划,2023年11月~2025年10月(2)基于图卷积和域自适应的跨场景复杂版面分析算法,国家自然科学基金,2022年1月~2025年12月; (3)基于深度强化学习和路径积分特征图的自然场景文本检测与识别,国家自然科学基金,2017年1月~2020年12月;(4)面向教育场景的图文识别智能标注系统,省级基础研究项目,2021年5月~2023年5月(5)高精度全要素身份融合识别与解析关键技术研究,广州市人工智能重点专项,2022年4月~2025年3月(6)文档图像版面结构分析算法研究,广东省基础与应用基础研究基金项目,2021年1月~2023年12月(7)场景文本检测和识别算法研究及应用,广州市科技计划,2017年5月~2020年4月 (8)移动通信高价值用户与场景的智能识别技术及应用系统研发,广州市科技计划产业技术重大攻关计划,2019年4月~2021年3月(9)深度学习模型可解释性研究,2023年12月~2026年11月(10)表单及标志牌信息智能识别,时代软件公司,2021年6月~2023年6月(11)面向教育场景的拍照题目及手写答案识别研究,阿里巴巴达摩院(杭州)科技有限公司,2020年7月~2021年6月(12)基于生成对抗网络(GAN)的甲骨拓片字符生成与识别技术,2019年12月~2020年12月,甲骨文信息处理教育部重点实验室课题(13)基于对抗生成和域自适应的甲骨文拓片字符识别技术,2021年5月~2023年5月,甲骨文信息处理教育部重点实验室课题(14)水稻穗瘟抗性高光谱鉴定技术研究及示范,项目编号:2014A020208112, 广东省科技计划公益专项,2015年1月~2017年12月,20万元; (15)视觉感知的水稻株间机械除草与同步液肥环施机理研究,项目编号:51575195, 国家自然科学基金,2016年1月~2019年12月(16)参与:智能感知与视觉感知计算,项目编号:2017A030312006,广东省自然科学基金研究团队项目,2017年5月~2022年5月 发表论文 [1] Zhenghua Peng, Yu Luo, Tianshui Chen, Keke Xu, Shuangping Huang, Perception and Semantic Aware Regularization for Sequential Confidence Calibration, CVPR 2023,CCF A, Accepted[2] Gang Dai, Yifan Zhang, Qingfeng Wang, Qing Du, Zhuliang Yu, Zhuoman Liu, Shuangping Huang, Disentangling Writer and Character Styles for Handwriting Generation, CVPR 2023,CCF A, Accepted[3] FanYang, LeiHu, Shuangping Huang*, A large-scale dataset for end-to-end table recognition in the wild, Scientific Data, 2023(IF=8.501,JCR Q1)[4]  Shuangping Huang, Zhuoyao Zhong, Lianwen Jin, Shuye Zhang, Haobin Wang, DropRegion Training of Inception Font Network for High-Performance Chinese Font Recognition, Pattern Recognition,77: 395-411, 2018(IF=7.196,JCR Q1)[5]  Shuangping Huang, Lianwen Jin, Kunnan Xue, Yuan Fang, Online Primal-dual Learning for a Data-dependent Multi-kernel Combination Model with Multi-class Visual Categorization Applications, Information Sciences,320: 75-100, 2015(IF=5.910, JCR Q1)[6] Haojie Li, Daihui Yang, Shuangping Huang*, Kin-Man Lam, Lianwen Jin, Two-Dimensional Multi-Scale Perceptive Context for Scene Text Recognition, Neurocomputing, 41: 410-421, 2020 (IF=4.438, JCR Q1); [7]  Ziyong Feng, Zhaoyang Zhao, Lianwen Jin, Shuangping Huang*, Robust shared feature learning for script and handwritten/machine-printed identification, Pattern Recognition Letters,2017(IF=3.255, JCR Q2)[8] Hongxiang Huang, Daihui Yang, Shuangping Huang, AGTGAN: Unpaired Image Translation for Photographic Ancient Character Generation, ACM MM 2022,CCF A, Accepted[9] Haojie Li, Daihui Yang, Shuangping Huang*, Kin-Man Lam, Deep Motion-Appearance Convolutions for Robust Visual Tracking, IEEE ACCESS, 2019(IF=3.7,JCR Q1)[10]  Huang Shuangping, Qi Long, Ma Xu, Xue Kunnan, Wang Wenjuan, Zhu Xiaoyuan, BoSW Model Based Hyperspectral Image Analysis for Rice Panicle Blast Grading, Computers and Electronics in Agriculture, 118: 167-178, 2015(IF=3.858,JCR Q1)[11]  Huang Shuangping, Qi Long, Ma Xu, Xue Kunnan, Wang Wenjuan, Zhu Xiaoyuan, Deep localization model for intra-row crop detection in paddy field, Computers and Electronics in Agriculture, 169: 1-12, 2019(IF=3.858,JCR Q1)[12]  Shingling Huang, Lianwen Jin, Yuan Fang, Xiaoxin Wei, Online Heterogeneous Feature Fusion Machines for Visual Recognition, Neurocomputing, 123(10): 100-109, 2014 (IF=4.438, JCR Q1); [13]  Shuangping Huang, Lianwen Jin, Yunyu Li, Kunnan Xue, Long Qi, Online Multi-kernel Learning Based on a Triple Norm Regularizer for Semantic Image Classification, Mathematical Problems in Engineering,2015(IF=1.145,JCR Q3).[14] Zhenzhou Zhuang, Zonghao Liu, Shuangping Huang, A New Semi-Automatic Annotation Model for Text Detection via Semantic Boundary Estimation, ICDAR 2021[15] Shuangping Huang, Yu Luo, Zhenzhou Zhuang, Context-Aware Selective Label Smoothing for Calibrating Sequence Recognition Models, ACM MM 2021, CCF A, Accepted[16] Jinrong Li, Zijian Zhou, Zhizhong Su, Shuangping Huang, Lianwen Jin, A New Parallel Detection-Recognition Approach for End-to-End Scene Text Extraction, ICDAR 2019[17] Shuangping Huang, Haobin Wang, Yongge Liu, Xiaosong Shi, Lianwen Jin, OBC306: A Large-Scale Oracle Bone Character Recognition Dataset, ICDAR 2019[18] Haobing Wang, Shuangping Huang*, Lianwen Jin, Focus on Scene Text Using Deep Reinforcement Learning, ICPR 2018 科研创新 [1]黄双萍,杨帆. 一种联合卷积与图神经网络的表格结构识别方法[P]. 广东省:CN114387608B,2022-06-21.[2]黄双萍,刘宗昊,王庆丰. 图像文本检测半自动标注方法、系统、计算机设备及介质[P]. CN113807336A,2021-12-17. (审核中-实审)[3]黄双萍,郑锐佳,李智龙,李南鹏,杨代辉,李晓辉,吴淦浩,刘伏根. 文本图像标注系统、方法、计算机设备和存储介质[P]. CN111898411B,2021-08-31.[4]黄双萍,罗钰,陈洲楠. 文本图像识别方法、装置、计算机设备和存储介质[P]. CN113313127A,2021-08-27.(审核中-实审)[5]黄双萍,伍思航. 基于深度学习的单株水稻检测定位方法、系统、设备及介质[P]. CN109886155B,2021-08-10.[6] [1]陈向乐,黄双萍. 基于深度学习的试卷卷头学生信息自动检测方法[P]. 广东省:CN113076900B,2022-06-14.[7]黄双萍,庄镇州,李晓辉. 文本识别方法、装置、计算机设备和存储介质[P]. CN111797834B,2021-06-15.[8]黄双萍,杨代辉,黄鸿翔,郑锐佳,李智龙,李南鹏. 复杂场景文本识别方法、系统、计算机设备及存储介质[P]. CN112163596A,2021-01-01.(审核中-实审)[9]黄双萍,杨代辉,李豪杰,金连文. 拓片甲骨文字符图像增广方法、系统、计算机设备及介质[P]. CN111915540A,2020-11-10.(审核中-实审)[10]黄双萍,郑锐佳,李智龙,李南鹏,杨代辉,李晓辉,吴淦浩,刘伏根. 文本图像标注系统、方法、计算机设备和存储介质[P]. CN111898411A,2020-11-06.[11]黄双萍,庄镇州,李晓辉. 文本识别方法、装置、计算机设备和存储介质[P]. CN111797834A,2020-10-20.[12]黄双萍,王浩彬,金连文. 基于深度强化学习的场景文本检测方法及系统[P]. CN108090443B,2020-09-22.[13]黄双萍,伍思航,李豪杰. 基于双流卷积神经网络的目标跟踪方法、系统、设备及介质[P]. CN109410242B,2020-09-22.[14]黄双萍,伍思航,李豪杰. 基于三维卷积神经网络的边界框回归方法、系统、设备及介质[P]. CN109255351B,2020-08-18.[15]黄双萍. 基于深度卷积神经网络的水稻穗瘟检测方法及系统[P]. CN107576618B,2020-04-28.[16]黄双萍,伍思航. 基于深度学习的单株水稻检测定位方法、系统、设备及介质[P]. CN109886155A,2019-06-14.[17]金连文,黄双萍,黎小凤. 一种基于样本模板的数字化妆方法[P]. CN105488472B,2019-04-09.[18]黄双萍,金连文,商俊蓓. 基于BLSTM的联机手写数学公式符号识别方法[P]. CN105512692B,2019-04-09.[19]黄双萍,伍思航,李豪杰. 基于双流卷积神经网络的目标跟踪方法、系统、设备及介质[P]. CN109410242A,2019-03-01.[20] 黄双萍,黄鸿翔,杨代辉. 一种联合形状变换和纹理转换的古文字生成方[P].CN114494003B,2019-03-01.[21]黄双萍,陈洲楠,杨代辉,梁景麟,彭政华. 一种基于双流编码的文字图像书写轨迹恢复方法[P]. CN114463760B,2022-05-10.[22]黄双萍,陈洲楠,杨代辉,梁景麟,彭政华. 一种文字图像书写轨迹恢复效果判别方法[P]. CN114511853B,2022-05-17[23]黄双萍,罗钰,徐可可. 基于CTC解码器的文本序列识别模型校准方法[P]. 广东省CN114495114B,2022-08-05. [24]黄双萍,王庆丰,代港. 基于对抗解耦的个性化手写文字生成方法[P]. 广东省:CN114495118B,2022-08-09.[25] 黄双萍;黄鸿翔;杨代辉. 一种基于形状变换的字符图像增广方法[P]. 广东省:CN 114782961 B [26] 黄双萍;黄森;张慧源;李晨;张伟坤;梁景麟. 基于深度学习的机车标志牌信息智能识别方法及系统[P] CN 115620265 B[27] 黄双萍;陈洲楠;杨代辉;梁景麟;彭政华. 基于全局追踪解码的文字图像书写轨迹恢复方法 CN 114757969 B[28] 黄双萍;彭政华;杨帆. 一种全线表表格结构识别方法. CN 114529925 B[29] 黄双萍;胡磊;杨帆;黄森. 一种表格的标记语言标签与单元格锚框鲁棒对齐方法. CN 115618154 B[30] 黄双萍;刘宗昊;黄森;彭文杰. 一种基于关键点检测的全线表表格结构识别方法 CN 115620322 B 教学活动 本科课程:数字信号处理研究生课程:深度学习 指导学生情况 1、识古通今-OCR 技术领航者,第六届中国国际“互联网+”大学生创新创业大赛的国赛金奖,20202、基于深度学习的自然场景文本检测,第十四届“ 挑战杯” 广东大学生课外学术科技作品竞赛,自然科学类学术论文组,特等奖,20173、第二届中国模式识别与计算机视觉大会面向自动阅卷的OCR技术挑战赛文字识别任务一等奖,20194、教育手写公式识别,中国创新挑战赛智慧教育专题赛三等奖,20205、基于深度学习的图像文字识别,2018年大学生创新创业训练计划项目优秀结题 我的团队 华南理工大学电信学院“深度学习与视觉计算团队”现有教授3人,副教授4人,副研究员1人。团队致力于人工智能、计算机视觉、模式识别领域的前沿理论技术的研究及创新应用,主要研究方向包括深度学习、人工智能、文字识别、文档图像分析与识别、图像及视频处理、人体运动行为分析与理解等。团队近年来先后主持了国家及省部级科研项目30余项,在光学字符识别(OCR)、手写识别、手势识别及交互技术、深度学习创新应用等方面取得了不少国际国内领先的研究成果,发表SCI/EI论文200余篇,获得授权发明专利近50项,获得省部级科技奖5次,国际学术竞赛第一名3次。部分研究成果曾先后与微软、三星、富士通、腾讯、搜狗、科大讯飞、江苏卫视等知名企业合作。

杨永