硕士生导师 王亚强 简介
【个人简介】
王亚强,中共党员,博士,副教授,清华大学高级访问学者,主要从事自然语言处理、机器学习及医学交叉领域应用研究。现任数据科学与工程研究所所长、数据科学与工程系党支部书记、主任、软件自动生成与智能服务四川省重点实验室主要成员,2012年至今,国际计算语言学会(ACL)会员,2016年至今,中国计算机学会(CCF)专业会员,2019年8月至今,CCF会员代表。现为国家自然科学基金项目评议专家,浙江省、江苏省等省部级科技项目评审专家,成都市科技项目评审专家,Journal of Biomedical Informatics、Journal of Cheminformatics、ACM TALLIP、JCST、Journal of Biomedical Semantics、Patterns(Cell Press)、NLPCC(2020、2021、2022、2023)、AMIA(2019、2020、2021)、BIBM(2012、2013)等十余个国内外重要期刊和会议审稿人,NLPCC 2020、2021、2022和2023程序委员会委员,2014年和2017年获Journal of Biomedical Informatics审稿人杰出贡献奖。第一作者发表国内外重要期刊和会议论文17篇(他引188次,单篇最高70次),第一发明人获授权发明专利8项。主持国家重点研发计划项目子课题、国家自然科学基金、四川省重点研发课题等国家级和省部级项目以及各类横向项目近20项。获四川省科技进步奖一等奖、二等奖、吴文俊人工智能技术发明三等奖、中国产学研合作创新成果一等奖、成都市“科创杯”大数据应用设计大赛二等奖各1项。
【研究方向】
1.自然语言处理:语料构建、知识获取、信息抽取、语义依存分析;
2.机器学习:自监督学习与弱监督学习;
3.医学交叉领域应用研究:临床医学数据处理与分析;
4.软件工程:分布式敏捷开发方法。
【在研项目】
1.面向多场景域语义协同的分布式开发框架研究,国家重点研发计划子课题(2022YFB3305102),项目负责人
2.数据驱动的围术期风险智能实时预警模型与算法研发,四川大学华西医院学“科卓越发展1·3·5工程”交叉学科创新项目课题,项目负责人
3.围术期风险评估预警研究数据治理,四川大学华西医院学“科卓越发展1·3·5工程”交叉学科创新项目课题,项目负责人
4.中医临床记录的依存语义分析方法研究,永利总站ylzz55科技创新能力提升计划青年创新(领军)项目(KYQN202209),项目负责人
【完成项目】
1.基于弱监督学习的细粒度中医临床医学实体识别方法研究,国家自然科学基金青年基金项目,项目负责人
2.基于本体的中医疾病历史演化模型研究,国家自然科学基金青年基金项目,合作单位项目负责人
3.基于新一代人工智能的跨媒体感知与分析关键技术与应用研究,四川省人工智能重大科技专项,课题负责人
4.智能存储中近数据AI处理研究,清华大学科研项目,项目负责人
5.基于SOA的领域大数据分析开发平台关键技术研究,四川省科技计划项目(应用基础计划),项目负责人
6.睡眠障碍中西医知识图谱构建支撑系统研究,企业横向项目,项目负责人
7.基于DL4J的深度神经网络技术研究与应用,企业横向项目,项目负责人
8.基于DeLone&McLean模式的电子健康档案综合评价体系研究,国家自然科学基金面上项目,项目参与人
9.基于动力系统的L1范数矩阵低秩分解及其应用研究,国家自然科学基金面上项目,项目参与人
10.信息化支撑软件与数据挖掘四川省青年科技创新团队,四川省专项计划项目,项目参与人
【学术专著】
1.网络安全中的大数据分析,国防工业出版社,2023,译著
2.软件实训工程,西南交通大学出版社,2020,第二主编
【发表论文】
1.中医临床切诊信息抽取与词法分析语料构建及联合建模方法,第二十二届中国计算语言学大会,2023,EI检索、国内顶级学术会议,第一作者、通讯作者
2.非结构化数据表征增强的术后风险预测模型,中文信息学报,2023,CCF推荐中文科技期刊T1类,第一作者
3.基于批数据过采样的中医临床记录四诊描述抽取方法,中文信息学报,2023,CCF推荐中文科技期刊T1类,第一作者
4.A Curriculum Batching Strategy for Automatic ICD Coding with Deep Multi-Label Classification Models,《Healthcare》,2022,SCI检索(影响因子:3.16,中科院分级:4区,华西 D类),第一作者、通讯作者
5.一种非结构化数据表征增强的术后风险预测模型,第二十一届中国计算语言学大会,2022,EI检索、国内顶级学术会议,第一作者、通讯作者
6.基于批数据过采样的中医临床记录四诊描述抽取方法,第二十一届中国计算语言学大会,2022,EI检索、国内顶级学术会议,第一作者、通讯作者
7.Information Extraction from the Text Data on Traditional Chinese Medicine: A Review on Tasks, Challenges, and Methods from 2010 to 2021,《Evidence-Based Complementary and Alternative Medicine》,2022,SCI检索(影响因子:2.65,中科院分级:4区,华西E),通讯作者
8.Label Embedding Enhanced Multi-Label Sequence Generation Model,In Proceedings of the 9th CCF International Conference on Natural Language Processing and Chinese Computing (NLPCC 2020),2020,EI检索(CCF C类)、国内外顶级学术会议,第一作者、通讯作者
9.Constructing fine-grained entity recognition corpora based on clinical records of traditional Chinese medicine,《BMC Medical Informatics and Decision Making》,2020,SCI检索(影响因子:3.298,中科院分级:3区,华西E),并列第一作者、通讯作者
10.Supervised methods for symptom name recognition in free-text clinical records of traditional Chinese medicine: an empirical study,《Journal of Biomedical Informatics》,2014,SCI检索(影响因子:8.0,中科院分级:2区,CCF C类,华西 C类,清华 B类),第一作者
11.A framework and its empirical study of automatic diagnosis of traditional Chinese medicine utilizing raw free-text clinical records,《Journal of Biomedical Informatics》,2012,SCI检索(影响因子:8.0,中科院分级:2区,CCF C类,华西 C类,清华 B类),第一作者
12.Automatic symptom name normalization in clinical records of traditional Chinese medicine,《BMC Bioinformatics》,2010,SCI检索(影响因子:3.307,中科院分级:2区,CCF C类,华西 D类,清华 B类),第一作者
13.On learning better embeddings from Chinese clinical records: study on combining in-domain and out-domain data,In Proceedings of the 2018 Workshop on Biomedical Natural Language Processing,2018,EI检索、生物医学自然语言处理领域重要国际会议,第一作者
14.A preliminary work on symptom name recognition from free-text clinical records of traditional Chinese medicine using conditional random fields and reasonable features,In Proceedings of the 2012 Workshop on Biomedical Natural Language Processing,2012,EI检索、生物医学自然语言处理领域重要国际会议,第一作者
15.An Empirical Investigation on Fine-Grained Syndrome Segmentation in TCM by Learning a CRF from a Noisy Labeled Data,《Journal of Advances in Information Technology》,2018,EI检索,第一作者
16.级联式低消耗大规模网页分类在线获取方法,《计算机应用》,2017,中文核心期刊,第一作者
17.基于关联规则的中医症状组团分析,《四川大学学报(自然科学版)》,2009,中文核心期刊,第一作者
18.A Multicenter Prospective Study on Postoperative Pulmonary Complications Prediction in Geriatric Patients with Deep Neural Network Model,《Frontiers in Surgery》,2022,SCI检索(影响因子:2.568,中科院分级:3区),第四作者
【授权专利】
1.一种通用字符串相似性度量框架的构建方法,2019,国家发明专利,授权,第一发明人
2.一种中医细粒度证候名分隔的远程监督方法,2020,国家发明专利,授权,第一发明人
3.一种基于贝叶斯统计学习的医学古汉语句子切分方法,2020,国家发明专利,授权,第一发明人
4.一种基于部分监督学习的中文概括性文本切分方法,2020,国家发明专利,授权,第一发明人
5.中医临床辅助辨证模型的建立方法及系统,2021,国家发明专利,授权,第一发明人
6.一种基于课程学习的多标签国际疾病分类训练方法,2022,国家发明专利,授权,第一发明人
7.一种文章题目自动生成方法,2022,国家发明专利,授权,第一发明人
8.一种术后风险预测自然语言数据增强模型及方法,2022,国家发明专利,授权,第二发明人
9.一种基于半马尔可夫的联合识别和规范化中医症状名的方法,2023,国家发明专利,授权,第一发明人
【获奖情况】
1.面向高空高速空基平台的多图像联合小样本跟踪识别理论技术与系统,四川省科技进步一等奖,2020年
2.大数据环境下软件智能开发技术研发及应用,吴文俊人工智能科学技术奖技术发明三等奖,2019年
3.基于TB级数据架构的需求设计开发一体化软件工程智能技术研发及行业应用,中国产学研合作创新成果一等奖,2018年
4.基于服务体系架构的软件开发平台研发及行业应用,四川省科技进步二等奖,2017年
5.Outstanding Reviewer,Journal of Biomedical Informatics,2017年
6.成都市“科创杯”大数据应用设计大赛二等奖,2015年
7.Outstanding Reviewer,Journal of Biomedical Informatics,2014年
【联系方式】
电子邮件:yaqwang@cuit.edu.cn
个人网站:http://www.peeryair.com
【发表论文】
【获奖情况】
【联系方式】