4月23日晚,数聚西海岸科学讲堂——研究生讲坛第216期在J5-302成功举行。数学学院2022级1班硕士王晓哲作了题为“基于生成对抗网络的不平衡数据处理”的报告。本次点评嘉宾是数学学院张玉林老师。学院20余名本科生和研究生参加了此次讲坛,本次讲坛由科技部宋晓晶主持。
在本次研究生讲坛中,主讲人王晓哲主要讲述了基于生成对抗网络的不平衡数据处理问题。首先,王晓哲介绍了不平衡数据,以电信诈骗、银行信贷等进行举例,表明少数类样本通常比多数类样本更具研究价值。其次,王晓哲讲述了不平衡数据的研究难点,不平衡比大、样本稀少、类间结构复杂和类内分布不均等。同时还介绍了现有的处理不平衡数据的三大类方法,即数据层面的采样方法、算法层面的代价敏感学习方法以及集成学习方法。接下来,王晓哲又讲述了生成对抗网络的基本原理、基本结构、优势。最后,王晓哲总结了使用生成对抗网络的几种策略,例如使用多类样本生成少类样本、在生成器中加入先验信息、在整体结构上使用集成方法等,这些策略从各个角度提高了生成高质量样本的概率。
报告结束后,张玉林老师对此次报告作出了详细的点评。(通讯员:董媛媛 王琪玮)