机器学习在西北太平洋热带气旋生成前期大尺度环流场分型与识别中的应用
Applying Machine Learning in Clustering and Discriminant Analysis of Large-Scale Circulation Patterns Favorable for Tropical Cyclogenesis over the Western North Pacific作者机构:中国科学院大气物理研究所云降水物理与强风暴重点实验室北京100029 中国科学院大学北京100049 贵州省山地环境气候研究所贵阳550002
出 版 物:《大气科学》 (Chinese Journal of Atmospheric Sciences)
年 卷 期:2024年第48卷第2期
页 面:671-686页
核心收录:
学科分类:07[理学] 070601[理学-气象学] 0706[理学-大气科学]
基 金:国家重点研发计划项目2017YFC1501901 国家自然科学基金项目42175073、41975071
主 题:大尺度环流型 自组织映射网络 支持向量机(SVM) 热带气旋
摘 要:基于1979~2020年6~11月的热带气旋最佳路径(IBTrACS)和欧洲中期天气预报中心的第五代再分析(ERA5)资料,本文根据以热带气旋(TC)生成位置为中心的850 hPa水平风场特征,采用自组织映射网络(SOM)将西北太平洋TC生成前期的低层大尺度环流场分为5型:季风辐合型(MC)、季风涡旋型(MG)、强季风槽型(SMT)、弱季风槽型(WMT)及东风波型(EW)。MC型TC生成于副热带高压南侧辐合带中,占比最高;MG、SMT与WMT三型的TC生成受季风槽相关的气旋性切变或辐合区影响;EW型TC由东风波增幅发展生成,占比最小。在对历史资料分型的基础上,为选取合适的机器学习方法用于TC环流型的自动识别,本文还对比分析了支持向量机(SVM)、k近邻(KNN)及随机森林(RF)三种方法的识别效果,结果表明:SVM的准确率达0.965,对五类环流型识别的召回率和精确率均达到0.94以上,对样本不均衡问题不敏感,并且对样本量的敏感性分析显示其在有限样本量下即可充分学习各型的环流场特征,识别效果明显优于KNN和RF。