基于曲线拟合和动态阈值的海洋数据异常检测方法
作者机构:上海海洋大学信息学院 国家海洋信息中心
出 版 物:《海洋科学进展》 (Advances in Marine Science)
年 卷 期:2025年
核心收录:
学科分类:08[工学] 0816[工学-测绘科学与技术]
基 金:国家重点研发计划项目(2021YFC3101601)
摘 要:针对当前海洋数据质量控制方法的准确率不足和未充分考虑要素间关联的局限性等问题,提出了一种基于曲线拟合和动态阈值的海洋数据异常检测方法,用于提升对海温剖面数据的异常数据检出能力。该方法融合了密度聚类算法、曲线拟合技术和自适应阈值调整策略。首先,运用密度聚类算法对海温数据进行分割,筛选出最大簇集,该集群被假设为近似正常数据集。随后,利用曲线拟合技术对最大簇中的海温与水深数据进行建模,生成相应的曲线函数,进而计算原始数据与预测值之间的残差。最后,计算不同水深下的最大温差,并建立温差与水深的关系模型,用于动态调整判别阈值,从而实现对异常数据点的精确检测。实验结果表明,相比目前的业务化质控方法和机器学习技术,本文提出的方法在西太平洋3个区域的定点海温剖面观测数据上均表现出显著优势,F1分数高达99.53%。该方法的应用不仅可提高海温数据异常检测的精确度,也可为海洋科学研究提供有力的技术支撑。