成分数据典型相关分析的增量算法
Incremental computing methods of canonical correlation analysis for compositional data streams作者机构:北京航空航天大学数学科学学院北京100191 中央财经大学统计与数学学院北京100081 北京航空航天大学经济管理学院北京100191 城市运行应急保障模拟技术北京市重点实验室北京100191
出 版 物:《北京航空航天大学学报》 (Journal of Beijing University of Aeronautics and Astronautics)
年 卷 期:2023年第49卷第10期
页 面:2851-2858页
核心收录:
学科分类:02[经济学] 0202[经济学-应用经济学] 020208[经济学-统计学] 07[理学] 0714[理学-统计学(可授理学、经济学学位)] 070103[理学-概率论与数理统计] 0701[理学-数学]
基 金:国家自然科学基金(72021001 72001222)
主 题:成分数据 典型相关分析 数据流 协方差矩阵 特征分解
摘 要:成分数据典型相关分析(CCAI)是一种研究多个成分数据变量之间线性相关关系的方法,在经济、管理、地质、化学等多个领域应用广泛。在海量数据背景下,研究如何针对成分数据流展开典型相关建模分析,具有重要的理论意义和实用价值。为此,提出了成分数据典型相关分析的增量方法,通过对增量成分数据的协方差分解,实现对成分数据流典型相关性的精确计算。同时,给出序贯式和并行式2种分块增量算法,可处理多组成分数据的数据流建模问题,序贯式分块增量算法,按照数据流的先后顺序进行计算,并行式分块增量算法可以达到提高计算效率的目的。通过对不同概率分布和样本规模的成分数据流的仿真研究及微博假新闻的实例分析,验证了所提算法相比于传统的非增量算法,在保证计算准确性的前提下,具有提高运算效率的优势。