基于多源数据的美国出口管制分析框架及其实证研究
Analysis Framework Based on Multi-Source Data for US Export Control:An Empirical Study作者机构:北京大学信息管理系北京100871
出 版 物:《数据分析与知识发现》 (Data Analysis and Knowledge Discovery)
年 卷 期:2020年第4卷第9期
页 面:26-40页
核心收录:
学科分类:1205[管理学-图书情报与档案管理] 0810[工学-信息与通信工程] 081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家社会科学基金重大项目“大数据时代知识融合的体系架构、实现模式及实证研究”(项目编号:15ZDB129)的研究成果之一
主 题:多源数据融合 出口管制 商业管制清单 多维度分析框架
摘 要:【目的】针对目前对美国出口管制分析的不足,提出一种融合多源数据、深入文本语义内容的美国出口管制信息的多维分析框架,构建细粒度美国出口管制信息分析模式,为数据分析工作者提供参考。【方法】本文提出的框架基于多源数据融合思想,除了使用《出口管理条例》、《商业管制清单》,还使用实体清单等黑名单、与出口管制相关的联邦公报。识别多源数据中的技术名词、技术指标和受控物品关系;通过语义词典和语义模型构建语义索引;针对实体清单等黑名单数据,利用命名实体识别等方法构建个体与物品之间的关联关系;在此基础上,本框架包含管制现状分析、具体物品分析、时序分析、国家受控分析等4种分析模式。【结果】为验证框架的有效性,以光刻机为例,对框架及其实现进行实证研究,通过人工复核检验了框架实现方法的可行性和实用性,光刻机识别召回率在识别同尾号情况下为97.3%,中国大陆的个体领域识别准确率为83.8%。【局限】仅选取光刻机这一受控对象进行实证研究;框架实现方法还有进一步改进的空间。【结论】本文框架可以对美国出口管制做出全面、准确、有效、快速的分析,利用多源数据提供有关美国出口管制的细粒度知识,可为出口管制的文本情报分析工作提供借鉴。