基于数据挖掘技术的犯罪行为分析
作者单位:中山大学
学位级别:硕士
导师姓名:孙伟
授予年度:2014年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
摘 要:当前,我们的社会在经济政治和科学技术等方面,都在的经历巨大的改变。社会的发展虽然给我们的生活带来了许许多多的便利,但是,形形色色的违法犯罪行为也时常出现在我们身边。这些呈现出高科技化、团伙化、智能化的犯罪行为严重影响这我们正常生活秩序。长久以往,更是阻碍社会和谐发展一大障碍。长年累月下来,监狱改造信息管理系统中积累了大量的犯罪人员相关数据。然而,该如何利用好这些已有的犯罪人员相关数据,实现对犯罪行为的有效分析和管控,是摆在监狱管理人员面前的一大难题,也是监狱系统迫切需要研究的课题。本文尝试利用数据挖掘及相关计算机技术,先建立数据仓库把犯罪人员相关信息按照主题进行分类存储,形成较为一致的形式,然后选取一种合适的算法大量地进行分析犯罪行为记录,从而通过聚类得到的结果来发现罪犯的共同特征和产生关联规则来了解各种不同的犯罪行为之间的一些必然的或者有规律可寻的联系,预测此种犯罪行为会在什么样的状态下被诱发。 首先,本文从数据挖掘技术的研究现状出发,基于监管改造信息管理系统收集的罪犯的姓名、别化名、性别、政治面貌、户口、犯罪类型、婚姻状况、捕前学历等建立基础数据库,并对这些行为数据进行数据的预处理。透过犯罪行为分析系统的需求分析,论文尝试设计出系统的整体框架和其他相关功能模块。结合聚类算法与关联规则算法,运用Eclipse和Membase数据库设计了犯罪行为分析系统。 其次,根据系统的设计目标,具体介绍了聚类技术。并运用了Apriori算法对监管改造信息管理系统收集的50多万条数据进行聚类。提取了罪犯的犯罪类别、姓名、年龄、捕前学历、政治面貌、婚姻状况、户口分类、团伙人数、捕前职业等9个属性进行聚类,分为7个大类,得到不同类型的犯罪行为差异性比较大。如第5类聚类所得出的相似特征是具有高学历的嫌疑人群倾向于进行高智商团伙犯罪。把犯罪的类型相同的罪犯加以归类,如此一来,执法机关就可以从大量的不相同的犯罪特征中找出类似的犯罪特征以及重点嫌疑人群,从而从技术上支持案件的侦破。 再次,论文尝试在已有纵向分析的基础上,深入研究不同种犯罪行为之间的横向关联。本文介绍了关联规则的概念以及关联规则的相关算法,采用了Apriori算法进行两方面的关联分析。第一,类与类之间,即犯罪行为与犯罪行为之间的分析,产生了一些强规则,如:盗窃抢劫、掩饰罪隐瞒犯罪等。这些规则可以帮助监狱警察对服刑人员的开展针对性的教育改造活动。第二,类内之间,即犯罪行为及其罪犯的各类属之间的关联分析。通过挖掘频繁模式,可以获得在不同的状态下会诱发不同的犯罪行为信息,如:18岁以下,在状态(男性、农村户口、群众、中专生等)下犯诈骗罪的可能性多大。 本文分析了监狱罪犯的犯罪行为,可以总结和归纳出各种犯罪行为的成因,形成各类专题的报告,为社会治安综合治理和监狱罪犯改造提供数据参考。