Computer Science and Application
Vol. 09  No. 02 ( 2019 ), Article ID: 29064 , 8 pages
10.12677/CSA.2019.92050

Research on Risk Identification and Early Warning of Border Minority Crimes Based on RSM Analysis

Shaobing Wu1, Changmei Wang2, Haoshun Cao1

1College of Information Network Security, Yunnan Police College, Kunming Yunnan

2College of Energy and Environmental Sciences, Yunnan Normal University, Kunming Yunnan

Received: Feb. 9th, 2019; accepted: Feb. 21st, 2019; published: Feb. 28th, 2019

ABSTRACT

Based on the collection of crimes committed by ethnic minorities in the border areas, this paper fills in and completes the data. Response surface (RSM) analysis method and C# are used to realize risk identification and early warning of ethnic minority crimes. Through response surface (RSM) analysis, modeling, regression equations are established, and the factors affecting minority crimes in border areas are obtained. These crime reason items are designed as key information. By inputting the relevant information of the relevant personnel, the system automatically calculates the probability of the person’s crime risk, and makes an early warning judgment on the person under a predetermined threshold.

Keywords:RSM, C# Implementation, Ethnic Minority Crime, Risk Identification

基于RSM分析的边疆少数民族犯罪风险识别及预警研究

吴绍兵1,王昌梅2,曹好顺1

1云南警官学院,信息网络安全学院,云南 昆明

2云南师范大学,能源与环境科学学院,云南 昆明

收稿日期:2019年2月9日;录用日期:2019年2月21日;发布日期:2019年2月28日

摘 要

本文在收集边疆少数民族犯罪案例的基础上,通过数据填补和完备。利用响应曲面(RSM)分析方法和C#实现了少数民族犯罪风险识别及预警研究。通过响应曲面(RSM)分析,进行建模,建立回归方程,并得出影响边疆少数民族犯罪的因素。将这些犯罪原因项设计成关键信息,利用这些信息,系统自动计算出该人的犯罪风险概率,在预先给定的阈值情况下,对该人进行预警判断。

关键词 :RSM,C#实现,少数民族犯罪,风险识别

Copyright © 2019 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

1. 引言

2019年1月21日,习近平总书记在省部级主要领导干部坚持底线思维着力防范化解重大风险专题研讨班开班式上发表重要讲话,强调要坚持底线思维,增强忧患意识,提高防控能力,着力防范化解重大风险,保持经济持续健康发展和社会大局稳定。维护国家安全和社会大局稳定,是时代赋予我们的重要任务,如何保持边疆少数民族地区的繁荣稳定,是我们应该关注的重要问题。

人工智能时代,人们对安全和犯罪也更加关注,孙笛 [1] 提出了人工智能时代的犯罪风险分析,该文主要是基于技术、监管与融合的视角,指出应从限制人工智能研发应用的领域、提高人工智能系统数据和算法的客观性、完善行业自律准则与法律政策以及通过一系列具体措施实现犯罪防控与人工智能的深度融合四个方面采取有效的防控对策。给出了在人工智能时代,如何进行犯罪风险分析的一个框架式的思路。

在进行犯罪风险预测的过程中,构建模型所使用的训练数据的质量直接决定了最终预测结果的准确性,如何选择与预测结果相关的有效指标信息成为建立模型的关键。王雨晨 [2] 等介绍了一种对于数据噪声鲁棒、预测结果准确且稳定的组合分类算法——随机森林(Random Forest),应用于犯罪信息指标集合的选取与犯罪风险的预测中,给犯罪风险识别研究一个很好的借鉴和参考。

研究犯罪风险,找寻和识别犯罪风险源,西南政法大学的师索 [3] 在犯罪与风险研究论纲一文中给出了犯罪风险源包括人造风险、发展性风险、人性风险以及激发性风险,并指出了犯罪和风险发生各种关系。为进一步研究犯罪风险,预测犯罪,提供了一个新思路。

在大数据时代,进行数据分析时,常常需要研究响应变量y究竟如何依赖于自变量x,从而找到自变量的设置,使得响应变量得到最佳值。响应曲面方法就是其中最好的方法之一 [4] 。

邓聪颖 [5] 等针对加工空间机床动态特性的准确预测问题,提出一种基于响应曲面理论的数控机床空间动态特性研究方法。该方法以数控机床固有频率这一关键动力学性能指标为例,分析机床整机动态特性与机床位置姿态之间的数学关联关系;基于正交试验设计和响应曲面方法理论,构建预测广义加工空间数控机床动态性能变化的响应曲面模型。表明了响应曲面方法在数控机床领域得到了很好的应用。

以上作者对于犯罪风险的研究和分析,要么是基于政策的角度去分析研究,给出宏观对策和建议,要么是建立犯罪风险模型,给出犯罪预测的思路。响应曲面方法在数控机床领域得到了很好的应用,但未见RSM方法在少数民族犯罪中的应用报道。给我们研究边疆少数民族犯罪提供了很好的思路和参考。

但是这些对于基层政法干警来说,不够实用,可操作性不强。为此,本文通过收集的边疆少数民族犯罪案例数据,在结合实际田野调研经验和办案民警的经验基础上,利用Minitab和响应曲面(以下简称RSM)方法建立相关数学模型,采用Visual studio之C#和Minitab开发了边疆少数民族犯罪风险识别及预警系统软件。

该软件采用C#作为前端的界面和模块的设计,后台采用Access实现。在收集的11,326个边疆少数民族犯罪案例的基础上,通过数据预处理、数据完备性填补、删减,形成完备的数据,便于进一步的分析。通过响应曲面(RSM)分析,建立回归方程,并得出影响边疆少数民族犯罪的因素。将这些犯罪原因项设计成关键信息,通过输入相关人员的这些信息,系统自动计算出该人的犯罪风险概率,在预先给定的阈值情况下,对该人进行预警判断。该软件界面操作简单、可视化和易使用,为相关人员进行犯罪预测提供重要的参考。

2. MINITAB简介

MINITAB软件是MINITAB公司开发的一款专用数据处理软件,MINITAB以其简洁的操作界面和强大的统计功能已经成为质量统计领域与六西格玛方法的常用软件,它的实验设计操作简单、方便易用 [4] 。它包含了丰富的统计数据信息,既可以进行数据分析处理,又可以进行图形分析对比,同时对未来加以预测。MINITAB的核心功能之一就是进行数据分析处理,其功能强大、快速便捷。涵盖了统计技术的基本统计、回归分析、方差分析、实验设计分析、控制图、质量工具和可靠性工具等 [6] 。

3. 数据收集与预处理

3.1. 数据收集

本实验所收集的数据来自中国裁判文书网,收集了2014~2017年,云南省部分县市少数民族犯罪案例。对收集的非结构化数据,我们通过python软件,从非结构化的信息中提取除结构化的数据。在数据预处理时,首先删除民族为空和民族为汉族的数据,其次删除,犯罪类型为空的数据。接着对不完备的数据根据相似性原则,进行补全。最后,所获数据为11,326条。

3.2. 数据编码

通过收集的11,326条数据,先对数据进行编码,按照民族人口和案例中的民族数量,分别将彝族、傣族、白族、壮族等依次编码为25、24、23、…、直到2;将性别男编码为3,女编码为2;职业中无业编码为6、农民编码为5、工人(含个体户、驾驶员等)编码为4、公职人员编码为3、学生编码为2;文化程度:小学编码为6、文盲编码为5、初中编码为4、高中或中专编码为3、大专及以上编码为2;年龄采用整数值;根据犯罪类型数量的多少,依次将盗窃罪编码为130、与毒品一个的犯罪类型编码为120;危险驾驶罪编码为110。详见表1表5

Table 1. Gender coding table

表1. 性别编码表

Table 2. Educational degree code table

表2. 文化程度编码表

Table 3. Occupational coding table

表3. 职业编码表

Table 4. Ethnic code table

表4. 民族编码表

Table 5. Crime type code table

表5. 犯罪类型编码表

4. 模型建立

4.1. 响应曲面方法设计实验

响应曲面方法进行实验时,常见的有两种方法:中心复合设计(Central composite design, CCD)与Box-Behnken设计。

中心复合设计整个实验由三部分:立方体点、中心点和星号点等构成。根据星号点的设置和位置的不同中心复合设计(CCD)又有三种形式:中心复合序贯设计(Central composite circumscribed design, CCC)、中心复合有界设计(Central composite inscribed design, CCI)和中心复合表面设计(Central composite face-centered design, CCF)。

Box-Behnken设计是将因子各实验点取在立方体的棱的中点上,和中心复合设计类似,它也具有近似旋转性,但没有序贯性。它与中心复合设计的特点比较如下表6所示:

Table 6. Comparison of features between central composite design (CCD) and Box-Behnken design

表6. 中心复合设计(CCD)与Box-Behnken设计的特点比较

响应曲面分析方法主要有以下几步 [4] :

第一步:浏览数据

浏览一下数据的基本情况,观察是否有异常的数据存在,是否有手工输入错误的数据。

第二步:拟合模型

在minitab软件中采用“统计 → DOE → 响应曲面 → 分析响应曲面设计”(Stat → DOE → Response Surfac → Analyze Response Surface Design)窗口中选定安全模型后,在运行窗口中可得到计算结果。

第三步:简化模型

操作同上,在minitab软件中采用“统计 → DOE → 响应曲面 → 分析响应曲面设计”(Stat → DOE → Response Surface → Analyze Response Surface Design),把响应项移入响应栏内进行操作即可。

第四步:残差诊断

在minitab软件中采用“统计 → DOE → 响应曲面 → 分析响应曲面设计”(Stat → DOE → Response Surface → Analyze Response Surface Design),点击项(Terms),选择相关项,点击确定(OK),回到分析响应曲面设计窗口。选择图形(Graphs),在残差图,单击相关选项,按确定(OK),即可进行残差分析。

第五步:判断模型是否合适,需要改进吗?

如果合适,输入相关项和对应的系数。

根据这些项和对应的系数,带入下面的二次多元回归拟合方程中,即可得出回归方程:

y = β 0 + i = 1 7 β i x i + i = 1 7 β i i x i 2 + i = 1 2 j = 1 7 β i j x i x j (1)

式中:y代表响应值;β0、βi、βii表示偏移项、线性偏移和二阶偏移系数;βij是交互效应系数;xi-各因素的编码值。以x1,x2,x3,x4,x5,x6,x7为自变量,y为响应值。

4.2. 响应曲面分析

利用Minitab软件,按照“Minitab–统计–DOE–响应曲面–分析响应曲面设计”的顺序,对中心复合设计实验结果进行响应曲面分析,分析结果见表7所示。从表6中可以看出,x4即职业对少数民族犯罪有显著的影响,而且曲面效应x1 * x2,x1 * x3,x1 * x4和x1 * x4都很显著。表明在性别与年龄、民族和职业,以及年龄和职业对少数民族犯罪的影响显著。

Table 7. Regression coefficient and significance of quadratic equation model

表7. 二次方程模型回归系数和显著性

注:“+”表示对应项影响显著。

4.3. 响应曲面方程的建立

根据实验分析结果得到的各因素效应系数,建立少数民族犯罪对无个显著影响因素的多元二次方程。

分别将性别(x1)、年龄(x2)、民族(x3)、职业(x4)和文化程度(x5)作为自变量,犯罪类型(y)作为因变量,在上述编码的基础上,采用minitab中的回归分析及响应曲面分析,得出其回归方程模型如下:

y = 65.56 3.79 x 1 + 5.4 x 2 + 3.66 x 3 + 52.38 x 4 1.26 x 5 + 27.12 x 2 2 9.50 x 3 2 17.26 x 4 2 2.54 x 5 2 12.94 x 1 x 2 + 8.15 x 1 x 3 9.91 x 1 x 4 + 0.19 x 1 x 5 2.28 x 2 x 3 + 20.83 x 2 x 4 12.09 x 2 x 5 4.67 x 3 x 4 + 0.61 x 3 x 5 0.50 x 4 x 5

籍贯(本地户口、外来人口和境外人员)根据数据样本在总样本中出现的概率情况,分别赋予一定的权值,将一个人是否具有人格障碍、反社会性、法律意识,以及是否知晓法制宣传教育制度和办案民警的经验等,分别通过专家打分的形式,赋予不同的权值,作为模型的一部分,从而使得建立的模型,更加准确。

在建立模型的基础上,系统自动计算出犯罪风险识别概率和积分,在预先给定的阈值情况下,给出是否关注的预警提示。

5. 边疆少数民族犯罪风险识别及预警的编程实现

根据上面响应曲面设计方程,结合上面的算法思想,利用C#设计边疆少数民族犯罪风险识别及预警系统界面,在该界面中,依次选择民族、性别、职业、学历和籍贯(本地人口或外地人口),输入年龄,选择“人格障碍”、“法律意识”、“反社会性”、“法律宣传教育制度”和输入专家经验的分数。单击“计算”按钮,系统会自动计算出输入相关特征信息后,该人的犯罪风险概率、当概率大于一个预先给定的阈值后,系统会给出预警提示。选择不同的参数,输入不同的值后,得出的犯罪风险概率值不同。如图1图2所示。

Figure 1. Probability and warning of the crime risk of ethnic minorities in border areas

图1. 边疆少数民族犯罪风险的概率及预警提示

Figure 2. Probability and warning of the crime risk of ethnic minorities in border areas

图2. 边疆少数民族犯罪风险的概率及预警提示

6. 结语

本文提出的采用响应曲面(RSM)技术及C#来开发的少数民族犯罪风险识别及预警系统,在大数据分析的基础上,建立数学模型,编程实验求解,同时在系统中,引入了“人格障碍”、“反社会性”、“法律意识”和“法律宣传教育制度”以及有经验民警和专家打分的“专家经验”值。使得该系统的预警更加科学合理,利于指导实践,使得民警在打击犯罪进行犯罪风险识别与预警中进行科学预判。

与其他方法不同的是,未见利用RSM和MINITAB对少数民族犯罪进行分析研究,同时未见少数民族犯罪风险识别和预警的报道。本文的研究,作为一个尝试,收到了非常好的效果。

基金项目

国家社会科学基金项目(13CFX038);云南省教育厅科学研究基金项目(2013C188);云南警官学院教育教学改革项目(2018YJJGB01)。

文章引用

吴绍兵,王昌梅,曹好顺. 基于RSM分析的边疆少数民族犯罪风险识别及预警研究
Research on Risk Identification and Early Warning of Border Minority Crimes Based on RSM Analysis[J]. 计算机科学与应用, 2019, 09(02): 442-449. https://doi.org/10.12677/CSA.2019.92050

参考文献

  1. 1. 孙笛. 人工智能时代的犯罪风险分析[J]. 中国人民公安大学学报(社会科学版), 2018, 164(4): 11-16.

  2. 2. 王雨晨, 过仲阳, 王媛媛. 基于随机森林的犯罪风险预测模型研究[J]. 华东师范大学学报(自然科学版), 2017(4): 89-96.

  3. 3. 师索. 犯罪与风险研究论纲——风险社会视野下的犯罪治理[J]. 中南大学学报(社会科学版), 2011, l7(6): 83-91.

  4. 4. 闵亚能. 实验设计(DOE)应用指南[M]. 北京: 机械工业出版社, 2011.

  5. 5. 邓聪颖, 刘蕴, 殷国富. 基于响应曲面方法的数控机床空间动态特性研究[J]. 工程科学与技术, 2017, 49(4): 211-218.

  6. 6. 王会良, 朱德荣, 桂斌, 杨进濮. MINITAB软件在工序质量控制中的应用[J]. 煤矿机械, 2006, 27(10): 114-116.

期刊菜单