波士顿犯罪数据时空分析及可视化 |
您所在的位置:网站首页 › 漠河大火事件犯罪案例分析 › 波士顿犯罪数据时空分析及可视化 |
文章目录
前言一、数据描述二、数据预处理三、犯罪时空分析1.犯罪类型分析2.犯罪时间特征分析(1)基于年维度(2)基于月维度(3)基于日维度
3.犯罪空间特征分析
四、基于犯罪空间理论的结论
前言
波士顿作为美国马萨诸塞州的首府和最大城市,美国新英格兰地区最重要的城市,被称为美国的雅典,是公认的世界性大城市,长期以来却被犯罪问题所困扰。选取的数据集由波士顿警察局提供,其中记载了波士顿市2015年到2018年犯罪案例。根据其中信息,可以针对波士顿城市犯罪问题展开相关分析研究。 数据来源:https://www.kaggle.com/datasets/AnalyzeBoston/crimes-in-boston 一、数据描述数据集共319073条数据,由17个特征字段组成 INCIDENT_NUMBER 事件编号 OFFENSE_CODE 犯罪代码 OFFENSE_CODE_GROUP 犯罪代码组 OFFENSE_DESCRIPTION 犯罪行为描述 DISTRICT 犯罪地区 REPORTION_AREA 犯罪报告区域 SHOOTING 是否发生枪击 OCCURRED_ON_DATE 犯罪发生日期 YEAR 年份 MONTH 月份 DAY_OF_WEEK 星期 HOUR 小时 UCR_PART 案件发生警区 STREET 案件发生街道 Lat 纬度 Long 经度 Location 位置 二、数据预处理missingno是一个可以将缺失值情况进行可视化的第三方库,利用该库查看数据集特征值缺失情况 代码如下(示例): %matplotlib inline import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt from matplotlib.font_manager import FontProperties import seaborn as sns myfont1 = FontProperties(fname = "simhei.ttf",size=18) myfont2 = FontProperties(fname = "simhei.ttf",size=12) #导入数据集 crime_boston = pd.read_excel(r'D:\dataset\crime.xlsx',sheet_name='crime') #绘制缺失值热图 import missingno as msno msno.matrix(crime_boston,labels=True)结果如下: 数据集中“OFFENSE_CODE_GROUP”(犯罪代码组)特征对犯罪类型划分粒度较为合适,因此选定该字段作为各犯罪类型划分标准。通过groupby()函数对犯罪类型进行分类汇总,共计67种分类。 df = crime_boston.groupby('OFFENSE_CODE_GROUP').count()为了方面后续制图,整理了分类汇总的结果为Excel表格(为了方面后续制图,可以将结果升序排列,为了操作简单,我直接在Excel中进行的排序操作) 结果如图所示 首先查看波士顿市犯罪数量随年份变化情况,绘制南丁格尔玫瑰图进行展示 course = ['2015年','2016年','2017年','2018年'] score = [53388,99114,100886,65685] c = ( Pie() .add("",[list(z) for z in zip(course,score)],radius=["10%","75%"],rosetype='area') .set_global_opts(title_opts=opts.TitleOpts(title='不同年份的犯罪数量',pos_top='10%',pos_left='40%'), legend_opts=opts.LegendOpts(type_="scroll",pos_top='20%',pos_left='81%',orient='vertical')) .set_series_opts(label_opts = opts.LabelOpts(formatter='{b}:{c}')) ) c.render_notebook()
波士顿市经济发达、生活水平较高,私家车普及率较高,因此车牌类犯罪、酒后驾驶罪等围绕车辆的犯罪数量出现增长;作为马萨诸塞州首府,波士顿在马萨诸塞州政治生活中扮演着中演角色。波士顿有着大量的行政、司法机关,相应官员数量也较多,这难免会使贪污罪、财产类犯罪调查数量出现增长。结合实际,权色问题往往相伴出现,一些腐败分子手中的权力会让他们的欲望更加膨胀,这给卖淫人员提供了大量犯罪机会,在贪利动机的促使下,越来越多的女性走上了卖淫犯罪的道路。 (2)基于月维度依旧还是分类汇总 crime_month= crime_boston.groupby('MONTH').count()绘制日历热图对犯罪数量进行可视化展示 import pandas as pd import numpy as np import matplotlib.pyplot as plt import calmap fig,ax=calmap.calendarplot(crime_month['INCIDENT_NUMBER'], fillcolor='grey', linecolor='w',linewidth=0.1,cmap='RdYlBu_r', yearlabel_kws={'color':'black', 'fontsize':12}, fig_kws=dict(figsize=(10,6),dpi= 80)) fig.colorbar(ax[0].get_children()[1], ax=ax.ravel().tolist()) plt.show()
四个年份的犯罪数据链变化及走势基本相同,从初夏的5月到初秋的9月均处在犯罪的高峰期,自11月份入冬起到次年2月份形成一个犯罪低谷期。由此可以认为,波士顿市的犯罪在总体上具备一定的季节性特征。 基于常规逻辑认识,一般认为盗窃罪、暴力犯罪、强奸罪数量变化与季节变化相关性较强,由于数据集中缺少强奸罪的犯罪记录,因此下面将对盗窃罪和暴力犯罪的季节性特征进一步探索。 由于原始数据集中”OCCURRED_ON_DATE“字段包含时间点,不方便后续可视化,所以我把原来的时间点信息去掉,将原来的数据存入到了一个新的Excel表格(crime_month)中(虽然麻烦些,但能抓老鼠的就是好猫!) crime_month = pd.read_excel(r'D:D:\dataset\crime.xlsx',sheet_name='crime_month')使用时间序列分解法进行分析,得到盗窃罪的长期趋势、季节性变化以及残差散点图 #盗窃罪时间序列分解 larceny = crime_month[crime_month['OFFENSE_CODE_GROUP']=='Larceny'] larceny = larceny.groupby('OCCURRED_ON_DATE').count() larceny = larceny.iloc[:,0:1] # decomposition时间序列分解 from statsmodels.tsa.seasonal import seasonal_decompose #model : {"additive", "multiplicative"}, optional,加法模型,乘法模型 result = seasonal_decompose(larceny, model='additive') # 添加图像标题,x,y为浮点型,表示标题在图像水平、垂直方向相对位置 result.plot().suptitle('盗窃罪时间序列分解',x=0.55, y=1.04, fontsize=16, color='k',fontproperties=myfont2)
犯罪现象不仅受季节变换影响,随着白昼黑夜交替,犯罪数量及表现形态也因时而异,呈现出一定的时间规律性,下面研究波士顿市一日当中的整体发案情况,调用pyecharts绘制折线图 crime_day = crime_boston.groupby('HOUR').count() y = [] for i in crime_day['INCIDENT_NUMBER']: y.append(i) ls=crime_day.index.values.tolist() x=[] for i in ls: i=str(i)+'时' x.append(i) #绘制折线图 import pyecharts.options as opts from pyecharts.charts import Line line=( Line() .add_xaxis(xaxis_data=x) .add_yaxis(series_name="案发数量",y_axis=y) .set_series_opts( markarea_opts=opts.MarkAreaOpts( data=[ opts.MarkAreaItem(name="案发低谷期", x=("3时", "6时")), opts.MarkAreaItem(name="平台期", x=("10时", "15时")), opts.MarkAreaItem(name="案发高峰期", x=("16时", "19时")), ] ) ) .set_global_opts(title_opts=opts.TitleOpts(title="犯罪数量逐时变化"), visualmap_opts=opts.VisualMapOpts( is_piecewise=True, dimension=0, pieces=[ {"gt": 0, "lte": 3, "color": "green"}, {"gt": 3, "lte": 6, "color": "#2874B2"}, {"gt": 6, "lte": 10, "color": "#F7BA0B"}, {"gt": 10, "lte": 15, "color": "orange"}, {"gt": 15, "lte": 19, "color": "red"}, {"gt": 19, "color": "green"}, ], pos_right=0, pos_bottom=100 ) ) ) line.render_notebook()
盗窃案件和入室盗窃案件数量变化趋势较为相似,案件高发时段分别为12时到18时、8时到12时。犯罪分子实施盗窃行为难免需要与事主或其财物发生接触,12时到18时是一天当中人员流动性最大的时段,在这时实施盗窃行为更易伪装与隐蔽;8时到12时是人们出门上班、上学或活动的时段,家中无人照看,不法分子趁虚而入实施盗窃行为,这一时段也容易出现因疏忽大意未锁好门窗的情况,会给寻机作案者溜门而入的可乘之机;车辆盗窃案件高发期在18时到22时,这一时期是下班晚高峰时期,人们将车辆集中停靠至住宅附近,在夜幕的掩盖下,犯罪者更易穿梭隐蔽在车辆中实施盗窃行为,成功的可能性大大提升;商业区盗窃案件高发期在0时到7时,此时人员大多已经转移至住宅区,商业区人员稀少,且夜间社会防范力量有所减弱,犯罪分子更易得手。 暴力类案件(攻击+抢劫)时间规律与盗窃类案件不同,同样绘制折线图对其进行分析 fig,ax=plt.subplots(nrows=1,ncols=2,figsize=(12,5),dpi=1000) plt.subplot(1, 2, 1) x = ['0时', '1时', '2时', '3时', '4时', '5时', '6时', '7时', '8时', '9时', '10时', '11时', '12时', '13时', '14时', '15时', '16时', '17时', '18时', '19时', '20时', '21时', '22时', '23时'] plt.plot(x,y5,color="#D47479",linestyle="--",lw = 1) plt.bar(x,y5,width=0.6,color='teal') # 绘制x轴标题 plt.xlabel("时间",fontsize=8) # 绘制y轴标题 plt.ylabel("案发数量",fontsize=8) plt.title('攻击类案件逐小时变化图',fontsize=9) plt.xticks(fontsize=6) plt.subplot(1, 2, 2) plt.plot(x,y6,color="#D47479",linestyle="--",lw = 1) plt.bar(x,y6,width=0.6,color='#F7BA0B') # 绘制x轴标题 plt.xlabel("时间",fontsize=8) # 绘制y轴标题 plt.ylabel("案发数量",fontsize=8) plt.title('抢劫案件逐小时变化图',fontsize=9) plt.xticks(fontsize=6) # plt.savefig(fname="pic.png",figsize=[8,8]) plt.show()
波士顿是美国最古老的城市之一,其定性较早,城市结构非常紧凑。波士顿可以划分为后湾区、市中心下城区、波士顿南端、波士顿东区、南波士顿滨水创新区、灯塔山社区、金融区等10个住宅区、8个商业区和6个工业区,有着纽伯里街(Newbury Street)、华盛顿街(Washington Street)、哈里森大道(Harrison Ave)及市场街(Market Street)四条商业街。波士顿是全美居民受教育程度最高的城市,举世闻名的哈佛大学和麻省理工学院都位于波士顿的都市区。不同的城市功能区有着不同的犯罪类型和数量分布,下面利用ArcGIS技术分析波士顿的犯罪空间分布格局。 使用ArcGIS符号系统中的热力图模式绘制热力图,首先是盗窃类型犯罪的热力图 下面还绘制了同属盗窃大类案件中的车辆盗窃、入室盗窃案件的热力图。 药物滥用是波士顿市重点犯罪类型之一,因此同样对药物滥用案件进行了热力图绘制与分析 人身伤害类案件与抢劫案是侵害人的生命健康权的严重暴力犯罪,针对该类案件做犯罪空间布局分析,不仅有利于保护公民生命健康权,还对维护社会治安稳定有着重要意义。 1.夏季为波士顿市犯罪高发期,故意伤害案件、抢劫案件、盗窃案件、故意损坏财物类案件都为夏季的主要犯罪类型,基于“日”维度来看,在夜晚时分发生上述案件的可能性更大。 2.ArcGIS可视化结果显示,城市中心下城区是波士顿市最主要的犯罪热点区域,下面基于犯罪理性选择理论来对这一点进行解释。犯罪理性选择理论强调潜在犯罪人会在犯罪前倾向于选择最有利、最能满足自己需求的行为模式,他们会仔细评估分析“在何时犯罪”、“何地犯罪”、“对哪些人犯何种罪”等诸如此类的问题。结果显示,在财产类犯罪中,城市中心下城区聚集的商业中心能够满足犯罪人对犯罪收益的期望;在人身伤害类犯罪中,下城区频繁的人口流动和较大的人口密度,又给潜在犯罪人提供了易于犯罪的社会环境,因此城市中心成为了各类犯罪分子实施犯罪的首选地。 3.多切斯特区是波士顿重要犯罪集中区,该地区适用社会失序理论。社会失序理论是指居民因受到人口不稳定性、种族混杂导致的文化异质性以及低收入或低社会地位等社会失序因素的影响,而容易产生犯罪行为。上文基于社会因素、阶级构成因素、经济发展因素对多切斯特地区高犯罪特征进行了多维度阐释,与社会失序理论十分契合。 一个小白关于波士顿犯罪数据集的分析就到这里啦~ |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |