一、业务背景
1.业务环境
宏观 中国是世界第二大保险市场,但在保险密度上与世界平均水平仍有明显差距。
业界 保险行业2018年保费规模为38万亿,同比增长不足4%,过去“短平快“的发展模式已经不能适应新 时代的行业发展需求,行业及用户长期存在难以解决的痛点,限制了行业发展。
社会 互联网经济的发展,为保险行业带来了增量市场,同时随着网民规模的扩大,用户的行为习惯已发生转变,这些都需要互联网的方式进行触达。
保险科技:当前沿科技不断应用于保险行业,互联网保险的概念将会与保险科技概念高度融合。 中国保险市场持续高速增长。 根据保监会数据, 2011~2018年,全国保费收入从1.4万亿增长至3.8万亿,年复合增长率17.2%。 2014年,中国保费收入突破2万亿,成为全球仅次于美国、日本的第三大新兴保险市场市场; 2016年,中国整体保费收入突破3万亿,超过日本,成为全球第二大保险市场; 2019年,中国保费收⼊有望突破4万亿。
2. 发展现状
概览 受保险行业结构转型时期影响,互联网保险整体发展受阻, 2018年行业保费收入为1889亿元, 较去年基本持平,不同险种发展呈现分化格局,其中健康险增长迅猛, 2018年同比增长108%,主要由短期医疗险驱动。
格局 供给端专业互联网保险公司增长迅速,但过高的固定成本及渠道费用使得其盈利问题凸显,加上发展现状强,经营渠道建设及科技输出是未来的破局方法, 渠道端形成第三方平台为主,官网为辅的格局,第三方平台逐渐发展出B2C、 B2A、B2B2C等多种创新业务模式。
模式 互联网保险不仅仅局限于渠道创新,其核心优势同样体现在产品设计的创新和服务体验的提升。
3. 发展趋势
竞合格局 随着入局企业增多,流量争夺更加激烈,最终保险公司与第三方平台深度合作将成为常态。
保险科技 当前沿科技不断应用于保险行业,互联网保险的概念将会与保险科技概念高度融合。
4. 衡量指标
![](https://img-blog.csdnimg.cn/20191011111206979.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQ1NTM2NjAx,size_16,color_FFFFFF,t_70)
5. 业务目标
针对保险公司的健康险产品的用户,制作用户画像,然后进行精准保险营销。
二、案例数据
1. 数据来源
美国某保险公司,和本公司合作多年。现在该公司有一款新的医疗险产品准备上市。
2. 产品介绍
这一款新的医疗产品主要是针对65岁以上的人群推出的医疗附加险,销售渠道是直邮。
3. 商业目的
为保险公司某种健康险产品做用户画像,找出最具有购买倾向的人群以进行保险营销。
4. 数据介绍
本次案例数据共有76个字段,字段繁多,在处理数据时,需要先将数据按照类别进行归类,方便理解查看。
4.1 基本信息
![在这里插入图片描述](https://img-blog.csdnimg.cn/20191011113241484.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQ1NTM2NjAx,size_16,color_FFFFFF,t_70)
4.2 基本情况
![在这里插入图片描述](https://img-blog.csdnimg.cn/20191011113327585.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQ1NTM2NjAx,size_16,color_FFFFFF,t_70)
4.3 家庭成员
![在这里插入图片描述](https://img-blog.csdnimg.cn/20191011113402382.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQ1NTM2NjAx,size_16,color_FFFFFF,t_70)
4.4 家庭成员情况
![在这里插入图片描述](https://img-blog.csdnimg.cn/20191011113445879.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQ1NTM2NjAx,size_16,color_FFFFFF,t_70)
4.5 疾病史
![在这里插入图片描述](https://img-blog.csdnimg.cn/20191011113518676.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQ1NTM2NjAx,size_16,color_FFFFFF,t_70)
4.6 金融信息
![在这里插入图片描述](https://img-blog.csdnimg.cn/20191011113553131.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQ1NTM2NjAx,size_16,color_FFFFFF,t_70)
4.7 个人习惯
![在这里插入图片描述](https://img-blog.csdnimg.cn/20191011113910196.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQ1NTM2NjAx,size_16,color_FFFFFF,t_70)
4.8 家庭状况
![在这里插入图片描述](https://img-blog.csdnimg.cn/20191011113948294.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQ1NTM2NjAx,size_16,color_FFFFFF,t_70)
4.9 居住城市
![在这里插入图片描述](https://img-blog.csdnimg.cn/20191011114200645.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQ1NTM2NjAx,size_16,color_FFFFFF,t_70)
5. 分析思路
根据经验,我们可以大概判别哪些特征很可能和用户是否购买保险会有相关关系。
结合我们的业务经验,以及数据可视化,特征工程方法,先行探索这些特征中哪些特征更重要。
建模之后,再回顾我们这里认为比较重要或不重要的特征,看一下判断是否准确。
三、Python代码实现
了解数据样本和特征个数、数据类型、基本信息等
import numpy as np
import pandas as pd
import warnings
warnings.filterwarnings('ignore')
df=pd.read_csv(r'D:\liwork\a\data\ma_resp_data_temp.csv')
pd.set_option('max_columns',100) #显示100列数据
df.head()
df.shape
df.info
|