案例 |
您所在的位置:网站首页 › 如何简单描述公司财务状况分析 › 案例 |
目录 一、基本情况 二、数据清洗 三、随机森林确定重要指标 一、基本情况今天来和大家分享一个案例,通过已有的数据集分析判断行业财务造假的情况,首先我们来看一下数据的基本情况。 这是附件2,也就是主要分析所要用到的数据,我们主要的目的就是把这些行业分类,然后分析出各个行业有关财务造假的变量有哪些(看图中的第一个变量,那个就是企业代码,每个代码都会对应一个行业),这个数据量是比较庞大的,我们把它导入到RStudio里面让大家看一下概况。 由于附件2时csv文件格式的,所以我们直接利用read.csv函数即可导入,不需要其他的相关包 ,导入后我们利用summary()函数来查看数据集的一些基本信息,如下所示:
这是导入后的工作环境中对data的描述,3563个观测值,也就是样本,变量则多达 363个,我们最后的目的就是从这363个变量中确定最重要的那几个。 附件2介绍完了,接下来给大家看看附件1和附件3,这两个附件主要是对附件2的补充说明,我们同样将其导入R内来观察其基本情况。 library(xlsx) name_data |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |