【stata】处理重复值之duplicates drop

您所在的位置:网站首页 stata怎么加总非重复值 【stata】处理重复值之duplicates drop

【stata】处理重复值之duplicates drop

2024-07-17 10:12| 来源: 网络整理| 查看: 265

 关于stata重复值处理常用的duplicates函数,很疑惑为什么要加force,区别如下图所示。

一、duplicates常用语法

duplicates report [varlist] [if] [in]  //报告某个变量出现的次数

duplicateslist  [varlist] [if] [in] [,options]  //列出重复的变量

duplicates tag [varlist] [if] [in] , generate(newvar)  //生成一个新变量,当某一行数据为重复值时,生成的新变量值为1,否则为0

duplicates drop[if] [in]  //删掉重复值,同时保留下每一组重复值中的第一行数据

二、duplicates drop_all和duplicates drop_all, force区别

d9daafb604094ef780c56ee4860604e3.png

这是因为stata认为这样删除会让你丢失关于age的信息,所以它不允许。那如果某变量恰好是你不需要用的变量,可以加上force选项。

参考博客:

重要的事情说三遍,重要的数据留一个 (stata-club.github.io)



【本文地址】


今日新闻


推荐新闻


    CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3