python对CSV执行选择、删除数据等各种操作 |
您所在的位置:网站首页 › 如何在excel中去掉重复的数据格式 › python对CSV执行选择、删除数据等各种操作 |
阿惠碎碎念:晕晕乎乎研究生阶段就已经过了大半年了,文献也没读多少。。。咸鱼呐!要改了。在有限的几次实验操作中,我发现用python对CSV文件执行操作还挺常用的。为了方便自己之后查阅,也方便大家参考,特来整理一下,有些我觉得自己说不清,就举例子啦~后续有新内容再补加。 整理的操作包括最基本的读取、保存、选择特定行或列、删除特定行或列、去掉重复数据等。可能存在不足,欢迎批评指正! 读取文件格式如下 输出结果如图所示 print(df[‘风速’]) 输出结果如图所示 输出结果为 输出结果为 其他用法举例: for i in outlier_list: #选择dataframe i 行,col列的值 ,df.loc[i,col] time = df.loc[i,'时间'] #选取“辐照度”的第0-2行数据 df.loc[0:2,'辐照度'] tips = pd.read_csv('E:\pycharm\GNRX\data\\train_1.csv' , encoding='gbk') #计算相关度 result = tips.corr() print(result) #只看实际功率与其他属性的相关度,以下两种写法均可 result1 = result.loc['实际功率'] result2 = result.loc['实际功率', :] 用loc指定某一行赋值 #利用索引index循环赋值, MAE_D为之前步骤计算出的数值 for index in dayindex: df.loc[index,'MAE_D'] = MAE_D 选择特定的行或者列/iloc # 选取第0-2列的整列数据 df.iloc[:, :2] # 选取第2列的整列数据 df.iloc[:, 2] #选取第3列的第0-2行数据 df.iloc[0:2,3]应用举例: for i in outlier_list: df.iloc[:, col][i] = (df.iloc[:, col][i + 1] + df.iloc[:, col][i - 1]) / 2 对某一属性的数据整体做操作再赋值给该属性 比如风向数据整体-180 df['风向'] = (df['风向']-180)/180 删除特定行/ df.drop(index) #删除索引为i的整行 df = df.drop(i) #删除实际功率小于等于0的行 df = df.drop(index=df.loc[(df['实际功率'] |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |