Pandas按时间筛选数据 |
您所在的位置:网站首页 › 怎么在表格中筛选日期 › Pandas按时间筛选数据 |
Pandas按时间筛选数据
在本文中,我们将介绍如何使用Pandas中的时间来筛选数据框架中的数据。首先,我们需要先了解一下Pandas中的时间。 阅读更多:Pandas 教程 Pandas时间在Pandas中,时间有两种形式:字符串形式和时间戳形式。字符串形式的时间需要在读入数据时指定时间格式,并使用pd.to_datetime()将其转换为时间格式。 import pandas as pd df = pd.read_csv('data.csv') df['time'] = pd.to_datetime(df['time'], format='%Y-%m-%d %H:%M:%S')而时间戳形式的时间则是从1970年1月1日UTC到指定时间的秒数,可以用pd.to_datetime()或者pd.to_timedelta()将其转换为时间格式。 df['timestamp'] = pd.to_datetime(df['timestamp'], unit='s') df['duration'] = pd.to_timedelta(df['duration'], unit='s') 按时间筛选数据在Pandas中,我们可以使用df.loc[]和df.iloc[]函数来筛选数据。其中,df.loc[]可以使用标签来筛选数据,而df.iloc[]则使用位置来筛选数据。 按年份筛选数据如果我们想筛选2019年的数据,可以使用df.loc[]函数和Pandas的DatetimeIndex对象。 df = df.set_index('time') # 设置时间列为索引列 df_2019 = df.loc[pd.DatetimeIndex(df.index).year == 2019] # 筛选索引中年份为2019的数据 按日期范围筛选数据如果我们想筛选2019年11月1日到2019年11月30日的数据,可以使用df.loc[]函数和Pandas的Timestamp对象。 df_day = df.loc[(df.index >= pd.Timestamp('2019-11-01')) & (df.index |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |