Pandas按时间筛选数据

您所在的位置:网站首页 怎么在表格中筛选日期 Pandas按时间筛选数据

Pandas按时间筛选数据

2024-07-17 14:02| 来源: 网络整理| 查看: 265

Pandas按时间筛选数据

在本文中,我们将介绍如何使用Pandas中的时间来筛选数据框架中的数据。首先,我们需要先了解一下Pandas中的时间。

阅读更多:Pandas 教程

Pandas时间

在Pandas中,时间有两种形式:字符串形式和时间戳形式。字符串形式的时间需要在读入数据时指定时间格式,并使用pd.to_datetime()将其转换为时间格式。

import pandas as pd df = pd.read_csv('data.csv') df['time'] = pd.to_datetime(df['time'], format='%Y-%m-%d %H:%M:%S')

而时间戳形式的时间则是从1970年1月1日UTC到指定时间的秒数,可以用pd.to_datetime()或者pd.to_timedelta()将其转换为时间格式。

df['timestamp'] = pd.to_datetime(df['timestamp'], unit='s') df['duration'] = pd.to_timedelta(df['duration'], unit='s') 按时间筛选数据

在Pandas中,我们可以使用df.loc[]和df.iloc[]函数来筛选数据。其中,df.loc[]可以使用标签来筛选数据,而df.iloc[]则使用位置来筛选数据。

按年份筛选数据

如果我们想筛选2019年的数据,可以使用df.loc[]函数和Pandas的DatetimeIndex对象。

df = df.set_index('time') # 设置时间列为索引列 df_2019 = df.loc[pd.DatetimeIndex(df.index).year == 2019] # 筛选索引中年份为2019的数据 按日期范围筛选数据

如果我们想筛选2019年11月1日到2019年11月30日的数据,可以使用df.loc[]函数和Pandas的Timestamp对象。

df_day = df.loc[(df.index >= pd.Timestamp('2019-11-01')) & (df.index


【本文地址】


今日新闻


推荐新闻


    CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3