将时间戳列拆分为单独的日期和时间列
问题内容:
我有一个熊猫数据框,上面有超过1000个时间戳(如下),我想循环遍历:
2016-02-22 14:59:44.561776
我很难将时间戳分为两列-“日期”和“时间”。日期格式可以保持不变,但是时间需要转换为CST(包括毫秒)。
谢谢您的帮助
问题答案:
我不确定您为什么首先要这样做,但是如果您确实需要…
df = pd.DataFrame({'my_timestamp': pd.date_range('2016-1-1 15:00', periods=5)})
>>> df
my_timestamp
0 2016-01-01 15:00:00
1 2016-01-02 15:00:00
2 2016-01-03 15:00:00
3 2016-01-04 15:00:00
4 2016-01-05 15:00:00
df['new_date'] = [d.date() for d in df['my_timestamp']]
df['new_time'] = [d.time() for d in df['my_timestamp']]
>>> df
my_timestamp new_date new_time
0 2016-01-01 15:00:00 2016-01-01 15:00:00
1 2016-01-02 15:00:00 2016-01-02 15:00:00
2 2016-01-03 15:00:00 2016-01-03 15:00:00
3 2016-01-04 15:00:00 2016-01-04 15:00:00
4 2016-01-05 15:00:00 2016-01-05 15:00:00
转换为CST比较棘手。我假设当前时间戳是“不知道的”,即它们没有附加时区?如果没有,您将如何转换它们?
更多细节:
https://docs.python.org/2/library/datetime.html
编辑
另一种方法仅在时间戳上循环一次,而不是两次:
new_dates, new_times = zip(*[(d.date(), d.time()) for d in df['my_timestamp']])
df = df.assign(new_date=new_dates, new_time=new_times)