将时间戳列拆分为单独的日期和时间列


问题内容

我有一个熊猫数据框,上面有超过1000个时间戳(如下),我想循环遍历:

2016-02-22 14:59:44.561776

我很难将时间戳分为两列-“日期”和“时间”。日期格式可以保持不变,但是时间需要转换为CST(包括毫秒)。

谢谢您的帮助


问题答案:

我不确定您为什么首先要这样做,但是如果您确实需要…

df = pd.DataFrame({'my_timestamp': pd.date_range('2016-1-1 15:00', periods=5)})

>>> df
         my_timestamp
0 2016-01-01 15:00:00
1 2016-01-02 15:00:00
2 2016-01-03 15:00:00
3 2016-01-04 15:00:00
4 2016-01-05 15:00:00

df['new_date'] = [d.date() for d in df['my_timestamp']]
df['new_time'] = [d.time() for d in df['my_timestamp']]

>>> df
         my_timestamp    new_date  new_time
0 2016-01-01 15:00:00  2016-01-01  15:00:00
1 2016-01-02 15:00:00  2016-01-02  15:00:00
2 2016-01-03 15:00:00  2016-01-03  15:00:00
3 2016-01-04 15:00:00  2016-01-04  15:00:00
4 2016-01-05 15:00:00  2016-01-05  15:00:00

转换为CST比较棘手。我假设当前时间戳是“不知道的”,即它们没有附加时区?如果没有,您将如何转换它们?

更多细节:

https://docs.python.org/2/library/datetime.html

如何在python中识别未知的日期时间时区

编辑

另一种方法仅在时间戳上循环一次,而不是两次:

new_dates, new_times = zip(*[(d.date(), d.time()) for d in df['my_timestamp']])
df = df.assign(new_date=new_dates, new_time=new_times)