我一直在使用一个数据集,其中包含有关在特定市场上出售的房屋的信息。有两列,“价格”和“日期”。
我想做一个线图来展示这个市场的价格是如何随着时间的推移而波动的。
问题是,我看到有些房子在同一日期出售,但价格不同。
所以理想情况下,我需要在绘制之前获得每个日期出售的房子的平均/平均价格。
举个例子,如果我有这样的东西:
日期/价格
02/05/2015 / $100
02/05/2015 / $200
我需要获得具有以下平均值的新行:
日期/价格
02/05/2015 / $150
我只是还没有弄清楚。我将感谢任何能在这件事上指导我的人。事先感谢。
假设您使用的是熊猫:
pd. group by('DATE')['PRICE']。均值()