Pandas | 缺失数据填充

时间：2024-10-14 11:04:16

1、首先，我们创建一个只有时间索引的DataFramet = pd.DataFrame(index=p颊俄岿髭d.date_range(x.index[0], y.index[-1]))注意这里的起始时间和终止时间的选择

2、然后，把星期数据集的数据映射过去，同时使用前一个数据作为缺失数据的填充t = pd.DataFrame(index=pd.date忧溲枷茫_range(x.index[0], y.index[-1]))x = t.join(x).fillna(method='pad')

3、对比一下此时的两个数据集，发现有多余的数据。等于说步骤②的代码，只是做了一个数据集的填充。

4、对于x数据集起始时间早于y数据集的情况，使用y数据集的索引进行映射即可if x.index[0] < y.index[0]: x = pd.DataFrame(index=y.index).join(x)

5、对于x数据集起始时间不早于y数据集的情况，则需要额外处理x = pd.DataFrame(index=y[x.index[0]::].index).join(x)y = y[x.index[0]::]

6、下面是最后的结果