1、首先,我们创建一个只有时间索引的DataFramet = pd.DataFrame(index=p颊俄岿髭d.date_range(x.index[0], y.index[-1]))注意这里的起始时间和终止时间的选择
2、然后,把星期数据集的数据映射过去,同时使用前一个数据作为缺失数据的填充t = pd.DataFrame(index=pd.date忧溲枷茫_range(x.index[0], y.index[-1]))x = t.join(x).fillna(method='pad')
3、对比一下此时的两个数据集,发现有多余的数据。等于说步骤②的代码,只是做了一个数据集的填充。
4、对于x数据集起始时间早于y数据集的情况,使用y数据集的索引进行映射即可if x.index[0] < y.index[0]: x = pd.DataFrame(index=y.index).join(x)
5、对于x数据集起始时间不早于y数据集的情况,则需要额外处理x = pd.DataFrame(index=y[x.index[0]::].index).join(x)y = y[x.index[0]::]
6、下面是最后的结果