我正在努力训练一个模型,在我的数据集中有一个ID列。当我训练模型时,我删除了ID列。但是对于测试数据集,我需要在进行预测后将其映射回ID列。
最好的方法是什么?我们可以设置一个非预测器列时,建立一个模型在Scikit-学习?另外,其他的ML工具呢,比如TensorFlow,Spark ML。他们是否支持此功能?
我在stackoverflow上找到了这篇文章,但正在寻找其他选择。
我假设您将数据(X)存储在pd中。数据帧。如果是这种情况,只需将值提取到numpy ndarray中即可。相应的行将具有相同的顺序。scikit学习风格化示例:
output = pd.Series(data=some_model.predict(X.values), index=X.index)