提问者:小点点

带有ID列的训练模型


我正在努力训练一个模型,在我的数据集中有一个ID列。当我训练模型时,我删除了ID列。但是对于测试数据集,我需要在进行预测后将其映射回ID列。

最好的方法是什么?我们可以设置一个非预测器列时,建立一个模型在Scikit-学习?另外,其他的ML工具呢,比如TensorFlow,Spark ML。他们是否支持此功能?

我在stackoverflow上找到了这篇文章,但正在寻找其他选择。


共1个答案

匿名用户

我假设您将数据(X)存储在pd中。数据帧。如果是这种情况,只需将值提取到numpy ndarray中即可。相应的行将具有相同的顺序。scikit学习风格化示例:

output = pd.Series(data=some_model.predict(X.values), index=X.index)