我有一个包含200万次观察的数据框。
下表给出了数据样本。
Pid Feature Value
1 color Red
1 size 10
1 weight High
2 angle 90
2 temperature It works with low temperature
2 wheel No
3 dimensions 23ft x 23 ft
我想在以下数据框中连接feature
列表及其值
Pid Feature_list Values
1 color, size, weight Red, 10, High
2 angle, temperature, wheel 90, it works with low temperature, No
3 dimensions 23ft x 23 ft
我在R中使用了foreach
和粘贴
命令。这是我使用的代码示例。
foreach( #all products# ) %dopar%
{
...
feature_sum <- rbind(feature_sum,pid , paste(att[att$id==pid,][2][,], collapse = " "), paste(att[att$pid==pid,][3][,], collapse = " ")))
}
但是问题是根据所需的格式处理数据需要太长的时间。
有什么方法可以加快处理速度吗?或者我可以避免foreach
循环吗?
我们可以使用data. table
library(data.table)
setDT(df1)[ ,lapply(.SD, toString) , by = Pid]