提问者:小点点

按R中的连接分组[重复]


我有一个包含200万次观察的数据框。

下表给出了数据样本。

Pid Feature     Value
1   color       Red
1   size        10
1   weight      High
2   angle       90
2   temperature It works with low temperature
2   wheel       No
3   dimensions  23ft x 23 ft

我想在以下数据框中连接feature列表及其

Pid  Feature_list               Values
1   color, size, weight         Red, 10, High
2   angle, temperature, wheel   90, it works with low temperature, No
3   dimensions                  23ft x 23 ft

我在R中使用了foreach粘贴命令。这是我使用的代码示例。

 foreach( #all products# ) %dopar%
   {
  ... 
    feature_sum <- rbind(feature_sum,pid , paste(att[att$id==pid,][2][,], collapse = " "), paste(att[att$pid==pid,][3][,], collapse = " ")))

  }

但是问题是根据所需的格式处理数据需要太长的时间。

有什么方法可以加快处理速度吗?或者我可以避免foreach循环吗?


共1个答案

匿名用户

我们可以使用data. table

library(data.table)
setDT(df1)[ ,lapply(.SD, toString) , by = Pid]