熊猫列中唯一值的计数[重复]
问题内容:
这个问题已经在这里有了答案 :
单个变量的频率表 (4个答案)
3年前关闭。
我有一个数据框,正在查看数据框中的一列,即名称
array(['Katherine', 'Robert', 'Anne', nan, 'Susan', 'other'], dtype=object)
我试图打个电话告诉我这些唯一名称在该列中出现了多少次,例如,如果有223个Katherine实例等,我该怎么做?我知道value_counts只是为每个显示1,因为它们是单独的唯一值
问题答案:
如果我对您的理解正确,则可以使用pandas.Series.value_counts。
例:
import pandas as pd
import numpy as np
s = pd.Series(['Katherine', 'Robert', 'Anne', np.nan, 'Susan', 'other'])
s.value_counts()
Katherine 1
Robert 1
other 1
Anne 1
Susan 1
dtype: int64
您提供的数据只有每个名称之一-因此,这里是带有多个“凯瑟琳”条目的示例:
s = pd.Series(['Katherine','Katherine','Katherine','Katherine', 'Robert', 'Anne', np.nan, 'Susan', 'other'])
s.value_counts()
Katherine 4
Robert 1
other 1
Anne 1
Susan 1
dtype: int64
应用于数据 框后, 您将按以下方式调用此方法:
df['names'].value_counts()