熊猫列中唯一值的计数[重复]


问题内容

这个问题已经在这里有了答案

单个变量的频率表 (4个答案)

3年前关闭。

我有一个数据框,正在查看数据框中的一列,即名称

array(['Katherine', 'Robert', 'Anne', nan, 'Susan', 'other'], dtype=object)

我试图打个电话告诉我这些唯一名称在该列中出现了多少次,例如,如果有223个Katherine实例等,我该怎么做?我知道value_counts只是为每个显示1,因为它们是单独的唯一值


问题答案:

如果我对您的理解正确,则可以使用pandas.Series.value_counts

例:

import pandas as pd
import numpy as np

s = pd.Series(['Katherine', 'Robert', 'Anne', np.nan, 'Susan', 'other'])

s.value_counts()

Katherine    1
Robert       1
other        1
Anne         1
Susan        1
dtype: int64

您提供的数据只有每个名称之一-因此,这里是带有多个“凯瑟琳”条目的示例:

s = pd.Series(['Katherine','Katherine','Katherine','Katherine', 'Robert', 'Anne', np.nan, 'Susan', 'other'])

s.value_counts()

Katherine    4
Robert       1
other        1
Anne         1
Susan        1
dtype: int64

应用于数据 框后, 您将按以下方式调用此方法:

df['names'].value_counts()