如何在Pandas数据帧（Python）中查找语料库中最常用的单词

Question

我有Pandas数据框，如下所示。我已经对我的文本文件进行了标记，并使用NLTK Countvectorizer转换为pandas数据帧。另外，我已经从我的偶像中删除了停用词和标点符号。我试图在pandas数据帧中查找我的语料库中最常用的单词。在下面的数据框中，诸如“aaron”和“abandon”之类的单词大于10次，因此这些单词应该在新的数据帧中。

注意：我是python的新手，我不知道如何实现它。提供代码说明。

数据框的子集

我已经清理了我的语料库，我的dataframe看起来像跟随

{'aaaahhhs': {990: 0, 991: 0, 992: 0, 993: 0, 994: 0, 995: 0, 996: 0, 997: 0, 998: 0, 999: 0, 1000: 1}, 'aahs': {990: 0, 991: 0, 992: 0, 993: 0, 994: 0, 995: 0, 996: 0, 997: 0, 998: 0, 999: 0, 1000: 1}, 'aamir': {990: 0, 991: 0, 992: 0, 993: 0, 994: 0, 995: 0, 996: 0, 997: 0, 998: 0, 999: 0, 1000: 1}, 'aardman': {990: 0, 991: 0, 992: 0, 993: 0, 994: 0, 995: 0, 996: 0, 997: 0, 998: 0, 999: 0, 1000: 2}, 'aaron': {990: 0, 991: 0, 992: 0, 993: 0, 994: 0, 995: 0, 996: 4, 997: 0, 998: 0, 999: 0, 1000: 14}, 'abandon': {990: 0, 991: 0, 992: 0, 993: 0, 994: 0, 995: 0, 996: 0, 997: 0, 998: 0, 999: 0, 1000: 16}}

Answer 1

另一答案