python 计数Vectorizer

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 计数Vectorizer相关的知识,希望对你有一定的参考价值。

cvec = CountVectorizer(stop_words='english')
cvec.fit(data_train['data'])
cvecdata = cvec.transform(data_train['data'])
X_train  = pd.DataFrame(cvecdata.todense(),
             columns=cvec.get_feature_names())
print(X_train.shape)
X_test = pd.DataFrame(cvec.transform(data_test['data']).todense(),
                       columns=cvec.get_feature_names())
print(X_test.shape)

以上是关于python 计数Vectorizer的主要内容,如果未能解决你的问题,请参考以下文章

python sklearn 不仅使用计数功能进行朴素贝叶斯学习

无法编写 Count Vectorizer 词汇表

Vectorizer Python中的单词组合

Python中的TfidfVectorizer参数解析

获取选定的特征名称 TFIDF Vectorizer

Tf-Idf vectorizer 分析来自行而不是单词的向量