python 计数Vectorizer
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 计数Vectorizer相关的知识,希望对你有一定的参考价值。
cvec = CountVectorizer(stop_words='english')
cvec.fit(data_train['data'])
cvecdata = cvec.transform(data_train['data'])
X_train = pd.DataFrame(cvecdata.todense(),
columns=cvec.get_feature_names())
print(X_train.shape)
X_test = pd.DataFrame(cvec.transform(data_test['data']).todense(),
columns=cvec.get_feature_names())
print(X_test.shape)
以上是关于python 计数Vectorizer的主要内容,如果未能解决你的问题,请参考以下文章
python sklearn 不仅使用计数功能进行朴素贝叶斯学习
无法编写 Count Vectorizer 词汇表
Vectorizer Python中的单词组合
Python中的TfidfVectorizer参数解析
获取选定的特征名称 TFIDF Vectorizer
Tf-Idf vectorizer 分析来自行而不是单词的向量