字典特征抽取

Posted shixinzei

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了字典特征抽取相关的知识,希望对你有一定的参考价值。

#特征抽取 feature_extraction
#导包
# from sklearn.feature_extraction.text import CountVectorizer
#
# vector = CountVectorizer()
#
# res = vector.fit_transform(["life is short,i like python ", "life is too long ,i dislike python"])
#
# print(vector.get_feature_names())
#
# print(res.toarray())

#导包 字典特征抽取
from sklearn.feature_extraction import DictVectorizer
#字典数据抽取:把字典中一些类别数据,分别进行转换成特征
def dictvec():
    #实例化
    dict = DictVectorizer(sparse=False) #sparse=False 取消稀疏矩阵
    data = dict.fit_transform([{city: 北京, temp: 100}, {city: 上海, temp: 60}, {city: 江西, temp: 30}])
    print(data)#sparse格式 节约内存 便于读取处理
    # [[0.   1.   0. 100.]
    #  [1.   0.   0.  60.]
    #  [0.   0.   1.  30.]]
    print(dict.get_feature_names()) #读取特征值
    # [‘city=上海‘, ‘city=北京‘, ‘city=江西‘, ‘temp‘]
    return None

if __name__ == "__main__":
    dictvec()

运行结果:

技术分享图片

 

技术分享图片

 

以上是关于字典特征抽取的主要内容,如果未能解决你的问题,请参考以下文章

1.2_数据的特征抽取

机器学习之路:python 字典特征提取器 DictVectorizer

机器学习

机器学习带你搞懂什么是特征工程?(特征抽取&特征预处理&特征选择&数据降维)

机器学习带你搞懂什么是特征工程?(特征抽取&特征预处理&特征选择&数据降维)

sklearn工具-数据集变换