tensorflow feature column
Posted wuchengze
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了tensorflow feature column相关的知识,希望对你有一定的参考价值。
功能
通过tensorflow 预定义的feature column 达到特征处理的功能.
工作流程:
- tesnsorflow dataset 产生迭代器返回解析后的tensor dict (即input_fn)
- 预定义 tensor dict 中(key, tensor) 的转化方式, 生成feature column
- 通过input_layer(feature_dict, feature_column) 生成转化后的feature 供模型使用
p.s. 官网图中的input_layer函数实际上是在DNNClassifier中. 因此feature_column只是类似于定义一个函数操作. 数据处理则在DNNClassifier model_fn中.
feature column 类型
常用feature column
官方提供了常用的9种(上图下层)feature column, 用于特征处理. 通过这九种操作最终都会得到 category column / dense column 对象.
常用操作
首先我们需要知道, 可以将tensor 处理, 并输入模型的只有dense column. categorical column 只是转化的中间结果.
其次:
- category column 可以输入cross_column 生成交叉后的category column
- category column 可以作为embedding column, indicator_column 的输入, 转换为dense column
embedding_column 可以通过share_embedding_column共享参数.(操作见另一篇博客)
其他操作
tf.contrib.feature_column 中包含了关于sequence tensor 的处理方式. 与之对应需要通过sequence_input_layer进行解析
以上是关于tensorflow feature column的主要内容,如果未能解决你的问题,请参考以下文章
TensorFlow2 特征列 feature_column
Tensorflow:如何为 numpy 矩阵输入创建 feature_columns
Tensorflow 1.x 的 feature_columns 项必须是 _FeatureColumn。给定类型是列表
结合 scikit-learn 模型使用 TensorFlow 预处理(tf.feature_column)
使用 Tensorflow 嵌入列会引发 All feature_columns must be _FeatureColumn instances 错误
如何在Tensorflow中组合feature_columns,model_to_estimator和dataset API