tensorflow feature column

Posted wuchengze

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了tensorflow feature column相关的知识,希望对你有一定的参考价值。

功能

通过tensorflow 预定义的feature column 达到特征处理的功能.
工作流程:

  1. tesnsorflow dataset 产生迭代器返回解析后的tensor dict (即input_fn)
  2. 预定义 tensor dict 中(key, tensor) 的转化方式, 生成feature column
  3. 通过input_layer(feature_dict, feature_column) 生成转化后的feature 供模型使用
    技术图片
    p.s. 官网图中的input_layer函数实际上是在DNNClassifier中. 因此feature_column只是类似于定义一个函数操作. 数据处理则在DNNClassifier model_fn中.

feature column 类型

技术图片

常用feature column

官方提供了常用的9种(上图下层)feature column, 用于特征处理. 通过这九种操作最终都会得到 category column / dense column 对象.

常用操作

首先我们需要知道, 可以将tensor 处理, 并输入模型的只有dense column. categorical column 只是转化的中间结果.
其次:

  1. category column 可以输入cross_column 生成交叉后的category column
  2. category column 可以作为embedding column, indicator_column 的输入, 转换为dense column
  3. embedding_column 可以通过share_embedding_column共享参数.(操作见另一篇博客)

    其他操作

    tf.contrib.feature_column 中包含了关于sequence tensor 的处理方式. 与之对应需要通过sequence_input_layer进行解析

以上是关于tensorflow feature column的主要内容,如果未能解决你的问题,请参考以下文章

TensorFlow2 特征列 feature_column

Tensorflow:如何为 numpy 矩阵输入创建 feature_columns

Tensorflow 1.x 的 feature_columns 项必须是 _FeatureColumn。给定类型是列表

结合 scikit-learn 模型使用 TensorFlow 预处理(tf.feature_column)

使用 Tensorflow 嵌入列会引发 All feature_columns must be _FeatureColumn instances 错误

如何在Tensorflow中组合feature_columns,model_to_estimator和dataset API