如何使用 tf.estimator.DNNClassifier (Scikit Flow?)
Posted
技术标签:
【中文标题】如何使用 tf.estimator.DNNClassifier (Scikit Flow?)【英文标题】:How To Use tf.estimator.DNNClassifier (Scikit Flow?) 【发布时间】:2019-08-28 05:50:27 【问题描述】:有人能给我指出一个 tf.estimator.DNNClassifier(最初是 skflow)的基本工作示例吗?
由于我熟悉 Sklearn,我很高兴在 this blog 上阅读有关 Scikit Flow 的信息。特别是 api 看起来和 SK-Learn 几乎一样。
但是,我在从博客中获取代码运行时遇到了问题。
然后我从Scikit Flow Github 得知它已移至tensorflow/tensorflow/contrib/learn/python/learn。
经过进一步调查,我发现tf.contrib.learn.DNNClassifier 已移至tf.estimator.DNNClassifier。
但是,现在估计器的 api 似乎与 sklearn 分类器完全不同。
如果有人能指出一个基本的工作示例,我将不胜感激。
这是上面博客中的代码。
import tensorflow.contrib.learn as skflow
from sklearn import datasets, metrics
iris = datasets.load_iris()
classifier = skflow.TensorFlowDNNClassifier(hidden_units=[10, 20, 10], n_classes=3)
classifier.fit(iris.data, iris.target)
score = metrics.accuracy_score(iris.target, classifier.predict(iris.data))
print("Accuracy: %f" % score)
【问题讨论】:
【参考方案1】:API 是changed 非常多,所以现在你可以做这样的事情(官方示例可用here):
import tensorflow as tf
from sklearn import datasets, metrics
def train_input_fn(features, labels, batch_size):
dataset = tf.data.Dataset.from_tensor_slices((dict(features), labels))
return dataset.shuffle(1000).repeat().batch(batch_size)
iris = datasets.load_iris()
train_x =
'0': iris.data[:, 0],
'1': iris.data[:, 1],
'2': iris.data[:, 2],
'3': iris.data[:, 3],
my_feature_columns = []
for key in train_x.keys():
my_feature_columns.append(tf.feature_column.numeric_column(key=key))
clf = tf.estimator.DNNClassifier(hidden_units=[10, 20, 10], feature_columns=my_feature_columns, n_classes=3)
clf.train(input_fn=lambda: train_input_fn(train_x, iris.target, 32), steps=10000)
preds = list()
for idx, p in enumerate(classifier.predict(input_fn=lambda: train_input_fn(train_x, iris.target, 32))):
preds.append(p['class_ids'][0])
if idx == 99:
break
print(metrics.accuracy_score(iris.target[:100], preds))
但现在最好像这样使用 TF Keras API:
import tensorflow as tf
from sklearn import datasets, metrics
def train_input_fn(features, labels, batch_size):
dataset = tf.data.Dataset.from_tensor_slices((dict(features), labels))
return dataset.shuffle(1000).repeat().batch(batch_size)
iris = datasets.load_iris()
clf = tf.keras.models.Sequential([
tf.keras.layers.Dense(10, activation='sigmoid'),
tf.keras.layers.Dense(20, activation='sigmoid'),
tf.keras.layers.Dense(10, activation='sigmoid'),
tf.keras.layers.Dense(3, activation='softmax'),
])
clf.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
clf.fit(iris.data, iris.target, batch_size=32)
【讨论】:
太棒了!太感谢了!由于 api 变化很大,我假设我不能使用 sklearn.model_selection 中的 cross_validate 来获得像 f1_macro 这样的不同分数? 看起来像这样,因此您可以根据需要使用sklearn
中的KFold
实现自己的交叉验证方法,如here 所示。以上是关于如何使用 tf.estimator.DNNClassifier (Scikit Flow?)的主要内容,如果未能解决你的问题,请参考以下文章
如何在自动布局中使用约束标识符以及如何使用标识符更改约束? [迅速]
如何使用 AngularJS 的 ng-model 创建一个数组以及如何使用 jquery 提交?