手写英文字符数据集..在哪里获得(并且公开可用)[关闭]

Posted

技术标签:

【中文标题】手写英文字符数据集..在哪里获得(并且公开可用)[关闭]【英文标题】:Handwritten English Character Data Set..Where to get (and openly available) [closed] 【发布时间】:2013-06-22 04:18:42 【问题描述】:

我们已经创建了一个手写字符识别系统,现在想要在英文字符(数字和字母)上测试该系统。 对于数字,我们已经对 MNIST 数据集进行了测试。 然而,对于英文字母,我们还没有找到任何公开可用(即免费提供)的标准数据集。我们所能找到的只有NIST 和CEDAR 手写数据集,可在其各自的官方网站上找到,但它们的成本很高。

是否有任何其他公开可用的英文字母标准数据集可用于测试手写字符识别系统。

【问题讨论】:

是的...请在下面查看我的回答。 见HASYv2 dataset(我是作者) 检查kaggle.com/sachinpatel21/az-handwritten-alphabets-in-csv-format 的图像数据集,它包含 A-Z 手写 370000 多张图像 这就是您可能正在寻找的:nist.gov/itl/iad/image-group/emnist-dataset 【参考方案1】:

您是否查看了 UCI 机器学习存储库? http://archive.ics.uci.edu/ml/datasets.html

这个呢? http://archive.ics.uci.edu/ml/datasets/UJI+Pen+Characters

这是您可能正在寻找的: https://www.nist.gov/itl/iad/image-group/emnist-dataset

【讨论】:

应该标记为解决方案 如何读取 EMNIST 数据?它不是 PNG 或任何东西。

以上是关于手写英文字符数据集..在哪里获得(并且公开可用)[关闭]的主要内容,如果未能解决你的问题,请参考以下文章

Chars74K数据集简介及手写字符子数据集相关读取方法

公开可用的垃圾邮件过滤器训练集[关闭]

哪里可以找到 Hive 的大数据?

想获得有用的公开数据集,掌握Python网络爬虫技术少不了!

教你使用TensorFlow2对阿拉伯语手写字符数据集进行识别

分享自然语言处理领域公开数据集