CRF++ 或 CRFSuite

Posted

技术标签:

【中文标题】CRF++ 或 CRFSuite【英文标题】:CRF++ or CRFSuite 【发布时间】:2012-07-01 22:50:03 【问题描述】:

我开始使用 crf++ 和 crfsuite(两者都使用非常相似的文件格式)。我想做与图像相关的事情(分割、活动识别等)。我的主要问题是如何构建培训文件。有人使用 crf 和图像吗?有没有人解释我或提供一些文件来学习。 提前致谢。

【问题讨论】:

【参考方案1】:

CRFsuite 比 CRF++ 更快,它可以处理大量的训练数据。我尝试了他们两个。它们完美地处理了合理数量的数据,但是当我的数据集增加到超过 100,000 个句子时,CRF++ 无法处理它并突然停止工作。 看下面的链接CRFsuite - CRF Benchmark test 许多 CRF 软件在某些标准上有一个比较

【讨论】:

【参考方案2】:

我以前用过 CRF++,效果很好。 但我的领域是自然语言处理,我使用 CRF++ 进行命名实体识别或 POS 标记。 CRF++ 很容易在 Linux 上安装,但在 Windows 上编译时有一些小问题。 您可以按照它的文档来了解训练数据格式:每行代表一个数据样本,每列代表一个特征类型。

或者,您也可以考虑具有 CRF 组件的 Mallet。

【讨论】:

【参考方案3】:

也许您应该从 DGM 库 (https://github.com/Project-10/DGM) 开始,这对于以前从未使用过 CRF 的人来说是最佳选择。它包括许多现成的演示项目,它们将开箱即用地对您的图像进行分类/分割。也不错documented。

【讨论】:

【参考方案4】:

我刚刚在 Windows 上看到了这个: http://crfsharp.codeplex.com/

【讨论】:

【参考方案5】:

也许你也想试试 Mallet 包中的 CRF 组件。

【讨论】:

以上是关于CRF++ 或 CRFSuite的主要内容,如果未能解决你的问题,请参考以下文章

条件随机场(CRF)-基础

基于keras的BiLstm与CRF实现命名实体标注

使用 CRF 识别文档的特定部分

CRF分割后处理(二)

了解速率控制模式:什么是 CBRVBRCRF和Capped-CRF?

Bert加bilstm和crf做ner的意义