openrefine优缺点

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了openrefine优缺点相关的知识,希望对你有一定的参考价值。

参考技术A 优点:理解数据、清理数据。缺点:重复检测有限制。
openrefine的具体优点还有处理混乱的数据并对其进行改进,清理数据、协调数据,并使用来自web的数据对其进行扩充。
缺点有:重复项透视有限制性,比如其只能对字符串进行重复检测,不能直接对非字符串进行操作,删除首尾空格的操作只能针对字符串,而不能对整数操作。

以上是关于openrefine优缺点的主要内容,如果未能解决你的问题,请参考以下文章

openrefine 标志更改的行

OpenRefine

在 GREL (OpenRefine) 中解析多值 JSON

使用 Google Refine/OpenRefine & Jsoup/BeautifulSoup 解析和删除 HTML 标签

python 使用parsetree的OpenRefine / jython POS标记

openrefine build成功之后,访问127.0.0.1:3333无法访问,为啥