无法在 ArangoDB 中批量上传日志数据?

Posted

技术标签:

【中文标题】无法在 ArangoDB 中批量上传日志数据?【英文标题】:Unable to bulk upload log data in ArangoDB? 【发布时间】:2015-07-01 06:06:48 【问题描述】:

我需要在 ArangoDB 中批量上传日志数据。不是 JSON 和 CSV 格式,是 gz 格式的日志数据。

203.109.94.55 - - [19/Jun/2015:16:02:45 +0000] "GET /origin-cdn.firstcry.com/brainbees/images/products/thumb/506739a.jpg HTTP/1.1" 200 21514 "-" "Mozilla/5.0 (Linux; android 4.4.4; XT1022 Build/KXC21.5-40) AppleWebKit/537.36 (Khtml, like Gecko) Chrome/34.0.1847.114 Mobile Safari/537.36" "-" 183.87.73.202 - - [19/Jun/2015:16:02:45 +0000]“GET /origin-cdn.firstcry.com/brainbees/images/products/bigthumb/555258a.jpg HTTP/1.1”200 34903“- " "Dalvik/2.1.0 (Linux; U; Android 5.0.2; AO5510 Build/LRX22G)" "-" 183.87.73.202 - - [19/Jun/2015:16:02:45 +0000] “GET /origin-cdn.firstcry.com/brainbees/images/products/bigthumb/555401a.jpg HTTP/1.1”200 32334 “- " "Dalvik/2.1.0 (Linux; U; Android 5.0.2; AO5510 Build/LRX22G)" "-"

即使我们尝试通过 Arangosh 上传单个文件,它也不会上传并生成格式无效的错误。 我每天有 2 GB 的数据要上传和处理,我该如何通过 ArangoDB 进行操作? 因为我浏览了 ArangoDB 的文档,发现只有 JSON 的批量上传。任何有关如何上传和处理相同内容的帮助将不胜感激?

【问题讨论】:

【参考方案1】:

ArangoDB 仅支持批量上传 JSON、CSV 或 TSV。因此,您需要转换日志文件。我很好的起点是谷歌。比如有个项目叫“log2json”:

https://github.com/kadnan/logs2json

通过一些小的调整,您应该能够生成 JSON 行(上面的项目创建了一个大的 JSON,这不是您想要的)。

【讨论】:

以上是关于无法在 ArangoDB 中批量上传日志数据?的主要内容,如果未能解决你的问题,请参考以下文章

批量上传和触发

重复批量上传数据处理

使用ivx实现批量上传图片的经验总结

批量文件将目录中的所有文件上传到FTP

使用phpExcel批量上传excel表数据到mysql数据库中

C# Oracle 转换为批量上传