Flume+Morphline+Solr+Hue实时索引调试及问题定位

Posted Code Job

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Flume+Morphline+Solr+Hue实时索引调试及问题定位相关的知识,希望对你有一定的参考价值。

Technorati Tags: ,,,,
1.Flume和Morphline添加日志打印

log4j.logger.org.apache.flume.sink.solr=DEBUG
log4j.logger.org.kitesdk.morphline=TRACE

2.在线更新solr collection配置

$ solrctl instancedir --update url_analysis_records url_analysis_configs/
$ solrctl collection --reload url_analysis_records

3.删除solr已经有的index文件

<delete><query>*:*</query></delete>
<commit/>

 

Hue3.10 search(solr)最近调试发现的已知问题:

1.对动态索引不太能识别,尤其是对中文。

2.timeline功能会导致gc时间过长。

3.对中国时区支持不够,选择时间的字段慢8个小时,timeline快8个小时。因此需要专门指定一个Solr索引字段存UTC时间才能正常使用Hue功能。

以上是关于Flume+Morphline+Solr+Hue实时索引调试及问题定位的主要内容,如果未能解决你的问题,请参考以下文章

如何使用Flume准实时建立Solr的全文索引

实时事件统计项目:优化flume:用file channel代替mem channel

Banana:Solr的Kibana

HUE中集成Solr

Hue, Solr - 搜索词的自动填充

大数据协作框架Sqoop+Flume+Oozie+Hue(59讲)