在python中使用elasticsearch 需要注意的一些问题

Posted zbw911

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在python中使用elasticsearch 需要注意的一些问题相关的知识,希望对你有一定的参考价值。

1, py es client 使用是 http ,java  api 使用是 tcp

2, es.scroll() 方法 在查询多个索引的时候会报 :

elasticsearch.exceptions.RequestError: RequestError(400, u‘too_long_frame_exception‘, u‘An HTTP line is larger than 4096 bytes.‘)

因为多个索引的时候 , _scroll_id 会很长,超过4096, 4096 是 http请求中默认的最大值,所以在请求的时候, 服务端会报错。

向下跟代码,把代码改一下:

原来是

page = es.scroll(scroll_id=sid, scroll=‘2m‘, request_timeout=30)

改为

es.transport.send_get_body_as = ‘POST‘

page = es.scroll(body=‘scroll‘: ‘2m‘, ‘scroll_id‘: sid,
request_timeout=30)


python 库中代码如下:

技术图片

以上是关于在python中使用elasticsearch 需要注意的一些问题的主要内容,如果未能解决你的问题,请参考以下文章

Elasticsearch:关于在 Python 中使用 Elasticsearch 你需要知道的一切 - 8.x

Elasticsearch:关于在 Python 中使用 Elasticsearch 你需要知道的一切 - 8.x

使用 python 在 Elasticsearch 查询中进行用户身份验证

如何使用 python 编辑保存在 Elasticsearch 中的文档

在python中使用elasticsearch 需要注意的一些问题

如何使用python将Spark数据写入ElasticSearch