presto,dremio,spark-sql与ranger的整合记录

Posted huaxiaoyao

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了presto,dremio,spark-sql与ranger的整合记录相关的知识,希望对你有一定的参考价值。

dremio,spark-sql,presto和ranger的整合
当前,ranger没有现成的插件来管理dremio,spark-sql,presto。
暂时使用的方法是新建一个用户,如presto可以创建一个presto用户,然后在ranger中对presto用户赋予hive,hdfs的访问权限。
尤其是在hive doas权限开启的时候,一定要把对应的hdfs的权限也分配一下。
然后使用presto用户来启动presto的worker,cordinaor进程,这样提交的查询都是使用这个用户,可以正常访问hdfs和hive.
但是这样的问题就是,不管jdbc使用什么用户,都是无效的。

presto整合到ambari安装的时候,默认是使用root用户进行启动的,可以修改

/var/lib/ambari-server/resources下面的presto-worker.py,presto-cordinator.py中install和start方法,

install方法中添加useradd presto,chown -R presto:presto /usr/hdp/current/presto

start  方法中添加 sudo -u presto ,这样就可以使用presto用户来启动presto的相关进程。

网络上可以查到一个信息,一个presto的发行公司startbust自己发行的presto可以配置hive.security=ranger可以

与ranger进行整合。

presto安装后需要注意的配置是hive.config.resources=/etc/hadoop/conf/hdfs-site.xml,/etc/hadoop/conf/core-site.xml

这样才可以使用NAMENODE HA中配置的namespace,不会报找不到主机异常。

 

以上是关于presto,dremio,spark-sql与ranger的整合记录的主要内容,如果未能解决你的问题,请参考以下文章

在 Dremio 查询中使用 FLATTEN 时,有没有办法包含元素索引?

Dremio: 为 Tableau Desktop 配置 Dremio 连接器

数据湖引擎-dremio-白话数据架构

dremio 16 升级问题

dremio 17 混合类型的问题

dremio 的 telemetry 处理简单说明