gp数据库

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了gp数据库相关的知识,希望对你有一定的参考价值。

查看服务器版本:

jdk:Java -version

操作系统:cat/etc/redhat-release

数据库:select * from v$versin;

查看jboss版本   cat /opt/jboss/server/tfr-job/log/boot.log | grep ‘Release ID:‘ | sed -e ‘s/.*] //g‘ -e ‘s/ (.*)$//g‘

根据日志不同路径填写标记颜色部分

查看端口方法

 ps –ef  |grep  实例名。得到实例名的pid

 netstat  -ntlup |grep 实例名的pid  即可获得端口

GreenPlum  采取的是PostgreSql框架,    163只是一个管理节点,数据库的数据都在计算节点上  计算机点包括:192.168.218.164 165 166 167  237 238. 
ssh 192.168.218.164 登录计算节点

gpstop -M fast                 停掉数据库

gpstate           查看数据库是否启动

启动数据库

a、切换用户 

 [[email protected] ~]# su  –  sgpadmin

b、启动 

[[email protected] ~]$ gpstart -a

查看最大连接数

su - sgpadmin

psql dp_dw163

dp_dw163=# show max_connections; 

调整最大连接数

su - sgpadmin 

cd $MASTER_DATA_DIRECTORY  

vim postgresql.conf
查看连接数

ps -ef | grep postgres | grep con     

同时连所有节点服务器的 

su - sgpadmin

cd /home/sgpadim

gpssh -f allhost

   

在sdw5上的日志是报错的 

 => ps -ef|grep silent
[sdw4] sgpadmin 5255 29439 0 11:56 pts/2 00:00:00 grep silent
[sdw3] sgpadmin 23381 21538 0 11:53 pts/2 00:00:00 grep silent
[sdw1] sgpadmin 41885 37057 0 12:02 pts/2 00:00:00 grep silent
[sdw2] sgpadmin 15201 13516 0 12:04 pts/2 00:00:00 grep silent
[ mdw] sgpadmin 39356 38744 0 12:02 pts/26 00:00:00 grep silent
[sdw5] sgpadmin 6123 1 0 11:11 ? 00:00:00 /usr/local/greenplum-db-4.3.6.1/bin/postgres -D /data2/sprimary/gpseg9 -p 40001 -b 11 -z 12 --silent-mode=true -i -M mirrorl 


 一般在启动或是停止数据库之前

用gpssh 命令连接整个集群

 通过查看各个服务器上的数据库进程,确认是不是停好或是启好 

 => ps -ef|grep postgres|wc -l
[sdw4] 1
[sdw3] 1
[sdw1] 1
[sdw2] 1
[ mdw] 1
[sdw5] 132
[sdw6] 1

查看gp在跑job数:

 select * from pg_stat_activity where current_query<>‘<IDLE>‘ order by query_start desc;


1、导入数据

[[email protected] ~]# su - sgpadmin //切换用户

[[email protected] ~]$ psql dp_dw163 //使用dp_dw163登陆数据库

psql (8.2.15)

Type "help" for help.

dp_dw163=# delete from datamart.t_dimension_conf; //删除源数据,datamart.t_dimension_conf是表名

DELETE 277

dp_dw163=# copy datamart.t_dimension_conf from ‘/home/sgpadmin/t_dimension_conf.data‘;  //执行导入命令,/home/sgpadmin/t_dimension_conf.data 为导出文件存放路径和文件名字

COPY 143

dp_dw163=# select count(0) from datamart.t_dimension_conf ; //查询导入后总条数

 count 

-------

   143

(1 row)

dp_dw163=# 



2、导出数据

[[email protected] ~]# su - sgpadmin //切换用户

[[email protected] ~]$ psql dp_dw163 //使用dp_dw163登陆数据库

psql (8.2.15)

Type "help" for help.

dp_dw163=# copy datamart.dm_dept_org  to ‘/data/backup/dphqh20150707_datamart.dm_dept_org.data‘;

(datamart.dm_dept_org 数据的表名;/data/backup/dphqh20150707_datamart.dm_dept_org.data 导出以后的存放路径)


对于要求导出某一部分数据的情况:

dp_dw163=# copy (select * from tablename where column_name =  filter) to ‘dir‘;

通过括号中的语句控制


导出成excel格式的,需要先导出成csv根式,然后再转换成excel格式

dp_dw163=# copy (select * from tablename where column_name =  filter) to ‘dir.csv‘ CSV HEADER;

注:

CSV:打开逗号分隔变量(CSV)模式。

HEADER:声明文件包含一个头标识行,包含文件中每个字段的名字。

输出时,第一行包含表的字段名,输入时,第一行被忽略。



3、查询表的大小

select pg_size_pretty(pg_relation_size(‘datamart.dm_own_truck_deliver_wb_analy‘))  // “datamart.dm_own_truck_deliver_wb_analy”是表名


以上是关于gp数据库的主要内容,如果未能解决你的问题,请参考以下文章

Greenplum数据库中系统表gp_ distribution_ policy详解

gp数据库

GP索引调优测试--原理篇

GP索引调优测试--原理篇

gp数据库停止

使用 gp_segment_id 作为分区列从 greenplum 中并行获取数据