主机管理+堡垒机系统开发

Posted bigdata_devops

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了主机管理+堡垒机系统开发相关的知识,希望对你有一定的参考价值。

本节内容

  1. 需求讨论
  2. 构架设计
  3. 表结构设计
  4. 程序开发

 

1.需求讨论

  1. 实现对用户的权限管理,能访问哪些机器,在被访问的机器上有哪些权限
  2. 实现可以通过web页面对指定主机列表 进行 批量发布命令、文件
  3. 实现对用户操作进行纪录 

2.架构设计

 

3. 表结构设计

参考 http://www.cnblogs.com/alex3714/articles/5286889.html 

前景介绍

到目前为止,很多公司对堡垒机依然不太感冒,其实是没有充分认识到堡垒机在IT管理中的重要作用的,很多人觉得,堡垒机就是跳板机,其实这个认识是不全面的,跳板功能只是堡垒机所具备的功能属性中的其中一项而已,下面我就给大家介绍一下堡垒机的重要性,以帮助大家参考自己公司的业务是否需要部署堡垒机。

堡垒机有以下两个至关重要的功能:

 

权限管理

当你公司的服务器变的越来越多后,需要操作这些服务器的人就肯定不只是一个运维人员,同时也可能包括多个开发人员,那么这么多的人操作业务系统,如果权限分配不当就会存在很大的安全风险,举几个场景例子:

  1. 设想你们公司有300台Linux服务器,A开发人员需要登录其中5台WEB服务器查看日志或进行问题追踪等事务,同时对另外10台hadoop服务器有root权限,在有300台服务器规模的网络中,按常理来讲你是已经使用了ldap权限统一认证的,你如何使这个开发人员只能以普通用户的身份登录5台web服务器,并且同时允许他以管理员的身份登录另外10台hadoop服务器呢?并且同时他对其它剩下的200多台服务器没有访问权限

  2. 目前据我了解,很多公司的运维团队为了方面,整个运维团队的运维人员还是共享同一套root密码,这样内部信任机制虽然使大家的工作方便了,但同时存在着极大的安全隐患,很多情况下,一个运维人员只需要管理固定数量的服务器,毕竟公司分为不同的业务线,不同的运维人员管理的业务线也不同,但如果共享一套root密码,其实就等于无限放大了每个运维人员的权限,也就是说,如果某个运维人员想干坏事的话,他可以在几分钟内把整个公司的业务停转,甚至数据都给删除掉。为了降低风险,于是有人想到,把不同业务线的root密码改掉就ok了么,也就是每个业务线的运维人员只知道自己的密码,这当然是最简单有效的方式,但问题是如果你同时用了ldap,这样做又比较麻烦,即使你设置了root不通过ldap认证,那新问题就是,每次有运维人员离职,他所在的业务线的密码都需要重新改一次。

 

其实上面的问题,我觉得可以很简单的通过堡垒机来实现,收回所有人员的直接登录服务器的权限,所有的登录动作都通过堡垒机授权,运维人员或开发人员不知道远程服务器的密码,这些远程机器的用户信息都绑定在了堡垒机上,堡垒机用户只能看到他能用什么权限访问哪些远程服务器。

 

在回收了运维或开发人员直接登录远程服务器的权限后,其实就等于你们公司生产系统的所有认证过程都通过堡垒机来完成了,堡垒机等于成了你们生产系统的SSO(single sign on)模块了。你只需要在堡垒机上添加几条规则就能实现以下权限控制了:

  1. 允许A开发人员通过普通用户登录5台web服务器,通过root权限登录10台hadoop服务器,但对其余的服务器无任务访问权限

  2. 多个运维人员可以共享一个root账户,但是依然能分辨出分别是谁在哪些服务器上操作了哪些命令,因为堡垒机账户是每个人独有的,也就是说虽然所有运维人员共享了一同一个远程root账户,但由于他们用的堡垒账户都是自己独有的,因此依然可以通过堡垒机控制每个运维人员访问不同的机器。

审计管理

审计管理其实很简单,就是把用户的所有操作都纪录下来,以备日后的审计或者事故后的追责。在纪录用户操作的过程中有一个问题要注意,就是这个纪录对于操作用户来讲是不可见的,什么意思?就是指,无论用户愿不愿意,他的操作都会被纪录下来,并且,他自己如果不想操作被纪录下来,或想删除已纪录的内容,这些都是他做不到的,这就要求操作日志对用户来讲是不可见和不可访问的,通过堡垒机就可以很好的实现。

 

堡垒机架构 

堡垒机的主要作用权限控制和用户行为审计,堡垒机就像一个城堡的大门,城堡里的所有建筑就是你不同的业务系统 , 每个想进入城堡的人都必须经过城堡大门并经过大门守卫的授权,每个进入城堡的人必须且只能严格按守卫的分配进入指定的建筑,且每个建筑物还有自己的权限访问控制,不同级别的人可以到建筑物里不同楼层的访问级别也是不一样的。还有就是,每个进入城堡的人的所有行为和足迹都会被严格的监控和纪录下来,一旦发生犯罪事件,城堡管理人员就可以通过这些监控纪录来追踪责任人。 

 

 

 

堡垒要想成功完全记到他的作用,只靠堡垒机本身是不够的, 还需要一系列安全上对用户进行限制的配合,堡垒机部署上后,同时要确保你的网络达到以下条件:

  • 所有人包括运维、开发等任何需要访问业务系统的人员,只能通过堡垒机访问业务系统
    • 回收所有对业务系统的访问权限,做到除了堡垒机管理人员,没有人知道业务系统任何机器的登录密码
    • 网络上限制所有人员只能通过堡垒机的跳转才能访问业务系统 
  • 确保除了堡垒机管理员之外,所有其它人对堡垒机本身无任何操作权限,只有一个登录跳转功能
  • 确保用户的操作纪录不能被用户自己以任何方式获取到并篡改  

 

堡垒机功能实现需求

业务需求:

  1. 兼顾业务安全目标与用户体验,堡垒机部署后,不应使用户访问业务系统的访问变的复杂,否则工作将很难推进,因为没人喜欢改变现状,尤其是改变后生活变得更艰难
  2. 保证堡垒机稳定安全运行, 没有100%的把握,不要上线任何新系统,即使有100%把握,也要做好最坏的打算,想好故障预案

功能需求:

  1. 所有的用户操作日志要保留在数据库中
  2. 每个用户登录堡垒机后,只需要选择具体要访问的设置,就连接上了,不需要再输入目标机器的访问密码
  3. 允许用户对不同的目标设备有不同的访问权限,例:
    1. 对10.0.2.34 有mysql 用户的权限
    2. 对192.168.3.22 有root用户的权限
    3. 对172.33.24.55 没任何权限
  4. 分组管理,即可以对设置进行分组,允许用户访问某组机器,但对组里的不同机器依然有不同的访问权限    

设计表结构:

#_*_coding:utf-8_*_
__author__ = \'Alex Li\'
 
from sqlalchemy import create_engine,Table
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy import Column, Integer, String,ForeignKey,UniqueConstraint
from sqlalchemy.orm import relationship
from  sqlalchemy.orm import sessionmaker
from sqlalchemy import or_,and_
from sqlalchemy import func
from sqlalchemy_utils import ChoiceType,PasswordType
 
Base = declarative_base() #生成一个SqlORM 基类
 
 
engine = create_engine("mysql+mysqldb://root@localhost:3306/test",echo=False)
 
 
BindHost2Group = Table(\'bindhost_2_group\',Base.metadata,
    Column(\'bindhost_id\',ForeignKey(\'bind_host.id\'),primary_key=True),
    Column(\'group_id\',ForeignKey(\'group.id\'),primary_key=True),
)
 
BindHost2UserProfile = Table(\'bindhost_2_userprofile\',Base.metadata,
    Column(\'bindhost_id\',ForeignKey(\'bind_host.id\'),primary_key=True),
    Column(\'uerprofile_id\',ForeignKey(\'user_profile.id\'),primary_key=True),
)
 
Group2UserProfile = Table(\'group_2_userprofile\',Base.metadata,
    Column(\'userprofile_id\',ForeignKey(\'user_profile.id\'),primary_key=True),
    Column(\'group_id\',ForeignKey(\'group.id\'),primary_key=True),
)
 
 
class UserProfile(Base):
    __tablename__ = \'user_profile\'
    id = Column(Integer,primary_key=True,autoincrement=True)
    username = Column(String(32),unique=True,nullable=False)
    password = Column(String(128),unique=True,nullable=False)
    groups = relationship(\'Group\',secondary=Group2UserProfile)
    bind_hosts = relationship(\'BindHost\',secondary=BindHost2UserProfile)
 
    def __repr__(self):
        return "<UserProfile(id=\'%s\',username=\'%s\')>" % (self.id,self.username)
 
class RemoteUser(Base):
    __tablename__ = \'remote_user\'
    AuthTypes = [
        (u\'ssh-passwd\',u\'SSH/Password\'),
        (u\'ssh-key\',u\'SSH/KEY\'),
    ]
    id = Column(Integer,primary_key=True,autoincrement=True)
    auth_type = Column(ChoiceType(AuthTypes))
    username = Column(String(64),nullable=False)
    password = Column(String(255))
 
    __table_args__ = (UniqueConstraint(\'auth_type\', \'username\',\'password\', name=\'_user_passwd_uc\'),)
 
    def __repr__(self):
        return "<RemoteUser(id=\'%s\',auth_type=\'%s\',user=\'%s\')>" % (self.id,self.auth_type,self.username)
 
 
class Host(Base):
    __tablename__ = \'host\'
    id = Column(Integer,primary_key=True,autoincrement=True)
    hostname = Column(String(64),unique=True,nullable=False)
    ip_addr = Column(String(128),unique=True,nullable=False)
    port = Column(Integer,default=22)
    bind_hosts = relationship("BindHost")
    def __repr__(self):
        return "<Host(id=\'%s\',hostname=\'%s\')>" % (self.id,self.hostname)
 
class Group(Base):
    __tablename__  = \'group\'
    id = Column(Integer,primary_key=True,autoincrement=True)
    name = Column(String(64),nullable=False,unique=True)
    bind_hosts = relationship("BindHost",secondary=BindHost2Group, back_populates=\'groups\' )
    user_profiles = relationship("UserProfile",secondary=Group2UserProfile )
 
    def __repr__(self):
        return "<HostGroup(id=\'%s\',name=\'%s\')>" % (self.id,self.name)
 
 
class BindHost(Base):
    \'\'\'Bind host with different remote user,
       eg. 192.168.1.1 mysql passAbc123
       eg. 10.5.1.6    mysql pass532Dr!
       eg. 10.5.1.8    mysql pass532Dr!
       eg. 192.168.1.1 root
    \'\'\'
    __tablename__ = \'bind_host\'
    id = Column(Integer,primary_key=True,autoincrement=True)
    host_id = Column(Integer,ForeignKey(\'host.id\'))
    remoteuser_id = Column(Integer,ForeignKey(\'remote_user.id\'))
    host = relationship("Host")
    remoteuser = relationship("RemoteUser")
    groups = relationship("Group",secondary=BindHost2Group,back_populates=\'bind_hosts\')
    user_profiles = relationship("UserProfile",secondary=BindHost2UserProfile)
 
    __table_args__ = (UniqueConstraint(\'host_id\', \'remoteuser_id\', name=\'_bindhost_and_user_uc\'),)
 
    def __repr__(self):
        return "<BindHost(id=\'%s\',name=\'%s\',user=\'%s\')>" % (self.id,
                                                           self.host.hostname,
                                                           self.remoteuser.username
                                                                      )
 
 
Base.metadata.create_all(engine) #创建所有表结构
 
if __name__ == \'__main__\':
    SessionCls = sessionmaker(bind=engine) #创建与数据库的会话session class ,注意,这里返回给session的是个class,不是实例
    session = SessionCls()
    #h1 = session.query(Host).filter(Host.hostname==\'ubuntu4\').first()
    #hg1 = session.query(HostGroup).filter(HostGroup.name==\'t2\').first()
 
    #h2 = Host(hostname=\'ubuntu4\',ip_addr=\'192.168.1.21\')
    #h3 = Host(hostname=\'ubuntu5\',ip_addr=\'192.168.1.24\',port=20000)
    #hg= HostGroup(name=\'TestServers3\',host_id=h3.id)
    #hg2= HostGroup(name=\'TestServers2\',host_id=h2.id)
    #hg3= HostGroup(name=\'TestServers3\')
    #hg4= HostGroup(name=\'TestServers4\')
    #session.add_all([hg3,hg4])
    #h2.host_groups = [HostGroup(name="t1"),HostGroup(name="t2")]
    #h3.host_groups = [HostGroup(name="t2")]
    #h1.host_groups.append(HostGroup(name="t3") )
    #print(h1.host_groups)
    #print("hg1:",hg1.host.hostname)
    #join_res = session.query(Host).join(Host.host_groups).filter(HostGroup.name==\'t1\').group_by("Host").all()
    #print(\'join select:\',join_res)
    #group_by_res = session.query(HostGroup, func.count(HostGroup.name )).group_by(HostGroup.name).all()
    #print("-------------group by res-----")
 
    \'\'\'
    h1=Host(hostname=\'h1\',ip_addr=\'1.1.1.1\')
    h2=Host(hostname=\'h2\',ip_addr=\'1.1.1.2\')
    h3=Host(hostname=\'h3\',ip_addr=\'1.1.1.3\')
    r1=RemoteUser(auth_type=u\'ssh-passwd\',username=\'alex\',password=\'abc123\')
    r2=RemoteUser(auth_type=u\'ssh-key\',username=\'alex\')
 
    g1 = Group(name=\'g1\')
    g2 = Group(name=\'g2\')
    g3 = Group(name=\'g3\')
    session.add_all([h1,h2,h3,r1,r2])
    session.add_all([g1,g2,g3])
 
 
 
    b1 = BindHost(host_id=1,remoteuser_id=1)
    b2 = BindHost(host_id=1,remoteuser_id=2)
    b3 = BindHost(host_id=2,remoteuser_id=2)
    b4 = BindHost(host_id=3,remoteuser_id=2)
    session.add_all((b1,b2,b3,b4))
     
    all_groups = session.query(Group).filter().all() #first()
    all_bindhosts = session.query(BindHost).filter().all()
 
    #h1 = session.query(BindHost).filter(BindHost.host_id==1).first()
    #h1.groups.append(all_groups[1])
    #print("h1:",h1)
    #print("----------->",all_groups.name,all_groups.bind_hosts)
    u1 = session.query(UserProfile).filter(UserProfile.id==1).first()
    print(\'--user:\',u1.bind_hosts)
    print(\'--user:\',u1.groups[0].bind_hosts)
    #u1.groups = [all_groups[1] ]
    #u1.bind_hosts.append(all_bindhosts[1])
    #u1 = UserProfile(username=\'alex\',password=\'123\')
    #u2 = UserProfile(username=\'rain\',password=\'abc!23\')
    #session.add_all([u1,u2])
    #b1 = BindHost()
    session.commit()
    #print(h2.host_groups)
    \'\'\'
表结构设计(sqlalchemy)

ssh公钥登录过程

使用密码登录,每次都必须输入密码,非常麻烦。好在SSH还提供了公钥登录,可以省去输入密码的步骤。

所谓"公钥登录",原理很简单,就是用户将自己的公钥储存在远程主机上。登录的时候,远程主机会向用户发送一段随机字符串,用户用自己的私钥加密后,再发回来。远程主机用事先储存的公钥进行解密,如果成功,就证明用户是可信的,直接允许登录shell,不再要求密码。

这种方法要求用户必须提供自己的公钥。如果没有现成的,可以直接用ssh-keygen生成一个:

$ ssh-keygen

运行上面的命令以后,系统会出现一系列提示,可以一路回车。其中有一个问题是,要不要对私钥设置口令(passphrase),如果担心私钥的安全,这里可以设置一个。

运行结束以后,在$HOME/.ssh/目录下,会新生成两个文件:id_rsa.pub和id_rsa。前者是你的公钥,后者是你的私钥。

这时再输入下面的命令,将公钥传送到远程主机host上面:

$ ssh-copy-id user@host

好了,从此你再登录,就不需要输入密码了。

 

需要调用strace命令:

yum -y install strace 安装strace
[root@python-web2 ~]# strace
usage: strace [-CdffhiqrtttTvVxxy] [-I n] [-e expr]...
              [-a column] [-o file] [-s strsize] [-P path]...
              -p pid... / [-D] [-E var=val]... [-u username] PROG [ARGS]
   or: strace -c[df] [-I n] [-e expr]... [-O overhead] [-S sortby]
              -p pid... / [-D] [-E var=val]... [-u username] PROG [ARGS]
-c -- count time, calls, and errors for each syscall and report summary #监测时间
-C -- like -c but also print regular output
-d -- enable debug output to stderr
-D -- run tracer process as a detached grandchild, not as parent
-f -- follow forks, -ff -- with output into separate files #进程会产生子进程
-i -- print instruction pointer at time of syscall
-q -- suppress messages about attaching, detaching, etc.
-r -- print relative timestamp, -t -- absolute timestamp, -tt -- with usecs
-T -- print time spent in each syscall
-v -- verbose mode: print unabbreviated argv, stat, termios, etc. args
-x -- print non-ascii strings in hex, -xx -- print all strings in hex
-y -- print paths associated with file descriptor arguments
-h -- print help message, -V -- print version
-a column -- alignment COLUMN for printing syscall results (default 40)
-b execve -- detach on this syscall
-e expr -- a qualifying expression: option=[!]all or option=[!]val1[,val2]...
   options: trace, abbrev, verbose, raw, signal, read, write
-I interruptible --
   1: no signals are blocked
   2: fatal signals are blocked while decoding syscall (default)
   3: fatal signals are always blocked (default if \'-o FILE PROG\')
   4: fatal signals and SIGTSTP (^Z) are always blocked
      (useful to make \'strace -o FILE PROG\' not stop on ^Z)
-o file -- send trace output to FILE instead of stderr
-O overhead -- set overhead for tracing syscalls to OVERHEAD usecs
-p pid -- trace process with process id PID, may be repeated #监测进程id
-s strsize -- limit length of print strings to STRSIZE chars (default 32)
-S sortby -- sort syscall counts by: time, calls, name, nothing (default time)
-u username -- run command as username handling setuid and/or setgid
-E var=val -- put var=val in the environment for command
-E var -- remove var from the environment for command
-P path -- trace accesses to path

 

 

进程id和进程号

[root@localhost ~]# ps -ef | grep ssh

UID  PID PPID  C STIME TTY          TIME CMD
root 1036 1    0 00:37 ? 00:00:00 /usr/sbin/sshd
root 1050 1036 0 00:37 ? 00:00:00 sshd: root@pts/0
root 1222 1036 0 00:44 ? 00:00:00 sshd: root@pts/1
root 1240 1224 0 00:44 pts/1 00:00:00 grep --color=auto ssh

红颜色的是进程号(PID),黑色的是父进程id(PPID)

0是根进程

strace监控子进程的活动状况2004就是192.168.117.130下面的ssh的子进程,这个子进程连接着192.168.117.128(  [root@python-web2 ~]# strace -fp 2004    ),当192.168.117.128输入ifconfig命令,这个192.168.117.130会输出一系列指令

 这里出现了select,联想到之前学到的select,poll,epoll,select

ssh的底层就是用的select.

监控所有有活动的连接数,有活动的就返回,select的原理就是监控所有的文件句柄,有哪个文件句柄活动,select就会返回

这里监控的是屏幕的输入和输出。

strace -fp 2004 -t -o ssh_log输出到日志

在centos7上运行CrazyEye堡垒机程序,遇到如下问题:

python版本的问题,python3.4运行不起来,必须安装python3.6,注意Django的路径和python的路径。

运行server:

python3.6 manage.py runserver 0.0.0.0:9000

python3.6 manage.py createsuperuser

 

 

完整示例代码

https://github.com/triaquae/py3_training/tree/master/%E5%A0%A1%E5%9E%92%E6%9C%BA 

以上是关于主机管理+堡垒机系统开发的主要内容,如果未能解决你的问题,请参考以下文章

python 之路,Day27 - 主机管理+堡垒机系统开发

主机管理+堡垒机系统开发

Python自动化开发学习12-堡垒机开发

主机管理+堡垒机系统开发:批量任务开发思路

冰冻三尺非一日之寒-来一个堡垒机

springBoot开发的开源堡垒机(跳板机)软件——WGCLOUD