东师理想云平台运维常见问题及解决办法
Posted 黄海的编程知识世界
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了东师理想云平台运维常见问题及解决办法相关的知识,希望对你有一定的参考价值。
云平台服务器应急检查步骤
版本1.0
一、 制订目的
规范运维人员处理应急事件步骤,尽快解决用户故障,特制定此规范,并于制定之日起正式实施,对于未按规范严格执行的人员将进行相应处罚。
二、 WINDOWS服务器检查项目
1、 安装防病毒软件Symantec SEP 14U1,并升级病毒包到最新。
下载地址:链接:http://pan.baidu.com/s/1sluRPQt 密码:spl3
2、 WINDOWS系统补丁。
使用WindowsUpdate功能将系统补丁打到最新,如操作系统无法更新,使用WindowsUpdateOffline进行升级。
下载地址:链接:http://pan.baidu.com/s/1dEIGCTz 密码:t01f
3、 WINDOWS系统C:磁盘空间<10g就十分危险了,如果需要查看具体哪个目录占用了大量磁盘,可以使用SpaceSniffer这个工具。
下载地址:链接:http://pan.baidu.com/s/1pLyZLwR 密码:404v
4、 WINDOWS系统需要激活,如咱们激活不负责版权问题。
破解工具下载地址:http://kmspico10.com/
5、 WINDOWS系统自动登录
设置开机自动用户登录
开始>运行 control userpasswords2 ,出现(如图1),选择要自动登录的用户账户,然后将“要使用本机,用户必须输入用户名和密码”前面的勾去掉(如图2),然后点确定出现自动登录对话框,输入密码(如图3)点确定。
6、 处理程序执行Watcher
禁止在不开启Watcher的情况下,独立启用WinFormGetSwf.exe
三、 Linux服务器检查项目
发现访问缓慢
1、 检查TOMCAT
wget http://127.0.0.1:8080/dsideal_yy/adminlogin/captchaText
ps -ef | grep tomcat
2、 检查mysql连接数
这里需要细化!!!
3、 IO读写效率
(1) df -h 查找出 磁盘分区的名称 (2) hdparm -t /sda1 标准:Timing buffered disk reads:不低于 200mb/s
4、 检查SSDB是否启动
cd /usr/local/ssdb && ./ssdb-cli set abc 1
5、 检查REDIS是否启动
redis-cli -p 18890 set abc 1
重点检查是不是服务挂了,并且检查一下反应时间长短。
6、 将海沧的TOMCAT JVM 内存大小,设为标准配置。
7、 MYSQL 空闲连接超时时间30
8、 查看CPU使用率+ 查看内存使用率。
执行 top
11、 查看磁盘是否挂载
12、 查看MYSQL错误 日志
split -a 2 -d -b 1m /usr/local/tomcat7/logs/catalina.out cata_split_
13、 查看MYSQL慢查询
14、 查看nginx是否启动
二、 Redis过大,加载时间长,导致系统重启后Tomcat无法启动
办法:在客户服务器安装Python3.6.2并且运行一次黄海开发的StartTomcat.py
链接:http://www.cnblogs.com/littlehb/p/7645118.html
此脚本为自动在/etc/rc.local中添加自动启动代码,并删除/usr/local/tomcat7/bin/startup.sh.
四、 各类服务异常终止,导致程序异常。
办法:安装并运行吴缤开发的进程检查程序。
五、 系统掉电,用户反馈时,才能去解决。
办法:需要第三方服务支持!
六、 磁盘掉了,挂载失败。
办法:
检查 /usr/local/checkdisk.sh 文件是不是存在,里面的内容是不是满足当前地区的服务配置。
链接:http://www.cnblogs.com/littlehb/p/7645100.html
~
以上是关于东师理想云平台运维常见问题及解决办法的主要内容,如果未能解决你的问题,请参考以下文章
云原生架构下,企业一站式DevOps平台建设实践丨Gdevops峰会
EasyNVR无法级联EasyNVS云管理平台,并报错“a queue was full”的排查与解决办法