文件服务器满故障排查总结

Posted everfight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了文件服务器满故障排查总结相关的知识,希望对你有一定的参考价值。

昨天上午,测试报告称抽表程序没有办法正常抽出表格,我进行了以下操作,成功排查出问题,并解决了后续可能出现的潜在问题。
记录下解决问题的过程。

第一步,查看服务器log,排查出中间过程文件没有生成。

docker logs -f  container_id

第二步,查看调用生成文件的程序是否正常运行,显示正常运行。

docker ps 

第三步,查看生成的文件夹使用状况,发现容量占据满了。

df -h 

第四步,删除无关紧要的大文件

- du -sh *  查看当天目录下的文件的大小
- find ./dirname/ -ctime +10 删除较大文件夹10天前的内容

第五步,为了防止后面还会因为文件增加造成空间不够

设定定时任务清理文件夹
- 常见clear_files.sh脚本,内部是删除文件的shell脚本
- sudo chmod+x clear_files.sh
- crontab -e 创建定时任务,设定定时时间,一周清理一次文件夹

以上是关于文件服务器满故障排查总结的主要内容,如果未能解决你的问题,请参考以下文章

常见服务器故障类型及排查方法总结

总结hadoop 磁盘满导致集群宕机排查解决

Java: 线上故障如何快速排查?来看这套技巧大全(高德地图的总结)

jvm故障排查

02:linux 磁盘满了,却找不到大文件问题处理 lsof命令

关于阿里云OSS故障排查解决,以及经验总结