Web网站服务
Posted 王非雨
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Web网站服务相关的知识,希望对你有一定的参考价值。
一、Apache网站服务基础
1.Apache简介
1)Apache的起源
1.“Apache HTTP Server”开源软件项目杰出代表,使用标准HTTP网络协议提供网页浏览服务,可运行在多种操作系统平台中;使用标准C/S架构
2.Apache是针对之前出现的若干个Web服务器程序进行整合、完善后形成的软件,其名源于“A Patchy Server”,意为“基于原有Web服务程序的代码进行修改(补丁)后形成的服务器程序”
3.1995发布1.0版本,后有“Apache Group”负责该项目的管理和维护;1999年在“Apache Group”基础成立Apache软件基金会(Apache Software Foundation,ASF)
4.“Apache HTTP Server”为ASF旗下著名软件项目之一,正式名称为“httpd”
2)Apache的主要特点
1.开放源代码:任何人都可自由使用,充分体现开源软件精神
2.跨平台应用:可运行在绝大多数软硬件平台,这得益于Apache的源代码开放
3.支持各种Web编程语言:可支持Perl、php、Python、Java、ASP等
4.模块化设计:将Apache功能分为各种模块,需要什么功能直接加载对应模块;并且支持商业自行开发模块
5.运行稳定:可用于构建具有大负载访问量的Web站点
6.良好的安全性:维护团队及时对已发现漏洞提供修补程序
3)Apache的主要版本
1.X:最高1.3,该版本继承Apache服务器1.0版本以来的优秀特性和配置管理风格,具有良好兼容、稳定性;目前已停止维护
2.X:Apache加入许多新的功能,新的配置语法和管理风格
4)httpd错误码
100(继续) - 请求者应当继续提出请求。服务器返回此代码表示已收到请求的第一部分,正在等待其余部分
101(切换协议) - 请求者已要求服务器切换协议,服务器已确认并准备切换
200(成功) - 服务器已成功处理了请求。通常,这表示服务器提供了请求的网页。如果是对您的 robots.txt 文件显示此状态码,则表示 Googlebot 已成功检索到该文件
201(已创建) - 请求成功并且服务器创建了新的资源
202(已接受) - 服务器已接受请求,但尚未处理
203(非授权信息) - 服务器已成功处理了请求,但返回的信息可能来自另一来源
204(无内容) - 服务器成功处理了请求,但没有返回任何内容
205(重置内容) - 服务器成功处理了请求,但没有返回任何内容。与 204 响应不同,此响应要求请求者重置文档视图(例如,清除表单内容以输入新内容)
206(部分内容) - 服务器成功处理了部分 GET 请求
300(多种选择) - 针对请求,服务器可执行多种操作。服务器可根据请求者 (user agent) 选择一项操作,或提供操作列表供请求者选择
301(永久移动) - 请求的网页已永久移动到新位置。服务器返回此响应(对 GET 或 HEAD 请求的响应)时,会自动将请求者转到新位置。您应使用此代码告诉 Googlebot 某个网页或网站已永久移动到新位置
302(临时移动) - 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来响应以后的请求。此代码与响应 GET 和 HEAD 请求 的 301 代码类似,会自动将请求者转到不同的位置,但您不应使用此代码来告诉 Googlebot 某个网页或网站已经移动,因 为 Googlebot 会继续抓取原有位置并编制索引
303(查看其他位置) - 请求者应当对不同的位置使用单独的 GET 请求来检索响应时,服务器返回此代码。对于除 HEAD 之外的所有请求,服务器会自动转到其他位置
304(未修改) - 自从上次请求后,请求的网页未修改过。服务器返回此响应时,不会返回网页内容;如果网页自请求者上次请求后再也没有更改过,您应将服务器配置为返回此响应(称为 If-Modified-Since HTTP 标头)。服务器可以告诉搜索引擎的蜘蛛/机器人 自从上次抓取后网页没有变更,进而节省带宽和开销
305(使用代理) - 请求者只能使用代理访问请求的网页。如果服务器返回此响应,还表示请求者应使用代理
307(临时重定向) - 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来响应以后的请求。此代码与响应 GET 和 HEAD 请求 的 301 代码类似,会自动将请求者转到不同的位置,但您不应使用此代码来告诉 Googlebot 某个页面或网站已经移动,因 为 Googlebot 会继续抓取原有位置并编制索引
400(错误请求) - 服务器不理解请求的语法
401(未授权) - 请求要求身份验证。对于登录后请求的网页,服务器可能返回此响应
403(禁止) - 服务器拒绝请求。如果您在 Googlebot 尝试抓取您网站上的有效网页时看到此状态码(您可以在 Google 网站管理员工具诊断下的网络抓取页面上看到此信息),可能是您的服务器或主机拒绝了 Googlebot 访问
404(未找到) - 服务器找不到请求的网页。例如,对于服务器上不存在的网页经常会返回此代码;如果您的网站上没有 robots.txt 文件,而您在 Google 网站管理员工具"诊断"标签的 robots.txt 页上看到此状态码, 则这是正确的状态码。但是,如果您有 robots.txt 文件而又看到此状态码,则说明您的 robots.txt 文件可能命名错误或位于错误的位 置(该文件应当位于顶级域,名为 robots.txt);如果对于 Googlebot 抓取的网址看到此状态码(在"诊断"标签的 HTTP 错误页面上),则表示 Googlebot 跟随的可能是另一个页面的无效链接(是旧链接或输入有误的链接)
405(方法禁用) - 禁用请求中指定的方法
406(不接受) - 无法使用请求的内容特性响应请求的网页
407(需要代理授权) - 此状态码与 401(未授权)类似,但指定请求者应当授权使用代理。如果服务器返回此响应,还表示请求者应当使用代理
408(请求超时) - 服务器等候请求时发生超时
409(冲突) - 服务器在完成请求时发生冲突。服务器必须在响应中包含有关冲突的信息。服务器在响应与前一个请求相冲突的 PUT 请求时可能会返回此代码,以及两个请求的差异列表
410(已删除) - 如果请求的资源已永久删除,服务器就会返回此响应。该代码与 404(未找到)代码类似,但在资源以前存在而现在不存在的情况下,有时会用来替代 404 代码。如果资源已永久移动,您应使用 301 指定资源的新位置
411(需要有效长度) - 服务器不接受不含有效内容长度标头字段的请求
412(未满足前提条件) - 服务器未满足请求者在请求中设置的其中一个前提条件
413(请求实体过大) - 服务器无法处理请求,因为请求实体过大,超出服务器的处理能力
414(请求的 URI 过长) - 请求的 URI(通常为网址)过长,服务器无法处理
415(不支持的媒体类型) - 请求的格式不受请求页面的支持
416(请求范围不符合要求) - 如果页面无法提供请求的范围,则服务器会返回此状态码
417(未满足期望值) - 服务器未满足"期望"请求标头字段的要求
500(服务器内部错误) - 服务器遇到错误,无法完成请求
501(尚未实施) - 服务器不具备完成请求的功能。例如,服务器无法识别请求方法时可能会返回此代码
502(错误网关) - 服务器作为网关或代理,从上游服务器收到无效响应
503(服务不可用) - 服务器目前无法使用(由于超载或停机维护)。通常,这只是暂时状态
504(网关超时) - 服务器作为网关或代理,但是没有及时从上游服务器收到请求
505(HTTP 版本不受支持) - 服务器不支持请求中所用的 HTTP 协议版本
2.安装httpd服务器
1)准备工作
rpm -e httpd --nodeps
/卸载使用RPM方式安装的httpd
vim /etc/sysconfig/network-scripts/ifcfg-eth0 /配置网络地址
DEVICE=eth0
TYPE=Ethernet
ONBOOT=yes
NM_CONTROLLED=no
BOOTPROTO=static
IPADDR=192.168.1.10
NETMASK=255.255.255.0
GATEWAY=192.168.1.1
DNS1=192.168.1.1
vim /etc/sysconfig/network /修改主机名
NETWORKING=yes
HOSTNAME=www.xueluo.org
2)源码编译及安装
a.解包
tar -zxvf /root/httpd-2.2.17.tar.gz -C /usr/src/
cd /usr/src/httpd-2.2.17/
b.配置
./configure --prefix=/usr/local/httpd --enable-so --enable-rewrite --enable-charset-lite --enable-cgi
解:
--prefix:指定程序安装目录
--enable-so:启动动态加载模块支持,使其具有扩展能力;是用来提供DSO支持的核心模块
--enable-rewrite:启动网页地址重写功能,用于网站优化及目录迁移维护
--enable-charset-lite:启用字符集支持,以支持使用各种字符集编码的网页
--enable-cgi:启用CGI脚本程序支持,扩展网站的应用访问能力;通常执行CGI会涉及到安全问题,系统的任何都可以调用,所以,一般会把CGI放在一个特定的目录下执行
c.编译及安装 make && make install
3)确认安装结果
ls /usr/local/httpd
解:
服务目录:/usr/local/httpd/
主配置文件:/usr/local/httpd/conf/httpd.conf
网页目录:/usr/local/httpd/htdocs/
服务脚本:/usr/local/httpd/bin/apachectl
执行程序:/usr/local/httpd/bin/httpd
访问日志: /usr/local/httpd/logs/access_log
错误日志: /usr/local/httpd/logs/error_log
4)优化执行路径(添加到搜索路径中,方便用户使用)
ln -s /usr/local/httpd/bin/* /usr/local/bin/ /添加到PATH搜索路径中,用户不需完整命令路径即可使用
5)添加httpd为系统服务(可通过chkconfig工具控制开机自启)
cp /usr/local/httpd/bin/apachectl /etc/init.d/httpd /拷贝默认脚本文件到系统控制目录
vim /etc/init.d/httpd
#!/bin/bash
# chkconfig:35 82 21 /服务识别参数,指定3、5级别顺序启动标识号
# description:Startup script for the Apache HTTP Server
/文件开头添加chkconfig识别配置,不添加chkconfig添加服务时报错
chkconfig --add httpd /将httpd添加为系统服务
chkconfig --list httpd /查看httpd服务的自启动状态
二、httpd服务器的基本配置
1.Web站点的部署过程
1)确定网站名称、IP地址
需申请合法公网IP地址,并向DNS提供商申请域名,做对应主机的DNS解析记录
公司内部使用可自行配置,无需公网IP,但如需内部使用域名可搭建DNS并对对应解析记录添加,修改/etc/hosts文件提高本地解析速度
2)配置并启动httpd服务
a.配置httpd服务
vim /usr/local/httpd/conf/httpd.conf /编辑httpd主配置文件
ServerName www.xueluo.com:80
/寻找该行(97行) ,设置网站名称
apachectl -t /检测httpd.conf文件是否有语法错误;“Syntax OK”则无误
b.启动httpd服务 /etc/init.d/httpd start
netstat -utpln | grep httpd
3)部署网页文档
编译安装的httpd服务,网站根目录为/usr/local/httpd/htdocs目录下,将网页文档复制到此目录即可;默认提供index.html测试网页
4)在客户机中访问Web站点
5)查看Web站点的访问情况
访问日志: /usr/local/httpd/log/access_log
错误日志: /usr/local/httpd/log/error_log
tail -f /usr/local/httpd/logs/access_log
tail -f /usr/local/httpd/logs/error_log
2.httpd.conf配置文件
1)全局配置项
“关键值” “值”配置格式
ServerRoot:服务目录
ServerAdmin:管理员邮箱
User:运行服务的用户身份;默认daemon
Group:运行服务的组身份;默认daemon
ServerName:网站服务器的域名
DocumentRoot:网页文档的根目录
Listen:监听的IP地址、端口号;默认80端口
PidFile:保存httpd进程PID号的文件
DirectoryIndex:默认的索引页文件;默认首页文件index.html
ErrorLog:错误日志文件的位置
CustomLog:访问日志文件的位置;默认类型common
LogLevel:记录日志的级别,默认为warn(警告)
Timeout:网络连接超时,默认为300秒
KeepAlive:是否保持连接,可选On或Off
MaxKeepAliveRequests:每次连接最多请求文件数
KeepAliveTimeout:保持连接状态时的超时时间
Include:需要包含进来的其他配置文件
2)区域配置项
<Directory /> 限制根目录的访问权限
Options FollowSymLinks 控制选项,允许使用符号链接;访问到符号连接时,是否跳转到对应的连接路径
AllowOverride None 不允许隐含控制文件中的覆盖配置;是否去找.htaccess文件作为配置文件
Order deny,allow 访问控制策略的应用顺序;先检查禁止设定,没有禁止的全部允许
Deny from all 禁止任何人访问此区域
</Directory>
三、网站访问情况统计
1.部署AWStats分析系统
1)安装awstats软件包
tar -zxvf awstats-7.3.tar.gz /解压缩
mv awstats-7.3 /usr/local/awstats /移动解压缩目录;该软件为绿色版直接可用
2)为要统计的站点建立配置文件
cd /usr/local/awstats/tools/ /进入工具目录
chmod +x awstats_configure.pl /给予配置脚本执行权限
./awstats_configure.pl /执行配置脚本
a.指定httpd主配置文件路径
b.设置日志类型 需将httpd服务器的日志记录格式为“combined”(默认为common)
c.为指定Web站点创建配置文件
d.后续配置工作
接下来会自动重启httpd服务(前提/etc/init.d/httpd脚本存在)
如若还需统计其它站点,再次运行./awstats_configure.pl
3)修改站点统计配置文件
vim /etc/awstats/awstats.www.xueluo.org.conf
LogFile="/usr/local/httpd/logs/access_log"
DirData="/var/lib/awstats"
mkdir /var/lib/awstats /创建数据存放目录
4)执行日志分析,并设置cron计划任务
chmod +x awstats_updateall.pl /给予更新脚本执行权限
./awstats_updateall.pl now /立即更新awstats信息并统计到统计数据库中
crontab -e
*/5 * * * * /usr/local/awstats/tools/awstats_updateall.pl now
/etc/init.d/crond start && chkconfig --level 35 crond on
2.访问AWStats分析系统
http://192.168.1.10/awstats/awstats.pl?config=www.xueluo.org
vim /usr/local/httpd/htdocs/awstats.html
<html>
<head>
<meta http-equiv=refresh content="0;url=http://192.168.1.10/awstats
/awstats.pl?config=www.xueluo.org">
</head>
<body>
</body>
</html>
/实现自动调整网页,简化访问操作
http://192.168.1.10/awstats.html
以上是关于Web网站服务的主要内容,如果未能解决你的问题,请参考以下文章