初步了解HTTP

Posted kunmomo

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了初步了解HTTP相关的知识,希望对你有一定的参考价值。

HTTP简介:

HTTP:HyperText  Transfer Protocol 超文本传输协议,是因特网上使用最为广泛的一种网络传输议,是用于从万维网(www :world  wide web)服务器传输超文本到本地浏览器的一种传送协议,所www文件都必须遵守这个协议。

HTTP版本:

HTTP0.9:只支持GET请求不支持POST请求,所以客户端无法向服务器传送太多信息,通讯中没有指定版本号,不支持请求头。

HTTP1.0:开始在通讯中指定版本号,现在仍然被广泛使用,特别是在代理服务器中。

HTTP1.1:持久连接被默认采用,能够很好的配合代理服务器工作,支持以管道方式同时发送多个请求,以便降低线路负载,提高传输速度。

HTTP工作原理:

HTTP工作于客户端-服务端架构上,也就是C/S架构,通过一个可靠的链接来交换信息,是一个无状态的请求/响应协议。浏览器作为HTTP客户端通过URL向HTTP服务端即Web服务器发送所有请求,(Web服务器:Apache服务器、IIS服务器)HTTP服务端根据接收到的请求,向HTTP客户端返回响应信息。

HTTP使用URI(统一资源标识符)来传输数据和建立连接。一旦建立连接,数据消息就通过类似Internet邮件所使用的格式[RFC5322]和多用途Internet邮件扩展(MIME)[RFC2045]来传送。

HTTP默认端口号为80,也可以改为8080或其他端口。

HTTP有三点需要注意:

1)HTTP是无状态的:无状态是指协议对于事物的处理没有记忆能力,缺少状态意味着,如果后续需要前面的数据,我们必须重传,这样可能导致每次连接传送的数据量增大。

2)HTTP是无连接的:无连接的含义是限制每次来连接只接受一个请求,服务器处理完客户的请求,并接收到客户的应答,即断开连接,使用这种方式来节省传输速度。

3)HTTP是媒体独立的:只要客户端和服务器知道要如何处理数据的内容,任何类型的数据都可以通过HTTP发送。

客户端请求消息:

客户端发送一个HTTP请求到服务器的请求消息包括以下格式:请求行(request line)、请求头部(header)、空行和请求数据四个部分组成,下图给出了请求报文的一般格式。

技术分享图片
 

服务器响应消息

HTTP响应也由四个部分组成,分别是:状态行、消息报头、空行和响应正文。

技术分享图片
 

实例

下面实例是一点典型的使用GET来传递数据的实例:

客户端请求:

GET /hello.txt HTTP/1.1User-Agent: curl/7.16.3 libcurl/7.16.3 OpenSSL/0.9.7l zlib/1.2.3Host: www.example.comAccept-Language: en, mi

服务端响应:

HTTP/1.1 200(状态行) OKDate: Mon, 27 Jul 2009 12:28:53 GMTServer: ApacheLast-Modified: Wed, 22 Jul 2009 19:15:56 GMTETag: "34aa387-d-1568eb00"Accept-Ranges: bytesContent-Length: 51Vary: Accept-EncodingContent-Type: text/plain(消息报头)

HTTP 请求方法

HTTP1.0定义了三种请求方法:GET、POST、HEAD

HTTP1.1新增了五种请求方法:OPTIONS、PUT、DELETE、TARCE、CONNECT

 

GET:请求指定的页面信息,并返回实体主体。

HEAD:类似于get请求,只不过返回的响应中没有具体的内容,用于获取报头

POST:向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。POST请求可能会导致新的资源的建立和/或已有资源的修改。

PUT:从客户端向服务器传送的数据取代指定的文档的内容。

DELETE:请求服务器删除指定的页面。

CONNECT:HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。

OPTIONS:允许客户端查看服务器的性能。

TRACE:回显服务器收到的请求,主要用于测试或诊断。

HTTP 响应头信息

HTTP请求头提供了关于请求,响应或者其他的发送实体的信息。接下来将具体来介绍HTTP请求头信息。

Allow:服务器支持哪些请求方法(如GET、POST等)。

Content-Encoding:文档的编码(Encode)方法。

Content-Length:表示内容长度。

Content-Type:表示后面的文档属于什么MIME类型。S

Date:当前的GMT时间。你可以用setDateHeader来设置这个头以避免转换时间格式的麻烦。

Expires:应该在什么时候认为文档已经过期,从而不再缓存它?

Last-Modified:文档的最后改动时间。

Location:表示客户应当到哪里去提取文档。

Refresh:表示浏览器应该在多少时间之后刷新文档,以秒计。

Server:服务器名字。

Set-Cookie:设置和页面关联的Cookie。

WWW-Authenticate:客户应该在Authorization头中提供什么类型的授权信息

HTTP 状态码

当浏览者访问一个网页时,浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前,此网页所在的服务器会返回一个包含HTTP状态码的信息头(server header)用以响应浏览器的请求。

HTTP状态码的英文为HTTP Status Code。

下面是常见的HTTP状态码:

200 -请求成功

301 -资源(网页等)被永久转移到其它URL(永久性转移)

302 -暂时性转移

307 临时重定向

404 -请求的资源(网页等)不存在

500 -内部服务器错误

HTTP状态码分类

HTTP状态码由三个十进制数字组成,第一个十进制数字定义了状态码的类型,后两个数字没有分类的作用。HTTP状态码共分为5种类型:

HTTP状态码分类

分类分类描述

1**信息,服务器收到请求,需要请求者继续执行操作

2**成功,操作被成功接收并处理

3**重定向,需要进一步的操作以完成请求

4**客户端错误,请求包含语法错误或无法完成请求

5**服务器错误,服务器在处理请求的过程中发生了错误

100Continue继续。客户端应继续其请求

101Switching Protocols切换协议。服务器根据客户端的请求切换协议。只能切换到更高级的协议,例如,切换到HTTP的新版本协议

 

200OK请求成功。一般用于GET与POST请求

201Created已创建。成功请求并创建了新的资源

202Accepted已接受。已经接受请求,但未处理完成

203Non-Authoritative Information非授权信息。请求成功。但返回的meta信息不在原始的服务器,而是一个副本

204No Content无内容。服务器成功处理,但未返回内容。在未更新网页的情况下,可确保浏览器继续显示当前文档

205Reset Content重置内容。服务器处理成功,用户终端(例如:浏览器)应重置文档视图。可通过此返回码清除浏览器的表单域

206Partial Content部分内容。服务器成功处理了部分GET请求

 

300Multiple Choices多种选择。请求的资源可包括多个位置,相应可返回一个资源特征与地址的列表用于用户终端(例如:浏览器)选择

301Moved Permanently永久移动。请求的资源已被永久的移动到新URI,返回信息会包括新的URI,浏览器会自动定向到新URI。今后任何新的请求都应使用新的URI代替

302Found临时移动。与301类似。但资源只是临时被移动。客户端应继续使用原有URI

303See Other查看其它地址。与301类似。使用GET和POST请求查看

304Not Modified未修改。所请求的资源未修改,服务器返回此状态码时,不会返回任何资源。客户端通常会缓存访问过的资源,通过提供一个头信息指出客户端希望只返回在指定日期之后修改的资源

305Use Proxy使用代理。所请求的资源必须通过代理访问

306Unused已经被废弃的HTTP状态码

307Temporary Redirect临时重定向。与302类似。使用GET请求重定向

 

400Bad Request客户端请求的语法错误,服务器无法理解

401Unauthorized请求要求用户的身份认证

402Payment Required保留,将来使用

403Forbidden服务器理解请求客户端的请求,但是拒绝执行此请求

404Not Found服务器无法根据客户端的请求找到资源(网页)。通过此代码,网站设计人员可设置"您所请求的资源无法找到"的个性页面

405Method Not Allowed客户端请求中的方法被禁止

406Not Acceptable服务器无法根据客户端请求的内容特性完成请求

407Proxy Authentication Required请求要求代理的身份认证,与401类似,但请求者应当使用代理进行授权

408Request Time-out服务器等待客户端发送的请求时间过长,超时

409Conflict服务器完成客户端的PUT请求是可能返回此代码,服务器处理请求时发生了冲突

410Gone客户端请求的资源已经不存在。410不同于404,如果资源以前有现在被永久删除了可使用410代码,网站设计人员可通过301代码指定资源的新位置

411Length Required服务器无法处理客户端发送的不带Content-Length的请求信息

412Precondition Failed客户端请求信息的先决条件错误

413Request Entity Too Large由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息

414Request-URI Too Large请求的URI过长(URI通常为网址),服务器无法处理

415Unsupported Media Type服务器无法处理请求附带的媒体格式

416Requested range not satisfiable客户端请求的范围无效

417Expectation Failed服务器无法满足Expect的请求头信息

 

500Internal Server Error服务器内部错误,无法完成请求

501Not Implemented服务器不支持请求的功能,无法完成请求

502Bad Gateway充当网关或代理的服务器,从远端服务器接收到了一个无效的请求

503Service Unavailable由于超载或系统维护,服务器暂时的无法处理客户端的请求。延时的长度可包含在服务器的Retry-After头信息中

504Gateway Time-out充当网关或代理的服务器,未及时从远端服务器获取请求

505HTTP Version not supported服务器不支持请求的HTTP协议的版本,无法完成处理

HTTP  content-type

Content-Type,内容类型,一般是指网页中存在的Content-Type,用于定义网络文件的类型和网页的编码,决定浏览器将以什么形式、什么编码读取这个文件,这就是经常看到一些Asp网页点击的结果却是下载到的一个文件或一张图片的原因。

啦啦啦啦HTTP基础就到这了。。。

 



以上是关于初步了解HTTP的主要内容,如果未能解决你的问题,请参考以下文章

web框架简介, 以及 HTTP协议初步了解

爬虫学习之HTTP协议初步了解

Fildder的初步了解

jieba初步了解

ajax 初步了解

AsyncTask的初步了解