muduo源码分析之HttpServer

Posted 零十

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了muduo源码分析之HttpServer相关的知识,希望对你有一定的参考价值。

相关文件

muduo/net/http/*
HttpRequst:http请求类
HttpResponse: http响应类
HttpContext: http协议解析类
HttpServer: http服务器类

作用

解析http请求,用户只需根据http请求类,设置好响应类,http服务器会把响应报文发给客户端(浏览器)。

先备知识

http请求

一个典型的http请求:

    GET /hello HTTP/1.1\\r\\n
    Host: 192.168.91.129:8000\\r\\n
    Connection: keep-alive\\r\\n
    Upgrade-Insecure-Requests: 1\\r\\n
    User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (Khtml, like Gecko) Chrome/90.0.4430.212 Safari/537.36 Edg/90.0.818.62\\r\\n
    Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9\\r\\n
    Accept-Encoding: gzip, deflate\\r\\n
    Accept-Language: zh-CN,zh;q=0.9,en;q=0.8,en-GB;q=0.7,en-US;q=0.6\\r\\n
    \\r\\n

请求报文有请求行line+请求头header+请求实体body。
上面第一行即请求行,下面的是请求头,没有body。
header和body之间有一空行。
请求行
请求方法有Get, Post, Head, Put, Delete等
协议版本:1.0、1.1
请求头
Accept:浏览器可接受的媒体(MIME)类型;
Accept-Language:浏览器所希望的语言种类
Accept-Encoding:浏览器能够解码的编码方法,如gzip,deflate等
User-Agent:告诉HTTP服务器, 客户端使用的操作系统和浏览器的名称和版本
Connection:表示是否需要持久连接,Keep-Alive表示长连接,close表示短连接

http应答

由状态行status line+响应头header+实体body组成
一个典型的http应答:

HTTP/1.1 200 OK
Content-Length: 112
Connection: Keep-Alive
Content-Type: text/html
Server: Muduo

<html><head><title>This is title</title></head><body><h1>Hello</h1>Now is 20130611 02:14:31.518462</body></html>

当然每行结尾都是有/r/n的,header和body之间有一空行。
第一行为状态行
1XX 提示信息 - 表示请求已被成功接收,继续处理
2XX 成功 - 表示请求已被成功接收,理解,接受
3XX 重定向 - 要完成请求必须进行更进一步的处理
4XX 客户端错误 - 请求有语法错误或请求无法实现
5XX 服务器端错误 - 服务器执行一个有效请求失败

使用

在muduo/net/http/tests中提供了使用示例
HttpServer_test.cc

#include "muduo/net/http/HttpServer.h"
#include "muduo/net/http/HttpRequest.h"
#include "muduo/net/http/HttpResponse.h"
#include "muduo/net/EventLoop.h"
#include "muduo/base/Logging.h"

#include <iostream>
#include <map>

using namespace muduo;
using namespace muduo::net;

extern char favicon[555];
bool benchmark = false;

void onRequest(const HttpRequest& req, HttpResponse* resp)
{
  std::cout << "Headers " << req.methodString() << " " << req.path() << std::endl;
  if (!benchmark)
  {
    const std::map<string, string>& headers = req.headers();
    for (const auto& header : headers)
    {
      std::cout << header.first << ": " << header.second << std::endl;
    }
  }
  //按请求路径
  if (req.path() == "/") //请求行中的路径是 / 时
  {
    resp->setStatusCode(HttpResponse::k200Ok);//设置状态码
    resp->setStatusMessage("OK");
    resp->setContentType("text/html");
    resp->addHeader("Server", "Muduo");
    string now = Timestamp::now().toFormattedString();
	//设置应答实体body
    resp->setBody("<html><head><title>This is title</title></head>"
        "<body><h1>Hello</h1>Now is " + now +
        "</body></html>");
  }
  else if (req.path() == "/favicon.ico")
  {
    resp->setStatusCode(HttpResponse::k200Ok);
    resp->setStatusMessage("OK");
    resp->setContentType("image/png");
    resp->setBody(string(favicon, sizeof favicon));
  }
  else if (req.path() == "/hello")
  {
    resp->setStatusCode(HttpResponse::k200Ok);
    resp->setStatusMessage("OK");
    resp->setContentType("text/plain");
    resp->addHeader("Server", "Muduo");
    resp->setBody("hello, world!\\n");
  }
  else
  {
    resp->setStatusCode(HttpResponse::k404NotFound);
    resp->setStatusMessage("Not Found");
    resp->setCloseConnection(true);
  }
}

int main(int argc, char* argv[])
{
  int numThreads = 0;
  if (argc > 1)
  {
    benchmark = true;
    Logger::setLogLevel(Logger::WARN);
    numThreads = atoi(argv[1]);
  }
  EventLoop loop;
  HttpServer server(&loop, InetAddress(8000), "dummy");
  server.setHttpCallback(onRequest);
  server.setThreadNum(numThreads);
  server.start();
  loop.loop();
}

char favicon[555] = {
  \'\\x89\', \'P\', \'N\', \'G\', \'\\xD\', \'\\xA\', \'\\x1A\', \'\\xA\',
  //太长,略,是一张图标的数据
};

编译运行该示例,即开启了一个http服务器
image
在浏览器地址栏输出ip地址+端口号+请求地址可访问
image
这里访问的是/地址,返回 "hello" +时间戳

可使用wireshark抓包查看报文
image

HttpServer源码分析

HttpServer类

HttpServer基于TcpServer类,实现TcpServer的onConnection()和onMessage()回调函数。
对外给用户提供解析完http请求后的回调函数接口,即上文中的OnRequest(),在HttpServer中为httpCallback_()。
私有成员:

void onConnection(const TcpConnectionPtr& conn);
void onMessage(const TcpConnectionPtr& conn,
               Buffer* buf,
               Timestamp receiveTime);
void onRequest(const TcpConnectionPtr&, const HttpRequest&);

TcpServer server_;
HttpCallback httpCallback_;//在处理http请求的过程(onrequest)中回调此函数,对请求具体处理

1、当客户端连接时,回调OnConnection(),HttpServer给Tcpconnection设置协议解析类HttpContext。
2、当客户端发送请求,回调OnMessage(),使用HttpContext的方法解析缓冲区buffer中的请求,HttpContext将解析后的请求封装在HttpRequest类中,主要容器是map。
3、在OnMessage()中继续调用Onrequest(),将如何对请求应答交给用户回调函数httpCallback_()。
4、httpCallback_()需要传出一个HttpResponse类,Onrequest()将HttpResponse中的数据发送给客户端。

//HttpServer.cc
void HttpServer::onConnection(const TcpConnectionPtr& conn)
{
  if (conn->connected())
  {
    conn->setContext(HttpContext());//给conn绑定上下文对象,使用了boost::any,可以是任意对象
  }
}

void HttpServer::onMessage(const TcpConnectionPtr& conn,
                           Buffer* buf,
                           Timestamp receiveTime)
{
  HttpContext* context = boost::any_cast<HttpContext>(conn->getMutableContext());

  if (!context->parseRequest(buf, receiveTime))//使用协议解析类的方法解析缓冲区中的请求
  {
    conn->send("HTTP/1.1 400 Bad Request\\r\\n\\r\\n");
    conn->shutdown();
  }

  if (context->gotAll())
  {
    onRequest(conn, context->request());//解析后的请求放在HttpRequest中,由context->request()返回
    context->reset();
  }
}

void HttpServer::onRequest(const TcpConnectionPtr& conn, const HttpRequest& req)
{
  const string& connection = req.getHeader("Connection");
  bool close = connection == "close" ||
    (req.getVersion() == HttpRequest::kHttp10 && connection != "Keep-Alive");
  HttpResponse response(close);//应答类
  httpCallback_(req, &response);//response为输入输出参数
  Buffer buf;
  response.appendToBuffer(&buf);//将应答报文放进缓冲区
  conn->send(&buf);//发送给客户端
  if (response.closeConnection())
  {
    conn->shutdown();
  }
}

HttpRequest请求类

HttpContext协议解析类将解析后的数据封装在HttpRequest请求类
再回忆一遍请求报文包含什么?至少有请求行和请求头。
请求行中包含请求方法、请求地址、协议版本,如GET /hello HTTP/1.1\\r\\n。
请求头的数据则放进一个map<string, string>中
私有成员:

  enum Method
  {
    kInvalid, kGet, kPost, kHead, kPut, kDelete
  };
  enum Version
  {
    kUnknown, kHttp10, kHttp11
  };

Method method_; //请求方法
Version version_;/协议版本
string path_; //请求路径
string query_; //?后的数据,如GET方法带参数时的URL: /test/demo_form.php?name1=value1&name2=value2
Timestamp receiveTime_;//时间戳
std::map<string, string> headers_;//请求头

主要函数成员不过是一些get/set函数
如header的处理

//HttpRequest.h
void addHeader(const char* start, const char* colon, const char* end)
  {
    string field(start, colon);//colon为冒号:所在位置
    ++colon;
	//去除左空格
    while (colon < end && isspace(*colon))
    {
      ++colon;
    }
    string value(colon, end);
	//去除右空格
    while (!value.empty() && isspace(value[value.size()-1]))
    {
      value.resize(value.size()-1);
    }
    headers_[field] = value; //存入map
  }

  string getHeader(const string& field) const
  {
    string result;
	//查找map并返回
    std::map<string, string>::const_iterator it = headers_.find(field);
    if (it != headers_.end())
    {
      result = it->second;
    }
    return result;
  }

HttpContext协议解析类

HttpContext读取缓冲区中的字符串进行解析,基于状态机实现,依次解析请求行、请求头header、请求体body。
HttpContext数据成员包含解析状态和HttpRequest类

enum HttpRequestParseState
{
  kExpectRequestLine,//解析请求行
  kExpectHeaders,//解析headers
  kExpectBody,//解析body
  kGotAll, //解析完成
};

HttpRequestParseState state_;//请求解析状态
HttpRequest request_;//http请求

两个主要解析方法
processRequestLine()解析请求行,取出请求方法、请求路径、协议版本等信息。
parseRequest按照状态机依次解析请求报文的全部数据。

//HttpContext.cc
bool HttpContext::processRequestLine(const char* begin, const char* end)
{
  bool succeed = false;
  const char* start = begin;
  const char* space = std::find(start, end, \' \');
  if (space != end && request_.setMethod(start, space))
  {
    start = space+1;
    space = std::find(start, end, \' \');
    if (space != end)
    {
      const char* question = std::find(start, space, \'?\');
      if (question != space)
      {
        request_.setPath(start, question);
        request_.setQuery(question, space);//GET参数
      }
      else
      {
        request_.setPath(start, space);//路径
      }
      start = space+1;
      succeed = end-start == 8 && std::equal(start, end-1, "HTTP/1.");
      if (succeed)
      {
        if (*(end-1) == \'1\')
        {
          request_.setVersion(HttpRequest::kHttp11);//协议版本1.1
        }
        else if (*(end-1) == \'0\')
        {
          request_.setVersion(HttpRequest::kHttp10);//协议版本1.0
        }
        else
        {
          succeed = false;
        }
      }
    }
  }
  return succeed;
}

// return false if any error
bool HttpContext::parseRequest(Buffer* buf, Timestamp receiveTime)
{
  bool ok = true;
  bool hasMore = true;
  while (hasMore)
  {·
  	//解析请求行
    if (state_ == kExpectRequestLine)
    {
      const char* crlf = buf->findCRLF();//寻找/r/n
      if (crlf)
      {
        ok = processRequestLine(buf->peek(), crlf);//函数实现在上方
        if (ok)
        {
          request_.setReceiveTime(receiveTime);//时间戳
          buf->retrieveUntil(crlf + 2);
          state_ = kExpectHeaders; //下一步,解析headers
        }
        else
        {
          hasMore = false;
        }
      }
      else
      {
        hasMore = false;
      }
    }
	//解析headers
    else if (state_ == kExpectHeaders)
    {
      const char* crlf = buf->findCRLF();
      if (crlf)
      {
	  	//找到冒号:位置
        const char* colon = std::find(buf->peek(), crlf, \':\');
        if (colon != crlf)
        {
          request_.addHeader(buf->peek(), colon, crlf);//HttpRequest类方法,添加一个header
        }
        else
        {
          // empty line, end of header
          // FIXME:
          state_ = kGotAll;//完成
          hasMore = false;//跳出while循环
        }
        buf->retrieveUntil(crlf + 2);
      }
      else
      {
        hasMore = false;
      }
    }
    else if (state_ == kExpectBody)//目前不解析body
    {
      // FIXME:
    }
  }
  return ok;
}

HttpReasponse响应类

应答类,由用户代码设置数据成员,为HttpServer提供用于发送的buffer数据。
数据成员:

std::map<string, string> headers_; //header列表
HttpStatusCode statusCode_; //状态响应码
// FIXME: add http version
string statusMessage_;//状态响应码对应的文本信息
bool closeConnection_;
string body_;

主要函数appendToBuffer(),将响应部分添加到buffer

//HttpRsponse.cc
void HttpResponse::appendToBuffer(Buffer* output) const
{
  char buf[32];
  //添加响应头
  snprintf(buf, sizeof buf, "HTTP/1.1 %d ", statusCode_);
  output->append(buf);
  output->append(statusMessage_);
  output->append("\\r\\n");

  if (closeConnection_)
  { 
    //短连接
    output->append("Connection: close\\r\\n");
  }
  else
  {
    snprintf(buf, sizeof buf, "Content-Length: %zd\\r\\n", body_.size());//实体长度
    output->append(buf);
    output->append("Connection: Keep-Alive\\r\\n");
  }

  //header列表
  for (const auto& header : headers_)
  {
    output->append(header.first);
    output->append(": ");
    output->append(header.second);
    output->append("\\r\\n");
  }

  output->append("\\r\\n");//header和body之间的空行
  output->append(body_);
}

以上是关于muduo源码分析之HttpServer的主要内容,如果未能解决你的问题,请参考以下文章

Tornado 高并发源码分析之四--- HTTPServer 与 TCPServer 对象

(10)muduo_base库源码分析:Timestamp.cc和Timestamp.h

golang-net/http源码分析之http server

Muduo网络库源码分析 EventLoop事件循环(Poller和Channel)

muduo源代码分析--Reactor模式在muduo中的使用

Web API源码剖析之HttpServer