为什么有了 HTTP 还要 RPC
Posted edisonfish
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了为什么有了 HTTP 还要 RPC相关的知识,希望对你有一定的参考价值。
哈喽大家好,我是咸鱼
随着互联网技术的发展,分布式架构越来越被人们所采用。在分布式架构下,为了实现复杂的业务逻辑,应用程序需要分布式通信实现远程调用
而这时候就需要一种协议来支持远程过程调用,以便实现不同应用程序之间的数据交换和信息传递。其中常用的协议包括 HTTP 协议和 RPC 协议
HTTP 协议和 RPC 协议都是用于计算机之间进行通信的协议。那么小伙伴们有没有想过它们之间有什么区别呢?有了HTTP为什么还要RPC呢?
为了解答上面的疑问,我们先从这两个协议的介绍开始
HTTP 和 RPC
- HTTP
学过计算机网络的小伙伴们相信对下面这段话再熟悉不过了:
HTTP(HyperText Transfer Protocol,超文本传输协议)协议,主要用于在 Web 浏览器和 Web 服务器(B/S架构)之间传输超文本标记语言(HTML)文件,支持客户端和服务器之间的通信
HTTP 协议是网络传输协议中应用最为广泛的一种,HTTP 协议基于请求/响应模型,通过在客户端和服务器之间交换请求和响应来传输数据。
它简单、灵活、可扩展,而且最重要的是——它是一种无状态协议,也就是说,每次客户端和服务器之间交换请求和响应时,HTTP协议都是一张白纸,不会记住之前的任何信息
而无状态协议重要的一点优势是可靠,即使某个请求失败或者丢失,也不会影响到其他请求的处理
HTTP 协议使用文本格式进行传输,方便开发人员去阅读和调试,又因具有可跨平台、可扩展、可缓存、可重用等优点被广泛应用于 Web 开发中,常用于网页访问、图片加载等场景
看到这里,小伙伴可能会想,HTTP 这么神,它真的就一点缺点没有吗?当然肯定是有的
前面我们说到 HTTP 协议是无状态的,也就是说每次请求和响应之间是没有关联的,服务器不会记住之前的任何信息,所以会导致每次请求都要重新建立连接
在处理一些长连接或高并发的场景时,每次请求都需要重新建立连接,而这个过程不但会增加了网络开销和延迟,还会消耗服务器的资源,从而降低了效率。如果使用有状态的协议,服务器可以记住之前的信息,避免了重复建立连接的过程
除此之外,因为 HTTP 协议最初设计的目的是为了在客户端和服务器之间传输 HTML 文档,即数据传输格式是基于文本的
所以说 HTTP 协议不支持类型化的数据传输和自定义协议扩展,请求和响应的格式是固定的,这就导致了它不能很好地支持自定义数据结构和复杂逻辑
简单来说,HTTP 协议有点“死板”
- RPC
RPC(Remote Procedure Call,远程过程调用)协议是一种进程间通信协议,用于实现分布式应用程序之间的远程调用,使得不同的应用程序可以像调用本地程序一样调用远程程序
RPC 协议基于函数调用模型。在 RPC 协议中,客户端调用远程服务器上的函数时,会将参数打包成消息并发送给服务器,服务器接收到消息后,解包参数并执行相应的函数,最后将结果打包成消息并发送回客户端、
这这个过程对于客户端来说是透明的,就像调用本地函数一样,即 RPC 可以实现在不同的进程或不同的机器之间进行函数调用
它具有网络传输速度快、协议扩展性好等优点(因为采用了二进制数据传输格式,相对于HTTP等基于文本的协议,二进制格式传输数据更加高效)。不但如此,RPC 的设计初衷就是支持多种数据格式和传输协议,这使得它可以很好地支持复杂的数据结构和逻辑
此外,RPC 协议可以使用更高效的编码和传输协议,还可以使用异步调用来提高响应速度
我们常说,世上没有完美的东西,HTTP 如此,RPC 也是如此
与 HTTP 相比,RPC 更加复杂。为了实现 RPC 协议的设计目标(高效、灵活和可扩展),它需要定义更多的接口和协议,同时需要更多的配置和管理。当然这会提高开发和运维的难度
为了支持跨语言、跨平台的远程调用,RPC 通常不包含安全机制。如果不采取额外的安全措施,就有可能存在身份伪造、数据篡改、拒绝服务等安全问题
为了保护网络安全,我们可以在 RPC 中实现额外的安全措施:
- 例如使用SSL/TLS协议进行加密通信
- 使用数字证书进行身份验证
- 使用访问控制列表进行授权
- 进行安全审计和漏洞扫描
前面我们说到,RPC 通常采用二进制数据传输格式,而不是基于文本的格式。二进制格式虽然传输效率高,但是需要额外的计算资源来序列化和反序列化参数和返回值
在 RPC 中,客户端和服务器之间需要将参数和返回值打包成二进制数据,并在网络上传输。这个过程需要将参数和返回值转换为二进制格式,并进行压缩和编码,以减少数据传输量
对于接收方,需要将接收到的二进制数据解码并转换为原始数据格式。这个过程需要消耗额外的计算资源
因此,RPC需要额外的网络带宽和计算资源来序列化和反序列化参数和返回值
HTTP 和 RPC 的区别
- 目的不同
HTTP 是一种无状态的协议,它的主要目的在客户端和服务器之间交换请求和响应来传输文本内容
RPC 是一种有状态的协议,它的主要目的是在客户端和服务器之间传递信息并调用远程函数
- 传输方式不同
HTTP 使用文本(如 HTML、XML、JSON等)作为载体,并且使用明文传输
RPC可以使用多种格式传输(例如二进制格式),并且可以使用额外的安全加密技术保证传输安全性
- 通信方式不同
HTTP 使用的是请求/响应模型,客户端向服务器发送请求并等待响应。客户端发送一个请求,服务器返回一个响应
RPC 使用的是调用/返回模型,客户端调用服务器上的远程函数并等待返回结果。RPC 支持多种不同的调用方式,如同步调用、异步调用、流式调用等
有了 HTTP 为什么还要 RPC?
虽然 HTTP 已经成为了网络通信的重要标准之一而且被广泛应用于互联网上的各种场景,但是在某些情况下,它并不能满足用户的需求
例如在一些复杂的分布式应用场景下(分布式系统中的服务调用、微服务架构中的服务间通信等),RPC 协议要比 HTTP 协议更适合
咸鱼将从以下几点来阐述一下 RPC 为什么更适合复杂的分布式应用场景
从时效性度来看
- HTTP 协议的数据格式有一定的局限性,比如只能传输文本,传输效率低下
- HTTP协议是基于请求/响应模型,每次请求都需要建立一个新的连接,这样会增加网络开销
- 相比于 HTTP 协议,RPC 协议通常使用二进制数据格式进行传输,通常具有更高的传输效率和更低的网络延迟
- 相比于 HTTP 协议,RRPC协议还支持异步调用和批量调用等高级特性,可以提高系统的性能和吞吐量
从安全性来看
- HTTP 是一种文本协议,数据传输使用的是明文,这样就容易被中间人窃听或者篡改数据(不过可以使用SSL/TLS 协议对数据进行加密和认证)
- 相比于 HTTP 协议,RPC 支持传输各种类型的数据(比如二进制),可以更快灵活地传输大量数据,并且也可以加密传输以保证安全性
从场景复杂度来看
- 在复杂的业务逻辑和数据结构场景下,通常需要进行多次请求和响应操作,而 HTTP 作为无状态协议无法保持会话状态,每次请求和响应都需要重新建立连接和传输数据,这会导致网络延迟和性能下降
- HTTP协议的请求和响应通常是基于文本或二进制数据格式,无法直接支持复杂的数据结构,例如对象、数组、枚举等
- 相比于 HTTP 协议,RPC 是一种有状态协议,而且 RPC 可以通过定义接口和方法来封装业务逻辑,使得客户端可以通过简单的调用来完成复杂的操作
- 相比于 HTTP 协议,RPC协议是一种面向对象的协议,它可以直接支持复杂的数据结构,例如对象、数组、枚举等
有了HTTP,为什么还要RPC?
很长时间以来都没有怎么好好搞清楚 RPC(即 Remote Procedure Call,远程过程调用)和 HTTP 调用的区别,不都是写一个服务然后在客户端调用么?这里请允许我迷之一笑~Naive!
本文简单地介绍一下两种形式的 C/S 架构,先说一下他们最本质的区别,就是 RPC 主要是基于 TCP/IP 协议的,而 HTTP 服务主要是基于 HTTP 协议的。
我们都知道 HTTP 协议是在传输层协议 TCP 之上的,所以效率来看的话,RPC 当然是要更胜一筹啦!下面来具体说一说 RPC 服务和 HTTP 服务。
OSI 网络七层模型
在说 RPC 和 HTTP 的区别之前,我觉的有必要了解一下 OSI 的七层网络结构模型(虽然实际应用中基本上都是五层)。
它可以分为以下几层:(从上到下)
第一层:应用层。定义了用于在网络中进行通信和传输数据的接口。
第二层:表示层。定义不同的系统中数据的传输格式,编码和解码规范等。
第三层:会话层。管理用户的会话,控制用户间逻辑连接的建立和中断。
第四层:传输层。管理着网络中的端到端的数据传输。
第五层:网络层。定义网络设备间如何传输数据。
第六层:链路层。将上面的网络层的数据包封装成数据帧,便于物理层传输。
-
第七层:物理层。 这一层主要就是传输这些二进制数据。
实际应用过程中,五层协议结构里面是没有表示层和会话层的。应该说它们和应用层合并了。
我们应该将重点放在应用层和传输层这两个层面。因为 HTTP 是应用层协议,而 TCP 是传输层协议。
好,知道了网络的分层模型以后我们可以更好地理解为什么 RPC 服务相比 HTTP 服务要 Nice 一些!
RPC 服务
从三个角度来介绍 RPC 服务,分别是:
RPC 架构
同步异步调用
流行的 RPC 框架
RPC 架构
先说说 RPC 服务的基本架构吧。我们可以很清楚地看到,一个完整的 RPC 架构里面包含了四个核心的组件。
分别是:
Client
Server
Client Stub
-
Server Stub(这个Stub大家可以理解为存根)
分别说说这几个组件:
客户端(Client),服务的调用方。
服务端(Server),真正的服务提供者。
服务端存根,接收客户端发送过来的消息,将消息解包,并调用本地的方法。
RPC 主要是用在大型企业里面,因为大型企业里面系统繁多,业务线复杂,而且效率优势非常重要的一块,这个时候 RPC 的优势就比较明显了。实际的开发当中是这么做的,项目一般使用 Maven 来管理。
比如我们有一个处理订单的系统服务,先声明它的所有的接口(这里就是具体指 Java 中的 Interface),然后将整个项目打包为一个 jar 包,服务端这边引入这个二方库,然后实现相应的功能,客户端这边也只需要引入这个二方库即可调用了。
为什么这么做?主要是为了减少客户端这边的 jar 包大小,因为每一次打包发布的时候,jar 包太多总是会影响效率。另外也是将客户端和服务端解耦,提高代码的可移植性。
同步调用与异步调用
什么是同步调用?什么是异步调用?同步调用就是客户端等待调用执行完成并返回结果。
异步调用就是客户端不等待调用执行完成返回结果,不过依然可以通过回调函数等接收到返回结果的通知。如果客户端并不关心结果,则可以变成一个单向的调用。
这个过程有点类似于 Java 中的 Callable 和 Runnable 接口,我们进行异步执行的时候,如果需要知道执行的结果,就可以使用 Callable 接口,并且可以通过 Future 类获取到异步执行的结果信息。
如果不关心执行的结果,直接使用 Runnable 接口就可以了,因为它不返回结果,当然啦,Callable 也是可以的,我们不去获取 Future 就可以了。
流行的 RPC 框架
目前流行的开源 RPC 框架还是比较多的。下面重点介绍三种:
①gRPC 是 Google 最近公布的开源软件,基于最新的 HTTP2.0 协议,并支持常见的众多编程语言。
我们知道 HTTP2.0 是基于二进制的 HTTP 协议升级版本,目前各大浏览器都在快马加鞭的加以支持。
这个 RPC 框架是基于 HTTP 协议实现的,底层使用到了 Netty 框架的支持。
②Thrift 是 Facebook 的一个开源项目,主要是一个跨语言的服务开发框架。它有一个代码生成器来对它所定义的 IDL 定义文件自动生成服务代码框架。
用户只要在其之前进行二次开发就行,对于底层的 RPC 通讯等都是透明的。不过这个对于用户来说的话需要学习特定领域语言这个特性,还是有一定成本的。
③Dubbo 是阿里集团开源的一个极为出名的 RPC 框架,在很多互联网公司和企业应用中广泛使用。协议和序列化框架都可以插拔是及其鲜明的特色。
同样的远程接口是基于 Java Interface,并且依托于 Spring 框架方便开发。可以方便的打包成单一文件,独立进程运行,和现在的微服务概念一致。
HTTP 服务
其实在很久以前,我对于企业开发的模式一直定性为 HTTP 接口开发,也就是我们常说的 RESTful 风格的服务接口。
的确,对于在接口不多、系统与系统交互较少的情况下,解决信息孤岛初期常使用的一种通信手段;优点就是简单、直接、开发方便。
利用现成的 HTTP 协议进行传输。我们记得之前本科实习在公司做后台开发的时候,主要就是进行接口的开发,还要写一大份接口文档,严格地标明输入输出是什么?说清楚每一个接口的请求方法,以及请求参数需要注意的事项等。
POST http://www.httpexample.com/restful/buyer/info/shar
接口可能返回一个 JSON 字符串或者是 XML 文档。然后客户端再去处理这个返回的信息,从而可以比较快速地进行开发。
但是对于大型企业来说,内部子系统较多、接口非常多的情况下,RPC 框架的好处就显示出来了,首先就是长链接,不必每次通信都要像 HTTP 一样去 3 次握手什么的,减少了网络开销。
其次就是 RPC 框架一般都有注册中心,有丰富的监控管理;发布、下线接口、动态扩展等,对调用方来说是无感知、统一化的操作。
总结
RPC 服务和 HTTP 服务还是存在很多的不同点的,一般来说,RPC 服务主要是针对大型企业的,而 HTTP 服务主要是针对小企业的,因为 RPC 效率更高,而 HTTP 服务开发迭代会更快。
总之,选用什么样的框架不是按照市场上流行什么而决定的,而是要对整个项目进行完整地评估,从而在仔细比较两种开发框架对于整个项目的影响,最后再决定什么才是最适合这个项目的。
一定不要为了使用 RPC 而每个项目都用 RPC,而是要因地制宜,具体情况具体分析。
编辑:陶家龙
出处:https://tinyurl.com/y4o875zm
精彩文章推荐:
以上是关于为什么有了 HTTP 还要 RPC的主要内容,如果未能解决你的问题,请参考以下文章