游戏服务器的架构演进多进程架构通信
Posted 森明帮大于黑虎帮
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了游戏服务器的架构演进多进程架构通信相关的知识,希望对你有一定的参考价值。
系列文章目录
文章目录
前言
一、游戏服务器特征
游戏服务器端,是一个会长期运行的程序,并且它还要服务于多个不定时,不定点的网络请求。所以这类软件的特点是要非常关注稳定性和性能。这类程序如果需要多个协作来提高承载能力,则还要关注部署和扩容的便利性;同时,还需要考虑如何实现某种程度容灾需求。由于多进程协同工作,也带来了开发的复杂度,这也是需要关注的问题。
功能约束,是架构设计决定性因素。基于游戏领域的功能特征,对服务器端系统来说,有以下几个特殊的需求:
-
对于游戏数据和玩家数据的存储
-
对玩家数据进行数据广播和同步
-
把一部分游戏逻辑在服务器上运算,做好验证,防止外挂。
针对以上的需求特征,在服务器端,我们往往会关注对电脑内存和CPU的使用,以求在特定业务代码下,能尽量满足承载量和响应延迟的需求。最基本的做法就是“空间换时间”,用各种缓存的方式来以求得CPU和内存空间上的平衡。
在CPU和内存之上,是另外一个约束因素:网卡。网络带宽直接限制了服务器的处理能力,所以游戏服务器架构也必定要考虑这个因素。
二、游戏服务器架构要素
对于游戏服务端架构,最重要的三个部分就是,如何使用CPU、内存、网卡的设计:
内存架构:主要决定服务器如何使用内存,以最大化利用服务器端内存来提高承载量,降低服务延迟。
逻辑架构:设计如何使用进程、线程、协程这些对于CPU调度的方案。选择同步、异步等不同的编程模型,以提高服务器的稳定性和承载量。可以分区分服,也可以采用世界服的方式,将相同功能模块划分到不同的服务器来处理。
通信模式:决定使用何种方式通讯。基于游戏类型不同采用不同的通信模式,比如http,tcp,udp等。
三、服务器演化进程
1.卡牌等休闲游戏弱交互游戏
服务器基于游戏类型不同,所采用的架构也有所不同,我们先讲一下简单的模型,采用http通信模式架构的服务器:
这种服务器架构和我们常用的web服务器架构差不多,也是采用nginx负载集群支持服务器的水平扩展,memcache做缓存。
唯一不同的地点不同的在于通信层需要对协议再加工和加密,一般每个公司都有自己的一套基于http的协议层框架,很少采用开源框架。
2.长链接游戏服务器
长连接游戏和弱联网游戏不同的地方在于:长连接中,玩家是有状态的,服务器可以时时和client交互,数据的传送,不像弱联网一般每次都需要重新创建一个连接,消息传送的频率以及速度上都快于弱联网游戏。
1.第一代网游服务器(单线程无阻塞)
最早的游戏服务器是1978年,英国著名的财经学校University of Essex的学生 Roy Trubshaw编写了世界上第一个MUD
程序,叫做《MUD1》
。
-
《MUD1》
程序的源代码在 ARPANET共享之后,在全世界广泛流行起来。不断完善的 MUD1的基础上产生了开源的 MudOS(1991),成为众多网游的鼻祖。 -
《MUD1》
是一款纯文字的世界,没有任何图片,但是不同计算机前的玩家可以在游戏里共同冒险、交流。
与以往具有网络联机功能的游戏相比, MUD1是第一款真正意义上的实时多人交互的网络游戏,它最大的特色是能够保证整个虚拟世界和玩家角色的持续发展——无论是玩家退出后重新登录还是服务器重启,游戏中的场景、宝箱、怪物和谜题仍保持不变,玩家的角色也依然是上次的状态。
MUDOS
使用单线程无阻塞套接字来服务所有玩家,所有玩家的请求都发到同一个线程去处理,主线程每隔1秒钟更新一次所有对象(网络收发,对象状态,刷新地图,刷新NPC)。
用户使用 Telnet之类的客户端用 Tcp协议连接到 MUDOS上,使用纯文字进行游戏,每条指令用回车进行分割。这样的系统在当时每台服务器承载个4000人同时游戏。从1991年的 MUDOS发布后,全球各地都在为他改进,扩充,推出新版本。
MUDOS
中游戏内容通过 LPC脚本进行定制,逻辑处理采用单线程tick轮询,这也是第一款服务端架构模型,后来被应用到不同游戏上。后续很多游戏都是跟《UO》一样,直接在 MUDOS
上进行二次开发,直到 如今,一些回合制游戏,以及对运算量小的游戏,依然采用这种服务器架构。
第一代服务器架构图:
线程模型:
2.第二代网游服务器(分区分服)
2000年左右,随着图形界面的出现,游戏更多的采用图形界面与用户交互。此时随着在线人数的增加和游戏数据的增加,服务器变得不抗重负。于是就有了分服模型。分服模型结构如下:
分服模型是游戏服务器中最典型,也是历久最悠久的模型。在早期服务器的承载量达到上限的时候,游戏开发者就通过架设更多的服务器来解决。这样提供了很多个游戏的“平行世界”,让游戏中的人人之间的比较,产生了更多的空间。
其特征是游戏服务器是一个个单独的世界。每个服务器的帐号是独立的,每台服务器用户的状态都是不一样的,一个服就是一个世界,大家各部牵扯。
后来游戏玩家呼吁要跨服打架,于是出现了跨服战,再加上随着游戏的运行,单个服务器的游戏活跃玩家越来越少,所以后期就有了服务器的合并以及迁移,慢慢的以服务器的开放、合并形成了一套成熟的运营手段。目前多数游戏还采用分服的结构来架设服务器,多数页游还是采用这种模式。
线程调度:
分服虽然可以解决服务器扩展的瓶颈,但单台服务器在以前单线程的方式来运行,没办法充分利用服务器资源,于是又演变出了以下2种线程模型。
-
异步-多线程。基于每个场景(或者房间),分配一个线程。每个场景的玩家同属于一个线程。游戏的场景是固定的,不会很多,如此线程的数量可以保证不会不断增大。每个场景线程,同样采用tick轮询的方式,来定时更新该场景内的(对象状态,刷新地图,刷新NPC)数据状态。玩家如果跨场景的话,就采用投递和通知的方式,告知两个场景线程,以此更新两个场景的玩家数据。
-
多进程。由于单进程架构下,总会存在承载量的极限,越是复杂的游戏,其单进程承载量就越低,因此一定要突破进程的限制,才能支撑更复杂的游戏。多进程系统的其他一些好处:能够利用上多核CPU能力、更容易进行容灾处理。
多进程系统比较经典的模型是“三层架构”。比如,基于之前的场景线程再做改进,把网络部分和数据库部分分离为单独的进程来处理,逻辑进程专心处理逻辑任务,不合IO打交道,网络IO和磁盘IO分别交由网路进程和DB进程处理。
3.第三代网游服务器
之前的网游服务器都是分区分服,玩家都被划分在不同的服务器上,每台服务器运行的逻辑相同,玩家不能在不同服务器之间交互。想要更多的玩家在同一世界,保持玩家的活跃度,于是就有了世界服模型了。世界服类型也有以下3种演化:
一类型(三层架构):
网关部分分离成单端的gate服务器;DB部分分离为DB服务器;把网络功能单独提取出来,让用户统一去连接一个网关服务器,再有网关服务器转发数据到后端游戏服务器。而游戏服务器之间数据交换也统一连接到网管进行交换。所有有DB交互的,都连接到DB服务器来代理处理。
二类型(cluster):
有了一类型的经验,后续肯定是拆分的越细,性能越好,就类似现在微服务,每个相同的模块分布到一台服务器处理,多组服务器集群共同组成一个游戏服务端。
一般地,我们可以将一个组内的服务器简单地分成两类:场景相关的(如:行走、战斗等)以及场景不相关的(如:公会聊天、不受区域限制的贸易等)。经常可以见到的一种方案是:gate服务器、场景服务器、非场景服务器、聊天管理器、AI服务器以及数据库代理服务器。如下模型:
以上中我们简单的讲下服务器的三种类型功能:
-
场景服务器:它负责完成主要的游戏逻辑,这些逻辑包括:角色在游戏场景中的进入与退出、角色的行走与跑动、角色战斗(包括打怪)、任务的认领等。场景服务器设计的好坏是整个游戏世界服务器性能差异的主要体现,它的设计难度不仅仅在于通信模型方面,更主要的是整个服务器的体系架构和同步机制的设计。
-
非场景服务器:它主要负责完成与游戏场景不相关的游戏逻辑,这些逻辑不依靠游戏的地图系统也能正常进行,比如公会聊天或世界聊天,之所以把它从场景服务器中独立出来,是为了节省场景服务器的CPU和带宽资源,让场景服务器能够尽可能快地处理那些对游戏流畅性影响较大的游戏逻辑。
-
网关服务器:在类型一种的架构中,玩家在多个地图跳转或者场景切换的时候采用跳转的模式,以此进行跳转不同的服务器。还有一种方式是把这些服务器的节点都通过网关服务器管理,玩家和网关服务器交互,每个场景或者服务器切换的时候,也有网关服务器统一来交换数据,如此玩家操作会比较流畅。
通过这种类型服务器架构,因为压力分散了,性能会有明显提升,负载也更大了,包括目前一些大型的 MMORPG游戏就是采用此架构。不过每增加一级服务器,状态机复杂度可能会翻倍,导致研发和找bug的成本上升,这个对开发组挑战比较大,没有经验,很容出错。
三类型(无缝地图):
魔兽世界的中无缝地图,想必大家印象深刻,整个世界的移动没有像以往的游戏一样,在切换场景的时候需要loading等待,而是直接行走过去,体验流畅。
现在的游戏大地图采用无缝地图多数采用的是9宫格的样式来处理,由于地图没有魔兽世纪那么大,所以采用单台服务器多进程处理即可,不过类似魔兽世界这种大世界地图,必须考虑2个问题:
-
多个地图节点如何无缝拼接,特别是当地图节点比较多的时候,如何保证无缝拼接。
-
如何支持动态分布,有些区域人多,有些区域人少,保证服务器资源利用的最大化。
为了解决这个问题,比较以往按照地图来切割游戏而言,无缝世界并不存在一块地图上面的人有且只由一台服务器处理了,此时需要一组服务器来处理,每台 Node服务器用来管理一块地图区域,由 NodeMaster(NM)来为他们提供总体管理。更高层次的 World则提供大陆级别的管理服务。
一个 Node所负责的区域,地理上没必要连接在一起,可以统一交给一个Node去管理,而这些区块在地理上并没有联系在一起的必要性。一个 Node到底管理哪些区块,可以根据游戏实时运行的负载情况,定时维护的时候进行更改 NodeMaster 上面的配置。
对象的无缝迁移:
玩家A、B、C分别代表3种不同的状态,以及不同的迁移方式,我们分别来看。
-
玩家A: 玩家A在node1地图服务器上,由node1控制,如果迁移到node2上,需要将其数据复制到node2上,然后从node1移除。
-
玩家B:玩家B在node1和node2中间,此时由node1和node2维护,若是从node1行走到node2的过程中,会向1请求,同时向2请求,待全部移动过去了再移除。
-
玩家C: 玩家C在node2地图服务器上,由node2控制,如果迁移到node1上,需要将其数据复制到node1上,然后从node2移除。
3.房间服务器(游戏大厅)
房间类玩法和MMORPG有很大的不同,在于其在线广播单元的不确定性和广播数量很小。而且需要匹配一台房间服务器让少数人进入一个服务器。
这一类游戏最重要的是其“游戏大厅”的承载量,每个“游戏房间”受逻辑所限,需要维持和广播的玩家数据是有限的,但是“游戏大厅”需要维持相当高的在线用户数,所以一般来说,这种游戏还是需要做“分服”的。典型的游戏就是《英雄联盟》这一类游戏了。而“游戏大厅”里面最有挑战性的任务,就是“自动匹配”玩家进入一个“游戏房间”,这需要对所有在线玩家做搜索和过滤。
玩家先登录“大厅服务器”,然后选择组队游戏的功能,服务器会通知参与的所有游戏客户端,新开一条连接到房间服务器上,这样所有参与的用户就能在房间服务器里进行游戏交互了。
四、游戏服务器进程类型
服务器的架构,根据游戏类型不同大多有:账号服务器、全局服务器、网关服务器、场景服务器、中心服务器、存储服务器,配合其他的服务器(比如日志服,监控服等)。传统的游戏是单服模式,现在也有很多的是分布式模式。
单服模式:就是一组服务器为一个服,与其服务器之间不互通的。比如传统的网游(魔兽世界),客户端看到的服务器列表里每个服都是一组单独的服务器,之间数据不共享。
分布式模式:理论上可以无限扩容,可能有万人同服的情况。但实际上是有上限的。这个要根据服务器的逻辑设计,和硬件决定的。分布式的思想就是服务只是一个概念。一个服务可以是一个进程分布在不同的硬件服务器上,也可以分布在相同的硬件上,也可以多个服务在一个进程内部。服务的业务逻辑可能是一个场景,也可能是一个玩家的业务逻辑,都可以的。这样可以无限扩展,业务逻辑之间的通信只要找到对应的服务逻辑地址就行了。
每一个服务器的作用:
-
账号服务器: 提供账号注册登录验证流程。这个一般多线程,因为业务逻辑没有交互,注册账号,验证账号,以回调方式返回信息就好了。(可能多组服务器器共享一个账号服)。
-
网关服务器:这个是所有客户端连接的服务器,客户端不会直接连接到业务处理服务器,而是连接到网关,由网关转发消息到相应的业务处理服务器。提供路由作用,消息的加密解密也在这一层处理。(每组服务器可能有多个)。
-
全局服务器:这个根据不同的游戏设计不一样,全局数据和业务处理在这个服务器上处理。比如棋牌游戏的话,玩家不在游戏的时候其他的商城业务可能就在这一层处理了,如果是MMO游戏的话公会服务,或者场景管理服务可以放在这一层处理。(单点,但是现在为了防止宕机也有做主从的)。
-
场景服务器:这个如果是棋牌游戏的话可以叫房间服,传统MMO的话,就是具体的业务服务器,可能由好多个,玩家可能分布在多个场景服中。玩家的具体的场景漫游,战斗,交互大多数都在这个服务器。(会有多个场景服,每个场景服内部有可能只有一个场景也有可能有多个场景,根据人数压力来配置)。
-
中心服务器:这个定位跟全局服务器差不多,这个要看具体的设计,哪些业务可以放进来。
-
存储服务器:提供存储服务,玩家的数据都会放到这个服务器上,玩家的数据不是直接的从数据库读取出来的,这个相当于数据缓存服务,内部有很多策略,保存和存储玩家的数据。尽量减少数据库的直接操作。(这个也有可能有多组,根据事实情况策略设计)。
-
日志服务器: 没啥好讲的。
-
监控服务器:监控这一组服务器实时信息,预警和干预一些异常情况。
一般的登录流程(每个游戏都有些不同,大致一样):
-
客户端登录游戏的时候向所属渠道请求登录(渠道:游戏发行的渠道,比如腾讯的渠道,在华为手机商城上下载的就是华为的渠道,因为现在大多数游戏的账号信息都由渠道把控的)。
-
渠道那边账号验证通过的以后向客户端发送token(这个相当于唯一的验证KEY)
-
客户端选择对应的某个服务器(比如:1区龙之召唤服务器),向其发送连接请求,这个时候会连接到对应服务器的网关。然后拿着token发送登录请求
-
服务器的登录处理所在的服务器收到网关转发过来的登录请求,会拿着这个token向所在渠道服务器发起验证,渠道服务器验证返回成功后,服务器通知客户端登录成功。
-
如果登录验证这一步是单独的账号服务器组的话,还会向客户端发送具体的区服网关重新连接到具体的服务器,这个要看服务器是如何设计的。
一般的棋牌进入房间游戏流程(场景服跟这个很类似):
-
客户端点击请求进入某个房间。
-
大厅服务器(全局服务器) 收到验证通过后,发送回包,并且向所在房间发送玩家进入请求。
-
房间服务器收到消息后再次验证玩家信息,然后拷贝初始化玩家信息,向大厅发送回包,并且向客户端发送进入房间的消息。
-
客户端根据另起的进入房间的消息,初始化房间界面。
1.登陆服务器
创建账号,检验角色账号,选择和获取并返回网关信息。
2.网关服务器
创建角色,转发消息。会有网关角色,和相关的屏信息,用于广播。
3.场景服务器
处理场景(分线或不分线的)、副本的游戏逻辑。
4.社会关系服务器
处理社交相关的全区的逻辑。
5.数据库服务
存取数据。
6.中心服务器
处理内部服务器之间的消息转发,和某些转发流程控制。
7.其他服务器
还有些日志服务器、连接php(gm)服务器、跨服战服务器、聊天服务器等。
五、进程内的网络相关线程类型
进程内的网络相关线程类型(不包括主线程和逻辑线程),处理进程间通信需要处理的连接的数据发送和接收。
1.被动连接相关、被动连接线程池
(1)验证线程:
- (1-1)检查验证超时、验证发来消息的服务器id和服务器ip(服务器之间,依靠中心服务器发来的依赖服务器列表)。
- (1-2)验证账号和临时id和账号(客户端登陆和重登陆)。
- (1-3)验证epoll接收是否有错误,验证客户端的唯一性,超时就放到回收线程。
(2)同步线程:
- (2-1)网关发消息删除中心服务器登陆会话。
- (2-2)中心服务器读数据库检查其他服务器连接的合法性。
- (2-3)发送测试消息到对端。
(3)网络接收发送线程:
- (3-1)负责发送和接收数据(多线程,数量需要配置,每条线程处理的连接数需要是动态增长的)。
(4)回收线程:
- (4-1)回收连接。
2.主动连接相关
(1)主动连接线程:
- (1-1)根据进程需要主动连接别的进程来增加。
如场景进程需要主动连接中心服务器、社会关系服务器、网关服务器、日志服务器、数据库服务器,所以分别各自要另起连接线程。
(2)主动连接线程池:
- (2-1)连接测试线程
测试连接是否正常 - (2-2)验证线程
- (2-3)网络处理线程
负责发送和接收数据(多线程,数量需要配置,每条线程处理的连接数需要是动态增长的)
六、进程间的连接图
总结
以上就是目前游戏服务器的演化进程,由于所涉及的内容太多,关于服务器的相关网络IO以及内存模型都没有介绍,以后有机会再具体讲讲这一部分。非常的便捷,我们务必掌握。希望大家多多支持!另外如果上述有任何问题,请懂哥指教,不过没关系,主要是自己能坚持,更希望有一起学习的同学可以帮我指正,但是如果可以请温柔一点跟我讲,爱与和平是永远的主题,爱各位了。加油啊!
以上是关于游戏服务器的架构演进多进程架构通信的主要内容,如果未能解决你的问题,请参考以下文章
游戏服务器之多进程架构通信 协程切换只是简单地改变执行函数栈,不涉及内核态与用户态转化,也涉及上下文切换,