如何实现基本的“长轮询”?
Posted
技术标签:
【中文标题】如何实现基本的“长轮询”?【英文标题】:How do I implement basic "Long Polling"? 【发布时间】:2010-09-24 22:08:14 【问题描述】:我可以找到很多关于长轮询如何工作的信息(例如,this 和 this),但没有简单的如何在代码中实现它的示例。
我只能找到cometd,它依赖于Dojo JS 框架,以及一个相当复杂的服务器系统..
基本上,我将如何使用 Apache 来处理请求,以及我将如何编写一个简单的脚本(例如,在 php 中)来“长轮询”服务器以获取新消息?
该示例不必是可扩展的、安全的或完整的,它只需要工作即可!
【问题讨论】:
【参考方案1】:这比我最初想象的要简单。基本上你有一个页面什么都不做,直到你想要发送的数据可用(比如,一条新消息到达)。
这是一个非常基本的示例,它会在 2-10 秒后发送一个简单的字符串。三分之一的机会返回错误 404(在接下来的 javascript 示例中显示错误处理)
msgsrv.php
<?php
if(rand(1,3) == 1)
/* Fake an error */
header("HTTP/1.0 404 Not Found");
die();
/* Send a string after a random number of seconds (2-10) */
sleep(rand(2,10));
echo("Hi! Have a random number: " . rand(1,10));
?>
注意:对于一个真实的站点,在像 Apache 这样的常规网络服务器上运行它会很快占用所有“工作线程”并使其无法响应其他请求。有一些方法可以解决这个问题,但它是建议在 Python 的 twisted 之类的东西中编写一个“长轮询服务器”,每个请求不依赖一个线程。 cometD 是一种流行的框架(有多种语言版本),Tornado 是专门为此类任务设计的新框架(它是为 FriendFeed 的长轮询代码构建的)......但作为一个简单的例子,Apache绰绰有余!这个脚本可以很容易地用任何语言编写(我选择了 Apache/PHP,因为它们很常见,而且我碰巧在本地运行它们)
然后,在 Javascript 中,您请求上述文件 (msg_srv.php
),然后等待响应。当你得到一个时,你就根据数据采取行动。然后你请求文件并再次等待,对数据采取行动(并重复)
下面是这样一个页面的示例。当页面加载时,它会发送msgsrv.php
文件的初始请求。如果成功,我们将消息附加到#messages
div,然后在1秒我们再次调用waitForMsg函数,触发等待。
1 秒 setTimeout()
是一个非常基本的速率限制器,没有这个它可以正常工作,但如果 msgsrv.php
always 立即返回(例如,出现语法错误) - 你会泛滥浏览器,它可以快速冻结。最好检查文件是否包含有效的 JSON 响应,和/或保持每分钟/秒的请求总数,并适当暂停。
如果页面出错,它会将错误附加到#messages
div,等待 15 秒,然后重试(与我们在每条消息后等待 1 秒的方式相同)
这种方法的好处是它非常有弹性。如果客户端 Internet 连接中断,它将超时,然后尝试重新连接 - 这是轮询工作时间长短所固有的,不需要复杂的错误处理
无论如何,long_poller.htm
代码,使用 jQuery 框架:
<html>
<head>
<title>BargePoller</title>
<script src="http://ajax.googleapis.com/ajax/libs/jquery/1.2.6/jquery.min.js" type="text/javascript" charset="utf-8"></script>
<style type="text/css" media="screen">
body background:#000;color:#fff;font-size:.9em;
.msg background:#aaa;padding:.2em; border-bottom:1px #000 solid
.old background-color:#246499;
.new background-color:#3B9957;
.error background-color:#992E36;
</style>
<script type="text/javascript" charset="utf-8">
function addmsg(type, msg)
/* Simple helper to add a div.
type is the name of a CSS class (old/new/error).
msg is the contents of the div */
$("#messages").append(
"<div class='msg "+ type +"'>"+ msg +"</div>"
);
function waitForMsg()
/* This requests the url "msgsrv.php"
When it complete (or errors)*/
$.ajax(
type: "GET",
url: "msgsrv.php",
async: true, /* If set to non-async, browser shows page as "Loading.."*/
cache: false,
timeout:50000, /* Timeout in ms */
success: function(data) /* called when request to barge.php completes */
addmsg("new", data); /* Add response to a .msg div (with the "new" class)*/
setTimeout(
waitForMsg, /* Request next message */
1000 /* ..after 1 seconds */
);
,
error: function(XMLHttpRequest, textStatus, errorThrown)
addmsg("error", textStatus + " (" + errorThrown + ")");
setTimeout(
waitForMsg, /* Try again after.. */
15000); /* milliseconds (15seconds) */
);
;
$(document).ready(function()
waitForMsg(); /* Start the inital request */
);
</script>
</head>
<body>
<div id="messages">
<div class="msg old">
BargePoll message requester!
</div>
</div>
</body>
</html>
【讨论】:
不能用这个想法让一些消息溜走吗?在那 1 秒的时间里,假设发送了 1000 条聊天消息,服务器如何知道将 1000 条消息专门发送给该客户端? 可能。这是一个非常简化的示例,用于演示这个概念。为了更好地做到这一点,您需要更精细的服务器端代码,它将为该特定客户端存储这 1000 条消息,并将它们以一个块的形式发送。您还可以安全地减少 waitForMsg 超时 nodejs 是另一个出色的长轮询请求服务器端解决方案,具有额外的优势(优于 Twisted),您也可以用 Javascript 编写服务器代码。 这只是一个简单的周期性 AJAX 连接到服务器,间隔为 1 秒。这与“长轮询”无关。只要客户端超时,长轮询应该保持连接活动。 问题是真正的 PHP 脚本做什么而不是sleep(rand(2,10));
?为了什么都不做,每 100 毫秒轮询一次数据库?它什么时候决定死?【参考方案2】:
我有一个非常简单的聊天示例作为slosh 的一部分。
编辑:(因为每个人都在这里粘贴他们的代码)
这是使用长轮询和slosh 的完整的基于 JSON 的多用户聊天。这是一个如何调用的demo,请忽略XSS问题。没有先对其进行清理,任何人都不应部署它。
请注意,客户端总是与服务器有连接,一旦有人发送消息,每个人都应该大致立即看到它。
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<!-- Copyright (c) 2008 Dustin Sallings <dustin+html@spy.net> -->
<html lang="en">
<head>
<title>slosh chat</title>
<script type="text/javascript"
src="http://code.jquery.com/jquery-latest.js"></script>
<link title="Default" rel="stylesheet" media="screen" href="style.css" />
</head>
<body>
<h1>Welcome to Slosh Chat</h1>
<div id="messages">
<div>
<span class="from">First!:</span>
<span class="msg">Welcome to chat. Please don't hurt each other.</span>
</div>
</div>
<form method="post" action="#">
<div>Nick: <input id='from' type="text" name="from"/></div>
<div>Message:</div>
<div><textarea id='msg' name="msg"></textarea></div>
<div><input type="submit" value="Say it" id="submit"/></div>
</form>
<script type="text/javascript">
function gotData(json, st)
var msgs=$('#messages');
$.each(json.res, function(idx, p)
var from = p.from[0]
var msg = p.msg[0]
msgs.append("<div><span class='from'>" + from + ":</span>" +
" <span class='msg'>" + msg + "</span></div>");
);
// The jQuery wrapped msgs above does not work here.
var msgs=document.getElementById("messages");
msgs.scrollTop = msgs.scrollHeight;
function getNewComments()
$.getJSON('/topics/chat.json', gotData);
$(document).ready(function()
$(document).ajaxStop(getNewComments);
$("form").submit(function()
$.post('/topics/chat', $('form').serialize());
return false;
);
getNewComments();
);
</script>
</body>
</html>
【讨论】:
我可以知道这是如何始终连接的吗?对不起,如果我问了一些愚蠢的问题,但我想知道。 它执行 HTTP GET 并且服务器阻止 GET 直到有可用数据。当数据到达服务器时,服务器将数据返回给客户端,将可能进入的任何其他内容排队,然后客户端重新连接并拾取丢失的消息(如果有),否则再次阻塞。 一开始可能并不明显,但负责“始终连接状态”的是 ajaxStop 和getNewComments
回调,所以它只是在每个 ajax 请求结束时无休止地触发它【参考方案3】:
Tornado 是为长轮询而设计的,在 /examples/chatdemo 中包含一个非常小的(几百行 Python)chat app,包括服务器代码和 JS 客户端代码。它的工作原理是这样的:
客户端使用 JS 请求更新,因为(最后一条消息的数量),服务器 URLHandler 接收这些并添加回调以响应客户端到队列。
当服务器收到一条新消息时,onmessage 事件触发,循环回调,并发送消息。
客户端 JS 接收到消息,将其添加到页面中,然后从这个新消息 ID 开始请求更新。
【讨论】:
【参考方案4】:我认为客户端看起来像一个普通的异步 AJAX 请求,但您预计它需要“很长时间”才能回来。
然后服务器看起来像这样。
while (!hasNewData())
usleep(50);
outputNewData();
因此,AJAX 请求会发送到服务器,可能包括上次更新时间的时间戳,以便您的 hasNewData()
知道您已经获得了哪些数据。
然后服务器处于循环休眠状态,直到有新数据可用。一直以来,您的 AJAX 请求仍处于连接状态,只是挂在那里等待数据。
最后,当有新数据可用时,服务器会将其提供给您的 AJAX 请求并关闭连接。
【讨论】:
这是一个阻塞当前线程的繁忙等待。这根本无法扩展。 不,usleep 不是忙等待。而“等待”的全部意义在于将你的线程阻塞一段时间。可能他的意思是 50 毫秒(usleep(50000)),而不是 50 微秒!但无论如何,对于典型的 Apache/PHP 设置,是否有任何其他方法可以做到这一点? 嗯,从原理上讲,你不能不等待就对聊天消息进行屏蔽。 真的很棒!我在服务器中构建了一个递归函数来检查新数据。但是,有效使用长轮询的最佳产品是什么?我使用普通的 Apache,当我打开超过 4/5 个浏览器选项卡时服务器没有响应 :( 寻找与 PHP 一起使用的东西【参考方案5】:Here 是我在 C# 中用于长轮询的一些类。基本上有6个类(见下文)。
-
控制器:处理创建有效响应所需的操作(数据库操作等)
处理器:管理与网页(本身)的异步通信
IAsynchProcessor:实现该接口的服务进程实例
服务:处理实现 IAsynchProcessor 的请求对象
请求:包含您的响应(对象)的 IAsynchProcessor 包装器
响应:包含自定义对象或字段
【讨论】:
好的...为什么这被否决了?这些类确实是长轮询的有效示例。 真正的长轮询不是(简单地)在您进行正常轮询时增加间隔的做法(在资源上)。它是一个更大模式的一部分……它“有点”需要解释……但仅限于整体实施的某些领域。也就是说......这些课程遵循上述模式!因此,如果您有理由对此投反对票……我真的会对这个原因感兴趣。 也许它被否决了,因为它没有直接解决简单代码示例的问题。当然我没有投反对票,所以我只能猜测。【参考方案6】:这是一个不错的 5 分钟截屏视频,介绍如何使用 PHP 和 jQuery 进行长轮询: http://screenr.com/SNH
代码与上面 dbr 的示例非常相似。
【讨论】:
我认为您应该只将其视为对长轮询的介绍,因为这种实现肯定会杀死您的服务器,同时拥有许多并发用户。 我只是了解这一切...有多可靠,或者不可靠,是否有少数用户...比如说 10 人来回聊天?【参考方案7】:这里是a simple long-polling example in PHP by Erik Dubbelboer 使用Content-type: multipart/x-mixed-replace
标头:
<?
header('Content-type: multipart/x-mixed-replace; boundary=endofsection');
// Keep in mind that the empty line is important to separate the headers
// from the content.
echo 'Content-type: text/plain
After 5 seconds this will go away and a cat will appear...
--endofsection
';
flush(); // Don't forget to flush the content to the browser.
sleep(5);
echo 'Content-type: image/jpg
';
$stream = fopen('cat.jpg', 'rb');
fpassthru($stream);
fclose($stream);
echo '
--endofsection
';
这是一个演示:
http://dubbelboer.com/multipart.php
【讨论】:
【参考方案8】:我使用this 来了解 Comet,我还使用 Java Glassfish 服务器设置了 Comet,并通过订阅 cometdaily.com 找到了许多其他示例
【讨论】:
【参考方案9】:看看this blog post,它有一个简单的Python/Django/gevent聊天应用程序代码。
【讨论】:
【参考方案10】:以下是我为 Inform8 Web 开发的长轮询解决方案。基本上你重写类并实现 loadData 方法。当 loadData 返回值或操作超时时,它将打印结果并返回。
如果您的脚本处理时间可能超过 30 秒,您可能需要将 set_time_limit() 调用更改为更长的时间。
Apache 2.0 许可证。 github上的最新版本 https://github.com/ryanhend/Inform8/blob/master/Inform8-web/src/config/lib/Inform8/longpoll/LongPoller.php
瑞恩
abstract class LongPoller
protected $sleepTime = 5;
protected $timeoutTime = 30;
function __construct()
function setTimeout($timeout)
$this->timeoutTime = $timeout;
function setSleep($sleep)
$this->sleepTime = $sleepTime;
public function run()
$data = NULL;
$timeout = 0;
set_time_limit($this->timeoutTime + $this->sleepTime + 15);
//Query database for data
while($data == NULL && $timeout < $this->timeoutTime)
$data = $this->loadData();
if($data == NULL)
//No new orders, flush to notify php still alive
flush();
//Wait for new Messages
sleep($this->sleepTime);
$timeout += $this->sleepTime;
else
echo $data;
flush();
protected abstract function loadData();
【讨论】:
【参考方案11】:这是 PHP 非常糟糕的选择之一。如前所述,您可以非常快速地捆绑所有 Apache 工作人员来执行类似的操作。 PHP 是为启动、执行、停止而构建的。它不是为启动、等待...执行、停止而构建的。你会很快让你的服务器陷入瘫痪,并发现你有令人难以置信的扩展问题。
也就是说,您仍然可以使用 PHP 执行此操作,并且不会使用 nginx HttpPushStreamModule 杀死您的服务器:http://wiki.nginx.org/HttpPushStreamModule
您在 Apache(或其他任何东西)前面设置 nginx,它将负责保持打开的并发连接。您只需通过向内部地址发送数据来响应有效负载,您可以使用后台作业执行此操作,或者只是将消息发送给在新请求进入时等待的人。这可以防止 PHP 进程在长时间轮询期间保持打开状态。
这不是 PHP 独有的,可以使用带有任何后端语言的 nginx 来完成。并发打开的连接负载等于 Node.js,所以最大的好处是它让你摆脱了类似这样的需要节点。
您看到很多其他人提到其他语言库来完成长轮询,这是有充分理由的。 PHP 天生就不能很好地适应这种行为。
【讨论】:
这是 Apache 问题还是 PHP 问题?如果我的 PHP 代码直接在 nginx 或 lighttpd 上运行,我会遇到长轮询问题吗? 这不是 PHP 问题,而是 PHP 滥用。对于每个请求,PHP 从头开始运行脚本,根据需要加载库,执行其代码,然后在垃圾收集请求中启动的所有内容时关闭。多年来对 PHP 进行了许多修改,以尽量减少后期静态绑定、延迟加载、内存字节码缓存以删除磁盘 I/O 等影响。问题仍然是 PHP 旨在尽快启动和停止尽可能。将加载一次/启动并为请求打开线程的语言更适合长轮询。 但是要回答这个问题,是的,无论您使用的是 Apache 还是其他东西,您都会遇到这个问题。这就是 PHP 的工作方式。我应该修改这个说,如果你有一个已知的最大流量负载 PHP 会很好。我见过使用 PHP 的嵌入式系统没有问题,因为只有几个连接。可能在公司 Intranet 上,这也可以通过。但是,对于面向公众的应用程序,随着流量的增长,您绝对会杀死您的服务器。【参考方案12】:感谢代码,dbr。只是 long_poller.htm 中的一个小错字
1000 /* ..after 1 seconds */
我觉得应该是的
"1000"); /* ..after 1 seconds */
让它工作。
对于那些感兴趣的人,我尝试了一个 Django 等价物。开始一个新的 Django 项目,说 lp 进行长轮询:
django-admin.py startproject lp
为消息服务器调用应用msgsrv:
python manage.py startapp msgsrv
将以下行添加到 settings.py 以获得 templates 目录:
import os.path
PROJECT_DIR = os.path.dirname(__file__)
TEMPLATE_DIRS = (
os.path.join(PROJECT_DIR, 'templates'),
)
在 urls.py 中定义您的 URL 模式,如下所示:
from django.views.generic.simple import direct_to_template
from lp.msgsrv.views import retmsg
urlpatterns = patterns('',
(r'^msgsrv\.php$', retmsg),
(r'^long_poller\.htm$', direct_to_template, 'template': 'long_poller.htm'),
)
msgsrv/views.py 应该是这样的:
from random import randint
from time import sleep
from django.http import HttpResponse, HttpResponseNotFound
def retmsg(request):
if randint(1,3) == 1:
return HttpResponseNotFound('<h1>Page not found</h1>')
else:
sleep(randint(2,10))
return HttpResponse('Hi! Have a random number: %s' % str(randint(1,10)))
最后,templates/long_poller.htm 应该和上面的一样,并纠正了错字。希望这会有所帮助。
【讨论】:
其实"15000"
是语法错误。 setTimeout 将整数作为其第二个参数。
这个答案需要工作。它是一个或多个 cmets 和一个或多个单独答案的高潮。【参考方案13】:
为什么不考虑网络套接字而不是长轮询?它们非常高效且易于设置。但是,它们仅在现代浏览器中受支持。这是quick reference。
【讨论】:
我认为一旦 websockets 在所有地方实现(可能不会在未来几年内),它们将成为此类应用程序的标准。不幸的是,目前我们不能依赖它们来生产应用程序。 @Richard 但是,您可以使用 Socket.IO 之类的东西,它提供自动回退传输,提供类似 web-socket 的功能,一直到 IE 6。【参考方案14】:WS-I 小组发布了一个名为 "Reliable Secure Profile" 的东西,其中有一条玻璃鱼,.NET implementation 显然是 inter-operate。
运气好的话,还有一个Javascript 实现。
还有一个 Silverlight 实现,它使用 HTTP Duplex. 您可以在推送发生时通过 connect javascript to the Silverlight 对象获取回调。
还有commercial paid versions。
【讨论】:
【参考方案15】:对于 ASP.NET MVC 实现,请查看 SignalR which is available on NuGet。请注意,NuGet 与 Git source 相比通常已过时,Git source 提交非常频繁。
在blog on by Scott Hanselman 上阅读有关 SignalR 的更多信息
【讨论】:
【参考方案16】:你可以试试 icomet(https://github.com/ideawu/icomet),一个用 libevent 构建的 C1000K C++ comet 服务器。 icomet 还提供了一个 JavaScript 库,使用起来非常简单
var comet = new iComet(
sign_url: 'http://' + app_host + '/sign?obj=' + obj,
sub_url: 'http://' + icomet_host + '/sub',
callback: function(msg)
// on server push
alert(msg.content);
);
icomet 支持多种浏览器和操作系统,包括 Safari(ios、Mac)、IEs(Windows)、Firefox、Chrome 等。
【讨论】:
【参考方案17】:最简单的 NodeJS
const http = require('http');
const server = http.createServer((req, res) =>
SomeVeryLongAction(res);
);
server.on('clientError', (err, socket) =>
socket.end('HTTP/1.1 400 Bad Request\r\n\r\n');
);
server.listen(8000);
// the long running task - simplified to setTimeout here
// but can be async, wait from websocket service - whatever really
function SomeVeryLongAction(response)
setTimeout(response.end, 10000);
例如 Express 中的生产场景,您将在中间件中获得 response
。你需要做什么,可以将所有长轮询方法的范围限定为 Map 或其他东西(对其他流可见),并在你准备好时调用<Response> response.end()
。长轮询连接没有什么特别之处。休息就是您通常构建应用程序的方式。
如果你不知道我所说的范围界定是什么意思,这应该会给你一些想法
const http = require('http');
var responsesArray = [];
const server = http.createServer((req, res) =>
// not dealing with connection
// put it on stack (array in this case)
responsesArray.push(res);
// end this is where normal api flow ends
);
server.on('clientError', (err, socket) =>
socket.end('HTTP/1.1 400 Bad Request\r\n\r\n');
);
// and eventually when we are ready to resolve
// that if is there just to ensure you actually
// called endpoint before the timeout kicks in
function SomeVeryLongAction()
if ( responsesArray.length )
let localResponse = responsesArray.shift();
localResponse.end();
// simulate some action out of endpoint flow
setTimeout(SomeVeryLongAction, 10000);
server.listen(8000);
如您所见,您可以真正响应所有连接,一个,随心所欲。每个请求都有id
,因此您应该能够使用地图并访问特定的api调用。
【讨论】:
以上是关于如何实现基本的“长轮询”?的主要内容,如果未能解决你的问题,请参考以下文章