iABACUS:基于 Wi-Fi 的自动公交车乘客 计数系统
Posted AI浩
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了iABACUS:基于 Wi-Fi 的自动公交车乘客 计数系统相关的知识,希望对你有一定的参考价值。
文章目录
摘要
自物联网 (IoT) 的早期阶段以来,受这种新范式影响最大的应用场景之一就是移动性。智慧城市极大地受益于对一些人习惯开发高效移动服务的认识。尤其是,了解人们如何使用公共交通服务以及如何在城市基础设施中移动对于几个领域至关重要,其中最突出的是旅游和交通。事实上,尤其是对于公共交通公司 (PTC),公交网络的长期和短期规划需要对进出车辆的乘客流量有透彻的了解。由于互联网连接无处不在,这些知识可以通过部署在公共交通车辆上的传感器轻松实现。本文提出了一种基于 Wi-Fi 的自动公交乘客计数系统 iABACUS。 iABACUS 的目标是通过跟踪乘客乘坐公共交通工具的整个旅程来观察和分析城市流动性,而无需他们采取任何行动。测试结果证明,iABACUS 有效地检测出具有活动 Wi-Fi 接口的设备数量,在静态情况下准确率达到 100%,在动态情况下准确率接近 94%。在后一种情况下,只有当两个公交车站彼此非常靠近时才会出现随机错误。
1、简介
整个城市基础设施中的城市流动性和人员流动对旅游和交通等多个领域产生重大影响[1,2]。特别是,能够准确计算乘客人数是公交服务最相关的组成部分之一,因为它提供了衡量公共交通公司 (PTC) 有效性的关键指标,并且对于有效规划公交至关重要网络,无论是长期还是短期 [3,4]。事实上,通过分析起点-目的地矩阵,可以对路线和相关时间表进行长期规划,这些矩阵提供了有关通勤流的信息。此外,这些矩阵给出了关于拥挤时间和路线的指示,这也简化了短期规划策略,例如,通过将公共汽车重新分配到特定路线。因此,长期和短期规划有助于有效利用资源并保证公交车在乘客需要的时间和地点运行[5]。
为了获取有关乘客量的信息,PTC 通常采用传统机制,从非自动人工视觉计数到基于各种数据采集技术(例如垫子传感器 [6]、红外传感器 [7)的自动乘客计数 (APC) 方法],摄像机 [8])。这些系统需要安装在车辆上,而且通常非常昂贵。随着物联网 (IoT) 的出现,APC 系统 (APCS) 在开发“观察”城市交通的新方法方面取得了巨大的进步,尤其是在最近几年。然而,最近 APCS 的巨大成功主要是由于便携式和移动设备(如平板电脑、智能手机和智能手表)的出现,为收集详细的乘客数据和跟踪他们在整个城市的活动提供了新的机会 [9,10]。然而,到目前为止,在这方面的研究方向主要集中在从各种传感器收集的数据中确定出行方式,例如加速度计和全球定位系统/地理信息系统(GPS/GIS)[11,12]。此外,这些方法中的大多数都要求乘客有一个在他们的设备上安装了特定的智能手机应用程序。因此,结果严重取决于乘客的参与意愿。这与依赖人群计数原则的 APCS 不兼容。
直到最近,Wi-Fi 才被用来计算在附近 Wi-Fi 接入点 (AP) [13] 检测到的活动接口的数量。这些系统通常基于与 Wi-Fi 接口关联的媒体访问控制 (MAC) 地址的标识。阿姆斯特丹史基浦机场 [14] 和伦敦交通 (TfL) 车站 [15] 代表了此类系统的示例。但是,它们只能有效地适用于过时的操作系统(早于 android 5.0、ios 7 和 Windows Phone 8)。事实上,为了保护用户的隐私免受设备跟踪,谷歌、苹果和微软引入了 MAC 地址的软件随机化 [16]:声称的 MAC 地址是由软件随机生成的,并且会定期更改。在 [17] 中研究了移动设备跟踪中的 MAC 地址随机化,作者分析了为几种不同的商用现成操作系统实施的不同随机化技术的性能。因此,跟踪设备变得不再可行,正如 [15] 所证实的那样,TfL 声称当 MAC 地址被随机化时,它们无法构建旅程。
在本文中,我们介绍了 iABACUS(基于 Wi-Fi 的自动总线乘客计数系统),这是解决 MAC 随机化问题的第一个工具,通过引入一个系统,该系统可以跟踪乘客从上车到下车的整个过程。这篇论文的目的是展示如何利用物联网来准确计算设备的数量,这可以被认为等于公共汽车上的乘客数量。有人可能会争辩说,乘客数量与拥有的设备数量不匹配。虽然确实如此,但这些设备的普及率在很大程度上取决于所考虑的国家:在新兴经济国家中,没有智能手机或没有活动 Wi-Fi 接口的人口比例高于拥有先进国家的国家。在经济中,用户可以拥有多个连接设备,例如智能手机和平板电脑,然后它们会被计算多次 [18]。为了调整所提出的 iABACUS 算法的输出,需要根据考虑的场景对其进行校准,然后引入比例因子;但是,这些测试超出了本文的范围。提供的贡献有三点:
-
由于它跟踪活动的 Wi-Fi 接口,iABACUS 不需要乘客采取任何行动,与大多数新兴的 APCS 相比,这是一个很大的优势。此外,由于 iABACUS 会计算活动 Wi-Fi 接口的数量,因此乘客无需在智能手机上安装任何东西,也无需连接 AP;
-
iABACUS 基于去随机化机制,克服了无法将两个或多个随机 MAC 地址分配给同一设备的问题。此外,由于原始MAC地址是未知的,因此无法推断乘客的身份,并保护了他们的隐私;
-
iABACUS 不仅计算乘客的设备,还通过提供乘客上车或下车时间来跟踪乘客乘坐公共交通工具的整个旅程。因此,它的功能不仅限于乘客计数:它可以实现城市流动性的观察和分析,这为短期和长期的 PTC 规划提供了很大的支持;
在本文的其余结构如下。 第 2 节介绍了 APC 技术的背景。 在第 3 节中,对 iABACUS 模型进行了详尽的描述。 在第 4 节中,展示和讨论了评估整体系统性能和准确性的实验。 最后,在第 5 节中得出结论以及未来的方向。
2、最先进的技术
一般来说,APCS是通过运输车辆上使用的电子设备来实现的。 他们主要准确地记录原始的乘客登机和下车数据。 对 APCS 及其相关分析的研究相当广泛,可以区分传统的 APCS 和新兴的 APCS。
2.1、 传统的自动乘客计数系统
传统的APCS可以根据乘客的间接或直接措施进行分类。 在间接测量的情况下,乘客可以通过地面或悬架或制动系统上的负载传感器称重所有机上乘客来估计(例如,[6,19])。 这种间接的 APC 技术提供了乘客的总重量,但不提供乘客流量的数据。
在直接测量的情况下,乘客是通过计算上下车时的人数来估算的。介绍了三个主要系统,包括红外垫传感器和视频图像传感器(例如,[6-8,20-28])。通常,垫子传感器在公交车每个门的两个台阶上测量一个人的重量。当踏板施加最小设计重量(例如,15 kg-[6])时,这些垫子会被激活。红外传感器通过光束测量乘客数量,当他们上车或下车时光束被中断(例如,[6,7,20-22])。红外系统最常用于此类应用,并且在商业中很容易找到。此外,一些测试表明,该技术能够以高精度计算乘客总数和最大载客量(例如,[7,29])。然而,尽管这项技术在公共交通中占主导地位,但随着人数的增加,性能可能会变得更差 [8,24]。视频图像传感器使用公交车上的摄像头测量乘客,这些摄像头能够识别两个方向的客流(例如,[8,25-28])。这些系统依靠动态图像序列处理来自动计算公交车上上下车的乘客数量。他们使用几种算法来 (i) 检测运动,(ii) 估计其方向,以及 (iii) 验证移动乘客的存在。表 1 总结了每种传统的 APC 技术,其中报告了主要问题和可能的解决方案以及优缺点。表 1 是不言自明的。尽管如此,所有传统技术都提供了乘客登机和下车的衡量标准。因此,只需要推断乘客的出发地和目的地。此外,即使直接 APCS 似乎比间接 APCS 工作得更好,但所有技术都存在自己的缺点。主要缺点是资本成本,由于每扇门需要安装多个传感器,以及维护成本。
2.2、新兴的自动乘客计数系统
新兴的 APCS 系统是最近才出现的,并且随着无处不在的互联网连接和物联网的发展而迅速增加。 此外,它们在以下方面优于传统系统
资本和维护成本,因为公交车运营商不必安装必须“物理集成”在公交车上的传感器或设备。 使用这些系统,可以通过计算所执行的设备以间接方式检测到乘客。 有人可能会争辩说,一些乘客可能携带不止一台设备,从而高估了乘客总数。 然而,这不是这些系统的强限制。 实际上,可以校准一些调整因素以提高对推断的分类登机和下车乘客进行缩放的准确性。
文献可以分为三种不同的系统:(1)基于通话详细记录的大规模手机数据; (2) 安装在智能手机中的应用程序,以及 (3) Wi-Fi 技术。 当设备连接到蜂窝网络时,大型手机系统会收集数据。 这可能包括拨打或接听的电话、发送或接收的短消息和/或当用户连接到互联网时(例如,浏览网页)。 根据这项技术,[30] 提出了一种在总体水平上估计公共交通服务的乘客需求的方法。 更准确地说,他们展示了如何提取居民的重要起源和目的地来推断起源-目的地矩阵。
Wi-Fi 系统代表了一旦设备具有活动的 Wi-Fi 接口就可以收集数据的新技术,这与它的所有者是否连接到网络无关 [38]。实际上,这些系统基于设备发现过程,允许设备通过获取它们的 MAC 地址来发现其他设备 [39]。这些年进行了最近的研究。例如,参考文献 [13,40] 评估了安装在公共汽车上的移动 AP 是否有助于检测用户设备的相对位置。这是为了识别用户设备是在总线内部还是外部。他们表明,与接收到的信号强度指示不同,总线速度可能是一个很好的指标,可以很好地指示连接是在总线内部还是外部建立。桑托斯等人[41]提出了一个基于物联网技术的多源传感基础设施(即波尔图生活实验室)。它旨在检测城市规模的四种现象,即天气、环境、公共交通和人流。该基础设施有助于使用 Wi-Fi 连接和公交车的车载装置估计公交车上的总乘客流量。
值得注意的是,乘客可能已经关闭了 Wi-Fi,因为它会消耗电池 [42]。因此,Wi-Fi 可能会导致对乘客量的低估。 然而,这不是一个相关的问题,因为:(1) 可以为将应用此方法的每个城市校准适当的比例因子。 通过对公共汽车乘客的统计样本进行适当的调查,校准一个以公认的置信水平和误差幅度为特征的比例因子非常简单,以便以统计准确度估计连接到 Wi 的人的百分比是多少 -Fi 网络。 例如,在多德雷赫特(荷兰),连接到 Wi-Fi 网络的人数从 31% 到 49% 不等,因此可以应用第一个因素来调整客流量 [43]; (2) Wi-Fi AP数量迅速增加,预计未来将有很多公交车配备Wi-Fi AP。
表 2 对每种新兴的 APC 技术进行了总结,该表按表 1 进行组织。尽管可以通过计算所执行的设备以间接方式检测到乘客,但表 2 显示所有新兴技术都可能有助于估计乘客的出发地和目的地 . 有人可能会争辩说,一些乘客可能携带不止一台设备,从而高估了乘客总数。 然而,这并不是这些技术的强烈限制。 实际上,可以校准一些调整因素以提高对推断的分类登机和下车乘客进行缩放的准确性。
无论如何,Wi-Fi 系统似乎优于大型手机和智能手机应用程序系统,因为它们既不依赖电信运营商,也不依赖乘客的同意。 此外,它们能够以匿名方式跟踪乘客。 因此,该系统有望提供有趣的结果,并将在本文中采用。
2.3、文献空白
总体而言,毫无疑问,所有这些研究都为研究和实际应用提供了有趣且引人入胜的结果。 他们提供的证据表明可以采用不同的 APCS 来衡量乘客量。
然而,通过分析有关采用这些技术的文献,我们强调了一些差距。
首先,在传统的 APCS 中,无法在其出发地和目的地公交车站跟踪乘客,而只能对每个公交车站的乘客进行聚合估计。
其次,基于大型手机和/或智能手机应用程序的新兴 APCS 可能有助于计算上下车次数以及估计乘客的出发地和目的地。但是,提供此估算需要与电信运营商合作和/或征得乘客同意。
因此,使用基于识别与设备的 Wi-Fi 相关的 MAC 地址的 Wi-Fi 系统来阐明乘客数量的估计以及对起点目的地矩阵的估计可能是至关重要的。 Fi 接口。然而,最近由操作系统提供商在移动设备上引入的 MAC 地址随机化程序使得乘客跟踪变得特别困难。出于这个原因,iABACUS 中引入了去随机化机制来解决这个问题。参考文献中提出的方法,iABACUS 提供了多个优点:它可以对乘客进行匿名计数;乘客无需采取任何行动;对客流进行观察和分析,从而有助于短期和长期的城市交通规划。
3、系统说明
iABACUS 基于检测来自任何设备的 Wi-Fi 签名,例如手机、平板电脑等,具有活动的 Wi-Fi 接口。 如图 1 所示,总线上安装了一个车载单元。 由于嗅探器的存在,它负责从车载设备收集 MAC 地址、存储数据并提供收集数据的第一个详细信息(MAC 地址的去随机化)。 然后通过运行中的移动连接或通过公交车站的 Wi-Fi 连接将数据传输到云端,在此进一步分析数据以计算公交车上的实际设备数量。
每次 Wi-Fi 设备必须传递消息时,它都需要知道要访问哪个 AP。 该信息通过关联的概念提供给设备,关联是支持设备连接性的必要但不充分的操作。 实际上,在允许设备通过 AP 发送数据消息之前,它必须首先与 AP 关联。 为此,设备会发送探测请求帧,即从任何活动的 Wi-Fi 接口定期广播的消息,以检测附近的 AP。
所提出系统的核心是收集和分析探测请求帧的 Wi-Fi 嗅探器; 这些帧包含的信息可以明确地与发送它们的设备相关联,从而能够对其进行识别和计数。 实际上,如图 2 所示(请注意,图 2 的目的不是描述 Probe Request 帧的字段,而只是显示其结构。感兴趣的读者可以参考 [44] 以了解有关该标准的更多详细信息。 ),探测请求帧的字段之一是源(SA)的 MAC 地址,由制造商明确分配给 Wi-Fi 接口。 因此,常见的基于 Wi-Fi 的 APCS 能够通过计算接收到的探测请求帧中识别的不同 MAC 地址的数量来找到靠近嗅探器的不同设备的数量。
然而,当前基于 MAC 识别的基于 Wi-Fi 的 APCS 只能有效地适用于过时的操作系统(早于 Android 5.0、iOS 7 和 Windows Phone 8)。 事实上,为了保护用户的隐私免受设备跟踪,主要的移动操作系统提供商已经引入了 MAC 地址的软件随机化 [16]:探测请求帧中包含的 MAC 地址不是与 Wi-Fi 接口不再,而是随机生成的,并且会定期更改。
将随机 MAC 地址与非随机 MAC 地址区分开来的特点是,非随机 MAC 地址的前 6 个八位字节由电气和电子工程师协会 (IEEE ) 并标识现有网卡的制造商。因此,将探测请求帧中包含的 MAC 地址的前 6 个八位字节与与现有网卡制造商相关联的所有 OUI 的列表进行比较。如图 1 所示,如果 MAC 地址被识别为随机 MAC 地址,即其前 6 个八位字节不对应任何现有的 OUI,则在嗅探过程之后、计数算法之前运行去随机化算法。否则,不需要去随机化,Probe Request 可以直接传递给计数算法。计数算法的主要目标是了解收到的哪些探测请求来自实际在公共汽车上的设备,或者是由于汽车或附近的人移动而收到的。
下面将详细描述去随机化过程和计数算法。
3.1、去随机化算法
操作系统提供商引入的 MAC 地址随机化允许将网卡的真实 MAC 地址隐藏在发送它们的设备的探测请求帧中。 在探测请求帧中,真实 MAC 地址被随机 MAC 地址替换,这些地址在有限的时间段内多次更改。 更改不会定期或根据预定义的时间发生,而是取决于设备的使用。 因此,探测请求帧中包含的 MAC 地址不再足以像以前那样对设备进行计数。
在本节中,我们介绍去随机化算法,其目的是了解哪些 MAC 地址更有可能被带回同一设备。 实际上,可以利用探测请求帧中包含的一些参数来充分可靠地估计包含不同随机 MAC 地址的帧可能已由同一设备发送。
特别是,即使使用随机 MAC 地址,探测请求帧的某些字段也保持不变,如图 3 中的红色方块突出显示的那样,也称为标记参数 [44]。
此信息在同一设备发送的所有探测请求帧中都是相同的,即使 MAC 地址是随机的。 但是,此信息标识特定的设备系列,而不是单个设备。 为了使包含不同随机 MAC 地址的两个帧可追溯到同一设备,因此必须将这些信息相同的事实视为第一个条件,必要但不充分。
因此,去随机化算法需要利用其他参数,这些参数的变化提供了重要信息。 让我们考虑从嗅探器收到的两个 MAC 地址,即 M A C i MAC_i MACi 和 M A C j MAC_j MACj,其中 M A C i MAC_i MACi 在 M A C j MAC_j MACj 之前收到。 因此,为了将两个 MAC 地址追溯到同一个源设备,接收到 M A C i MAC_i MACi 的时刻,即它的时间戳,必须低于 M A C j MAC_j MACj 的时间戳。 因此,调用 t g i tg_i tgi 和 t g j tg_j tgj 分别为 M A C i MAC_i MACi 和 M A C j MAC_j MACj 的标记参数,直到与 M A C i MAC_i MACi关联的最后一个时间戳和 t j f t_j^f tjf 与 M A C j MAC_j MACj 关联的第一个时间戳(均以秒表示),当且仅当, 满足以下条件:
Γ i j = t g i ≡ t j t i l < t j f \\Gamma_i j=\\left\\\\beginarrayl t g_i \\equiv t_j \\\\ t_i^l<t_j^f \\endarray\\right. Γij=tgi≡tjtil<tjf
其中等式 (1) 的第一个条件仅选择具有相同传输特性的设备,即相同的标记参数,而等式 (1) 的第二个条件确保带有 M A C i MAC_i MACi 的最后一帧在带有 M A C j MAC_j MACj 的第一帧之前发送。
如上所述,去随机化算法评估两个随机 MAC 地址对应于同一设备的概率。 为了计算这个概率,我们为每对确定的随机 MAC 地址定义一个分数。 得分是使用时间戳和探测请求中包含的另一个相关参数计算得出的:帧序列号。 序列号是一个 12 位代码,随着每一帧逐渐增加,并包含在序列控制(图 2 中的 Seq-ctl)中。 它的值从 0 到 4095 不等,一旦达到该最大值,编号将从 0 重新开始。连续的帧具有递增的序列号,即使随机 MAC 地址发生变化。
该分数与不同MAC地址的接收帧之间的时间差和序列号的差成反比。 时间差表示为:
Δ
T
i
j
=
t
j
f
−
t
i
l
(2)
\\Delta T_i j=t_j^f-t_i^l \\tag2
ΔTij=tjf−til(2)
它表示帧到达的连续性,即使对于随机地址也是如此,然后保证自地址更改以来没有经过太多时间。 序列号的差异具有相似的目标,即即使 MAC 地址由于随机化过程而改变,也要检查接收帧的连续性。 但是,我们需要考虑到序列号假定值在 0 到 4095 之间。定义
s
i
l
s_i^l
sil 为
M
A
C
i
MAC_i
MACi 对应的最后一帧的序列号,
s
j
f
s_j^f
sjf为
M
A
C
j
MAC_j
MACj 对应的第一帧的序列号,得到的公式如下 :
Δ
S
i
j
=
s
j
f
−
s
i
l
for
s
i
l
<
s
j
f
4095
−
(
s
i
l
−
s
j
f
)
for
s
i
l
>
s
j
f
(3)
\\Delta S_i j= \\begincasess_j^f-s_i^l & \\text for s_i^l<s_j^f \\\\ 4095-\\left(s_i^l-s_j^f\\right) & \\text for s_i^l>s_j^f\\endcases \\tag3
ΔSij=sjf−sil4095−(sil−sj基于Spring的轻量级工作流框架
基于javaweb最短路径公交查询系统设计与实现(论文下载)