拓端tecdat|基于出租车GPS轨迹数据的研究:出租车行程的数据分析

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了拓端tecdat|基于出租车GPS轨迹数据的研究:出租车行程的数据分析相关的知识,希望对你有一定的参考价值。

基于出租车GPS轨迹数据的研究:出租车行程的数据分析

数据

Reddit用户imjasonh和fhoffa解析了原始数据 ,该模式如下所示:

拓端tecdat|基于出租车GPS轨迹数据的研究:出租车行程的数据分析_数据

拓端tecdat|基于出租车GPS轨迹数据的研究:出租车行程的数据分析_数据_02

 

 每次骑行都有非常具体的上/下车位置以及开始/结束时间的详细信息。 下面显示了一个示例 :

拓端tecdat|基于出租车GPS轨迹数据的研究:出租车行程的数据分析_数据分析_03

拓端tecdat|基于出租车GPS轨迹数据的研究:出租车行程的数据分析_数据分析_04

 

 我们留下了158,320,608个出租车行程的数据集,分为32,654个不同的起点/终点。


自1987年以来,位于东79街和约克大街的出租车站一直将上东区的居民带到华尔街。 

我在数据中发现了沿着这条路线的252,210次旅行。出租车平均需要20.35分钟才能以22.11 mph的速度行驶。当然,您会在凌晨4点走得更快,但是大多数人直到凌晨6点或凌晨7点才开始上下班:

拓端tecdat|基于出租车GPS轨迹数据的研究:出租车行程的数据分析_数据分析_05

拓端tecdat|基于出租车GPS轨迹数据的研究:出租车行程的数据分析_数据分析_06

 

 一年中,最专用的出租车使路线行驶234次(只有7条出租车使路线行驶100次):

拓端tecdat|基于出租车GPS轨迹数据的研究:出租车行程的数据分析_大数据_07

拓端tecdat|基于出租车GPS轨迹数据的研究:出租车行程的数据分析_大数据_08

 

尽管前十名最常见的出租车司机的平均速度较可预测,但他们的前进速度并没有比大多数人快(这可能是因为他们经常每天同时开车)。 

拓端tecdat|基于出租车GPS轨迹数据的研究:出租车行程的数据分析_数据分析_09

拓端tecdat|基于出租车GPS轨迹数据的研究:出租车行程的数据分析_数据分析_10

 

 

SELECT
pickup_street1, pickup_street2, dropoff_street1, dropoff_street2,
trips_medallion, trips_pickup_datetime, trips_dropoff_datetime,
ROUND(trips_avg_mph,4) AS avg_mpg,
ROUND(trips_trip_duration_hours,4) AS num_hours
FROM
[taxi_strava.joined_geohash_geonames]
WHERE
trips_geohashed_dropoff = dr5ru2
AND trips_geohashed_pickup = dr5rvj

拓端tecdat|基于出租车GPS轨迹数据的研究:出租车行程的数据分析_数据分析_11

如果您有任何疑问,请在下面发表评论。   


以上是关于拓端tecdat|基于出租车GPS轨迹数据的研究:出租车行程的数据分析的主要内容,如果未能解决你的问题,请参考以下文章

拓端数据tecdat:DT模型打好用户流失预防针——电信客户流失浅析

拓端tecdat:看推特数据如何”塑造”地区形象

拓端tecdat:看推特数据如何”塑造”地区形象

拓端tecdat|R语言高维数据惩罚回归方法:主成分回归PCR岭回归lasso弹性网络elastic net分析基因数据

拓端tecdat|R语言辅导Wald检验 vs 似然比检验

拓端tecdat|电力消耗模型构建分析和预测