如何在 Altair 中使用 GeoJSON 数据制作地图?

Posted

技术标签:

【中文标题】如何在 Altair 中使用 GeoJSON 数据制作地图?【英文标题】:How can I make a map using GeoJSON data in Altair? 【发布时间】:2019-09-19 06:07:18 【问题描述】:

我对地图和 Altair/Vega 非常陌生。有an example in the Altair documentation for how to make a map starting with an outline of US states,基本上是用:

states = alt.topo_feature(data.us_10m.url, feature='states')

# US states background
background = alt.Chart(states).mark_geoshape(
    fill='lightgray',
    stroke='white'
)

但我想在不列颠群岛绘制点,而不是。由于 vega 数据集中只有美国和世界地图,我必须创建自己的 GeoJSON,不是吗?

所以我尝试通过运行一些命令行命令from this blog post,从世界地图获取不列颠群岛的 GeoJSON,即,

ogr2ogr -f GeoJSON -where "adm0_a3 IN ('GBR','IRL','IMN','GGY','JEY','GBA')" subunits.json ne_10m_admin_0_map_subunits/ne_10m_admin_0_map_subunits.shp

这似乎创建了一个 GeoJSON 文件 subunits.json,它可能代表不列颠群岛。但是我怎样才能把它带入 Altair 呢?或者还有其他方法可以使用 Altair 制作不列颠群岛的地图吗?

【问题讨论】:

【参考方案1】:

在此示例中,data.us_10m.url 是一个字符串变量,其中该字符串指定指向 geojson file 的 URL,该 URL 包含 state 功能中的美国州界。如果您想使用其他 geojson 文件,可以在该示例中替换其 URL。

【讨论】:

当我将 URL 提供给我的文件时,我总是得到一张空白地图。也许我拥有的文件不是geojson文件?或者也许我没有选择正确的功能(不确定那是什么)?我在这里完全不知所措。 功能名称应该是 JSON 文件顶层“对象”映射中的键之一。 嗯,我好像没有。也许它不是geojson文件?它开始于 "type": "FeatureCollection", "name": "ne_10m_admin_0_map_subunits", "crs": "type": "name", "properties": "name": "urn:ogc:def:crs:OGC:1.3:CRS84" , 啊,是的,我认为对于 geoshapes 你需要"type":"Topology" 您的文件是geojson 文件,但 Altair 中的示例使用的是topojson【参考方案2】:

您引用的示例是使用topojson 结构化数据,而您有geojson 结构化数据。所以你可能需要:

# remote geojson data object
url_geojson = 'https://raw.githubusercontent.com/mattijn/datasets/master/two_polygons.geo.json'
data_geojson_remote = alt.Data(url=url_geojson, format=alt.DataFormat(property='features',type='json'))

# chart object
alt.Chart(data_geojson_remote).mark_geoshape(
).encode(
    color="properties.name:N"
).project(
    type='identity', reflectY=True
)

更新:从 Altair 3.3.0 版开始,GeoDataFrames (geopandas) 直接为 supported。任何支持__geo_interface__ 的对象也是如此。


如需更多见解,请继续阅读!

这里下面讨论变体:

    内嵌 GeoJSON 内联 TopoJSON 来自 URL 的 TopoJSON 来自 URL 的 GeoJSON

解释geojsontopojson 结构化json 文件之间的区别以及它们在Altair 中的用法

import geojson
import topojson
import pprint
import altair as alt

内嵌 GeoJSON

我们首先创建一个包含两个特征的集合,即两个相邻的多边形。

我们将以 GeoJSON 数据格式创建的两个多边形的示例。:

feature_1 = geojson.Feature(
    geometry=geojson.Polygon([[[0, 0], [1, 0], [1, 1], [0, 1], [0, 0]]]),
    properties="name":"abc"
)
feature_2 = geojson.Feature(
    geometry=geojson.Polygon([[[1, 0], [2, 0], [2, 1], [1, 1], [1, 0]]]),
    properties="name":"def"
)
var_geojson = geojson.FeatureCollection([feature_1, feature_2])

通过漂亮地打印变量var_geojson来检查创建的GeoJSON

pprint.pprint(var_geojson)
'features': ['geometry': 'coordinates': [[[0, 0],
                                             [1, 0],
                                             [1, 1],
                                             [0, 1],
                                             [0, 0]]],
                            'type': 'Polygon',
               'properties': 'name': 'abc',
               'type': 'Feature',
              'geometry': 'coordinates': [[[1, 0],
                                             [2, 0],
                                             [2, 1],
                                             [1, 1],
                                             [1, 0]]],
                            'type': 'Polygon',
               'properties': 'name': 'def',
               'type': 'Feature'],
 'type': 'FeatureCollection'

可以看出,两个Polygon Features 嵌套在features 对象中,geometry 是每个feature 的一部分。

Altair 能够使用 format 中的 property 键解析嵌套的 json 对象。下面是一个例子:

# inline geojson data object
data_geojson = alt.InlineData(values=var_geojson, format=alt.DataFormat(property='features',type='json')) 

# chart object
alt.Chart(data_geojson).mark_geoshape(
).encode(
    color="properties.name:N"
).project(
    type='identity', reflectY=True
)

内联拓扑JSON

TopoJSON 是 GeoJSON 的扩展,其中 featuresgeometry 来自名为 arcs 的***对象。这使得在几何上应用哈希函数成为可能,因此每个共享的arc 应该只存储一次。

我们可以将var_geojson变量转换成topojson文件格式结构:

var_topojson = topojson.Topology(var_geojson, prequantize=False).to_json()
var_topojson
'arcs': [[[1.0, 1.0], [0.0, 1.0], [0.0, 0.0], [1.0, 0.0]],
          [[1.0, 0.0], [2.0, 0.0], [2.0, 1.0], [1.0, 1.0]],
          [[1.0, 1.0], [1.0, 0.0]]],
 'objects': 'data': 'geometries': ['arcs': [[-3, 0]],
                                      'properties': 'name': 'abc',
                                      'type': 'Polygon',
                                     'arcs': [[1, 2]],
                                      'properties': 'name': 'def',
                                      'type': 'Polygon'],
                      'type': 'GeometryCollection',
 'type': 'Topology'

现在嵌套的geometry 对象被arcs 替换,并通过索引引用***arcs 对象。我们现在可以拥有多个objects,而不是单个FeatureCollection,其中我们转换的FeatureCollection 存储在密钥data 中作为GeometryCollection

注意:键名 data 是任意的,并且在每个数据集中都不同。

Altair 能够使用format 中的feature 键解析topojson 格式结构中的嵌套data 对象,同时声明它是topojson type。下面是一个例子:

# inline topojson data object
data_topojson = alt.InlineData(values=var_topojson, format=alt.DataFormat(feature='data',type='topojson')) 

# chart object
alt.Chart(data_topojson).mark_geoshape(
).encode(
    color="properties.name:N"
).project(
    type='identity', reflectY=True
)

来自 URL 的 TopoJSON

如果该文件可通过 URL 访问,则还存在从 topojson 文件中提取对象的简写:

alt.topo_feature(url, feature)

topojson 文件由 URL 引用的 Altair 示例

# remote topojson data object
url_topojson = 'https://raw.githubusercontent.com/mattijn/datasets/master/two_polygons.topo.json'
data_topojson_remote = alt.topo_feature(url=url_topojson, feature='data')

# chart object
alt.Chart(data_topojson_remote).mark_geoshape(
).encode(
    color="properties.name:N"
).project(
    type='identity', reflectY=True
)

来自 URL 的 GeoJSON

但对于可通过 URL 访问的 geojson 文件,则没有这样的简写,应按如下方式链接:

alt.Data(url, format)

geojson 文件由 URL 引用的 Altair 示例

# remote geojson data object
url_geojson = 'https://raw.githubusercontent.com/mattijn/datasets/master/two_polygons.geo.json'
data_geojson_remote = alt.Data(url=url_geojson, format=alt.DataFormat(property='features',type='json'))

# chart object
alt.Chart(data_geojson_remote).mark_geoshape(
).encode(
    color="properties.name:N"
).project(
    type='identity', reflectY=True
)

【讨论】:

以上是关于如何在 Altair 中使用 GeoJSON 数据制作地图?的主要内容,如果未能解决你的问题,请参考以下文章

如何在 altair.layered 图中配置条形图?

使用 Altair 和 Jupyter 绘图时如何在轴标签中显示希腊字母?

如何使 Altair 绘图响应

对从大型数据集中聚合的数据使用 Altair

如何通过 altair 图表显示一个字段的数据框?

如何在猫鼬中为 geojson 数据创建模式?