将 csv 和 shapefile 与 geopandas 合并
Posted
技术标签:
【中文标题】将 csv 和 shapefile 与 geopandas 合并【英文标题】:Merge a csv and shapefile with geopandas 【发布时间】:2021-12-17 10:06:15 【问题描述】:我正在尝试使用 geopandas 将 CSV 与 shapefile 合并。我对两者都有一个唯一 ID,并且希望在存在匹配的唯一 ID 时将 CSV 中的数据附加到 shapefile 中。谢谢
【问题讨论】:
你应该可以只使用 pd.merge。你能告诉我们你被困在哪里吗?请参阅how to ask a question上的本指南 请提供足够的代码,以便其他人更好地理解或重现问题。 【参考方案1】: 这是一个完整的工作示例 加载下载的美国各州形状文件 加载 CSV(使用io.StringIO
使此代码独立)
pandas merge()
在键列 iso_3166_2
通过绘制合并数据、形状文件中的几何图形、CSV 中的 大小 来显示它的工作原理
import io
import geopandas as gpd
import pandas as pd
from pathlib import Path
from zipfile import ZipFile
import urllib
import requests
# fmt: off
# download boundaries
url = "https://www.naturalearthdata.com/http//www.naturalearthdata.com/download/110m/cultural/ne_110m_admin_1_states_provinces.zip"
f = Path.cwd().joinpath(urllib.parse.urlparse(url).path.split("/")[-1])
# fmt: on
if not f.exists():
r = requests.get(url, stream=True, headers="User-Agent": "XY")
with open(f, "wb") as fd:
for chunk in r.iter_content(chunk_size=128):
fd.write(chunk)
zfile = ZipFile(f)
zfile.extractall(f.stem)
# load downloaded boundaries (shape file)
gdf2 = gpd.read_file(str(f.parent.joinpath(f.stem).joinpath(f"f.stem.shp")))
# load CSV....
df = pd.read_csv(io.StringIO("""size,iso_3166_2
118,US-MN
829,US-MT
235,US-ND
998,US-ID
807,US-WA
956,US-AZ
2094,US-CA
652,US-CO
541,US-NV
1,US-WV
3,US-MD
2,US-NJ
8,US-NY
16,US-PA
1,US-ME
66,US-MI"""))
gdf = gpd.GeoDataFrame(df.merge(gdf2, on="iso_3166_2"))
# prove it worked...
gdf.plot(column="size", cmap="OrRd")
【讨论】:
以上是关于将 csv 和 shapefile 与 geopandas 合并的主要内容,如果未能解决你的问题,请参考以下文章
R:将Shapefile 1中的多边形与shapefile 2中的区域代码匹配
在ARCGIS软件下,创建shapefile数据和文件数据库的步骤