利用PYTHON匹配提取EXCEL表的省市区,有偿?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了利用PYTHON匹配提取EXCEL表的省市区,有偿?相关的知识,希望对你有一定的参考价值。

利用PYTHON匹配提取EXCEL表的省市区,有偿,例如EXCEL有个地址:淮安市淮海东路淮海第一城,利用PYTHON的地址库匹配,然后提取某某省,某某市,某某区

不规范的地址处理是个麻烦的事。

在常用的6级行政划分(省市县乡村组)格式下,缺少部分的补全只是其中一部分的工作量,内容错误与略写的恢复也是很重要的处理内容。2004年我经手的一个项目,要对老系统的数据做迁移,其数据的规范化工作中有一个企业信息的处理,其中对于【深圳市工商行政管理局】这个营业执照办理机构,整个系统的手工录入数据里有160多种写法,有带【广东省】前缀的,有带【广东】前缀的,有【工商行政管理局】,有【工商管理局】,有【工商局】,甚至还有【工商行政管路局】等不一而足。

面对这样的数据,要么,将它们补全、规范化,要么,只能是忽略它们。


标准的6位行政编码是规范到县级,2000年时,全国有4000多个编码在使用,现在有3600+在使用。如果要处理不同时期的行政编码因【裁撤并分改】而产生的变化,也是相当大的工作量。


然后就只需要考虑缺失级别的补全工作了。

不能简单认为市级就一定是某某市,例如内蒙有很多市级的某某盟;

同样的某某市也不一定是市级,例如北京市(省级),都江堰市(县级);

在县级,有不少同名的,一些省会城市的下辖县级单位是某某区,而它们经常就有同名的,北京有朝阳区,长春有朝阳区,这都是县级的,同时,辽宁还有个朝阳市……

因此,【朝阳群众】到底是指哪里的群众,在没有上下文的情况下,还真不好说。


如果上述的所有问题都解决了,或者都不考虑,假定数据都是规范的完整地址,例如【湖南省株洲市茶陵县】或者【湖南省常德市津市市】这样的,要进行匹配就是很简单的事了。

参考技术A 最常见的毛病是灯座接点弹片弹性疲乏,或者电极氧化。把电灯关掉,用小起子把灯座内有氧化的电极刮一下,有弹片的挑一下。重新装正灯泡,稍微扭进去一些,保证电极. 参考技术B PYTHON的地址库 --- 你具体指的是什么?这个有个准确度的问题,百分之百是无法实现的。

EXCEL数据的透视表1-1

为了从复杂的数据中提取有用的信息,可以利用Excel提供的【数据透视表】(pivottable)工具。利用数据透视表,

可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图,形成一个符合需要的交叉表(列联表)。

在利用数据透视表时,数据源表中的首行必须有列标题。例如,表3-2就满足建立数据透视表的条件。

★解:用Excel 创建数据透视表的具体步骤如下。用Excel创建数据透视表的操作步骤
第1步:选择【插入】→【数据透视表】。
第⒉步:在【表/区域】框内选定数据区域(在操作前将光标放在任意数据单元格内,系
统会自动选定数据区域)。选择放置数据透视表的位置。系统默认是新工作表,如果要将透视表放在现有工作表中,

则选择【现有工作表】,并在【位置】框内点击工作表的任意单元格(不要覆盖数据)。点击【确定】,结果如图3-6所示。

 

第3步:用鼠标右键单击数据透视表,选择【数据透视表选项】,在弹出的对话框中点击

【显示】,并选中【经典数据透视表布局】,然后点击【确定】,结果如图3一7所示。

第4步:将数据透视的一个字段拖至“行”的位置,将另一个字段拖至“列”的位置((行

列可以互换),再将要计数的变量拖至“值字段”的位置,即可生成需要的频数分布表,结果如图3-8所示。

操作过程

利用数据透视表分析数据十分灵活。如果要改变分析,建立不同的数据透视表,只需要将【数据透视表和数据透视图向导——布局】

对话框中的“行”“列”“数据”区域中的变量拖出,将需要的变量拖入,即可得到所需要的数据透视表。学习数据透视表最好的办法是多练习。

 

以上是关于利用PYTHON匹配提取EXCEL表的省市区,有偿?的主要内容,如果未能解决你的问题,请参考以下文章

如何利用python提取两个excel对比后的重复值的信息?

excel 地址提取省市县

excel 地址提取省市县

在excel如何用函数把地址中省份、城市、区县单独提取出来?

正则表达式匹配提取省市区

利用xlwings库,实现文件名与excel表格内容的极大似然匹配标注(二)