使用python从不拼写的村庄名称列表中找到正确的村庄名称[关闭]

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用python从不拼写的村庄名称列表中找到正确的村庄名称[关闭]相关的知识,希望对你有一定的参考价值。

我有两个数据帧df1和df2。 df1由正确的村庄名称组成,而df2由错误/拼写错误的村庄名称组成。现在,我想找出与那些错误/拼写错误的村庄名称相对应的正确村庄名称。由于我是Python的新手,请在这方面指导我。
答案
好朋友,您没有提供您的代码,所以我假设我自己您可以通过我的示例代码来理解]

根据您的问题,建议您使用fuzzywuzzy您可以通过cmd安装pip install fuzzywuzzy

from fuzzywuzzy import process # As I don't know your column name I'm assuming it on my own df1 = df2 = df1['correct_name'] = ['jaipur','mumbai','ajmer','goa','sikkim'] df2['wrong_name'] = ['jepuor','mumbayi','amer','ga','goa','gooa','skim','jpur','moombi'] #You can customize and use accordingly for items in df2['wrong_name']: found = process.extractOne(items,df1['correct_name']) print(items,' found similar to ', found[0], ' with percentage ', found[1])

我的输出是

jepuor found similar to jaipur with percentage 67 mumbayi found similar to mumbai with percentage 92 amer found similar to ajmer with percentage 89 ga found similar to goa with percentage 80 goa found similar to goa with percentage 100 gooa found similar to goa with percentage 86 skim found similar to sikkim with percentage 80 jpur found similar to jaipur with percentage 80 moombi found similar to mumbai with percentage 67

您可以在https://pypi.org/project/fuzzywuzzy/上了解有关此模块的信息>

以上是关于使用python从不拼写的村庄名称列表中找到正确的村庄名称[关闭]的主要内容,如果未能解决你的问题,请参考以下文章

npm : 无法将“npm”项识别为 cmdlet函数脚本文件或可运行程序的名称。请检查名称的拼写,如果包括路径,请确保路径正确,然后再试一次。

Win7访问共享文件夹提示“请检查名称的拼写”怎么办

MVC 3.0错误 HTTP 404您正在查找的资源(或者它的一个依赖项)可能已被移除,或其名称已更改,或暂时不可用。请检查以下 URL 并确保其拼写正确。

MS 访问错误:SELECT 语句包含拼写错误或丢失的保留字或参数名称,或者标点符号不正确

选择语句无法找到拼写错误的参数名称

tsc : 无法将“tsc”项识别为 cmdlet函数脚本文件或可运行程序的名称。请检查名称的拼写,如果包括路径,请确保路径正确,然后再试一次。