数据库或英文名字和姓氏列表[关闭]
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据库或英文名字和姓氏列表[关闭]相关的知识,希望对你有一定的参考价值。
我遇到了一些较小的列表/名称集,但我想知道是否有一个免费的数据源可以提供一个名称列表(逗号分隔或在SQL结构中)?
我找到了这两个网站:
http://names.mongabay.com/most_common_surnames.htm
http://baby-names.familyeducation.com/browse/letter/a?detoured=1
但是,似乎您只能浏览名称,而不能下载全面的文件。
美国人口普查局不提供此信息吗?
我正在编制一个数据库,其中包含来自不同国家和文化的姓氏,其中包括英国。 该项目及其数据集可在此处找到:https://github.com/enorvelle/NameDatabases (死:链接,项目和GitHub帐户)
这似乎已经迁移到qazxsw poi。 (独家撰稿人“Erik Norvelle”。)
我能够找到的最好的来源是社会保障管理部门提供的数据 - 与人口普查数据不同,他们每年的名字可以追溯到〜1900年。
github.com/smashew/NameDatabases
人口普查局提供2000年和1990年人口普查的共同姓氏清单:https://www.ssa.gov/oact/babynames/limits.html http://www.census.gov/topics/population/genealogy/data/2000_surnames.html
1990年的人口普查文件也有常见的男性和女性名单。
选项1)我将数百万人的数据上传到github,我从不同的网站抓取并从Google开放数据集中转储。
http://www.census.gov/topics/population/genealogy/data/1990_census/1990_census_namefiles.html [名字目录的Github链接]
选项2)
Google BigQuery Public Dataset:https://github.com/aakashkag/People-Name-List
您可以从Google开放数据集中获取名称以及性别。
1)数据集:bigquery-public-data:github_repos
示例:https://cloud.google.com/bigquery/public-data/
查询:SELECT * FROM https://app.hyfy.io/v/abRJ75Xizno/ LIMIT 1000 Total Names availble:1858689
2)Dateset:bigquery-public-data.github_repos.commits
查询:SELECT author.name as author_name,author.email as author_email,committer.name as committer_name,committer.email as committer_email,repo_name FROM fh-bigquery.popular_names.usa_summary_1880_2015
3)Dateset:bigquery-public-data.usa_names.usa_1910_2013`
查询:SELECT * FROM bigquery-public-data.github_repos.commits
以上是关于数据库或英文名字和姓氏列表[关闭]的主要内容,如果未能解决你的问题,请参考以下文章