有用的库存 SQL 数据集?

Posted

技术标签:

【中文标题】有用的库存 SQL 数据集?【英文标题】:Useful stock SQL datasets? 【发布时间】:2011-05-29 14:17:48 【问题描述】:

有谁知道提供优质、有用的股票数据集的任何资源?例如,我下载了一个包含美国所有州、城市和邮政编码的 SQL 脚本。这为我在最近的一个应用程序中节省了很多时间,我希望能够按地理位置进行查找。你们中有人知道其他可以免费下载的有用数据集吗?

例如:

列入黑名单的 IP 地址 学院/大学名称 公司名称/股票代码

有人有什么建议吗?

编辑:

作为示例,我在这里找到了一个 mysql 脚本,其中包含所有美国邮政编码及其对应的纬度/经度。有没有其他人在 SQL 中找到了类似有用的数据集,可以轻松导入和使用?

http://www.chrissibert.com/blog/wp-content/uploads/2009/06/zipcodes.7z

编辑 2:

为了澄清我在谈论什么类型的数据集...我指的是可以立即对应用程序有用的数据集,可以应用于各种场景,并且通常代表易于查找的信息小案例,但更难为更大的数据集编译。邮政编码数据库对我来说就是一个很好的例子。获取单个给定邮政编码的纬度/经度并不难。但是,获取美国所有有效邮政编码的值会花费更多时间。这些数据对单个行业或商业部门也没有用处,但可以应用于一系列应用。

【问题讨论】:

...因为什么被列入黑名单? 你为什么不张贴你得到State|City|Zip SQL脚本的地方开始?这将使这篇文章有了一个良好的开端。 ***.com/questions/2252144/…的可能重复 例如被列为已知恶意IP地址的黑名单。 顺便提一下,美国邮政编码会随着时间而变化。一般列表可能就足够了,但如果您需要精确的准确性,您必须从 USPS 获取定期更新 ($$)。 【参考方案1】:

这里有很多打开数据集的链接:

http://readwrite.com/2008/04/09/where_to_find_open_data_on_the/

虽然我怀疑它们中的任何一个都会为你生成 SQL 语句。

【讨论】:

【参考方案2】:

暗影侠,最好能详细列出你想要的东西。

列入黑名单的 IP 地址 - 广告? XXX?欺诈? 学院/大学的名称 - 全世界?会不会太过分了?

这是一个如何下拉列表的想法 - 我就是这样做的:

例如,我需要一份加利福尼亚州的学院/大学列表。

    我用谷歌搜索:colleges california wikipedia。然后在那里打开first found item; 通过使用鼠标,我将那里的所有学院和大学选择到剪贴板; 打开 Excel 并将复制的名称粘贴到第一行+列中;

    在第一行的第二个单元格中编写模板脚本,例如:

    ="INSERT INTO Colleges (state, name) VALUES ('CA', '" & RC[-1] & "');"
    

    这应该会产生类似

    INSERT INTO Colleges (state, name) VALUES ('CA', 'Academy of Art University, San Francisco');
    INSERT INTO Colleges (state, name) VALUES ('CA', 'Allied American University, Laguna Hills (Online)');
    INSERT INTO Colleges (state, name) VALUES ('CA', 'American Jewish University, Los Angeles');
    INSERT INTO Colleges (state, name) VALUES ('CA', 'American Sports University, San Bernardino');
    INSERT INTO Colleges (state, name) VALUES ('CA', 'Anaheim University, Anaheim (Online)');
    INSERT INTO Colleges (state, name) VALUES ('CA', 'Antioch University, Culver City');
    -- etc...
    
    然后只需复制生成的脚本并将其用于您的数据库

【讨论】:

【参考方案3】:

http://www.data.gov/ 有很多不同的数据集,但大多数不是“库存”。

【讨论】:

【参考方案4】:

编辑: 我会留下我之前的答案。如果您想将任意 CSV 转换为 SQL 脚本以供数据库使用,请阅读下文。否则,the Chinook Database offers excellent sample data with scripts that are compatible with a variety of relational databases。


我一直在寻找示例基本的类似 SQL 的数据集,以帮助教朋友如何进行 SQL 查询。此处发布的某些链接不再可用,因此我将发布我最终使用的链接。

SpatialKey here 提供了一些非常酷的 CSV 数据。

如果你需要的话,可以使用 CSV 数据,但我想要 SQLite 数据库中的数据,所以我使用了这个方便的CSV->SQL online converter。

下载 SQL 后,我运行以下命令:

在外壳:

sqlite3 <database_file>

在 SQLite 外壳中:

.load <path to SQL script file>

【讨论】:

【参考方案5】:

股票代码是有问题的,它们对于每个交易执行场所都可能不同,并且几乎所有都作为场所或数据供应商的受保护知识产权持有,例如汤森路透、彭博、纳斯达克、纽约证券交易所。

【讨论】:

【参考方案6】:

如果您要查找时间序列数据,请查看Quandl。这里最棒的是它拥有大量不同的数据集(股票、经济、健康、教育等),但都可以通过一个简单的 RESTful API 访问。如果您不喜欢编程,那么有一个免费的 Excel 插件可以让您轻松地将数据抓取到电子表格中。

【讨论】:

【参考方案7】:

MySQL 文档站点有一个可下载数据集的列表,该数据集已经采用 SQL 格式,可以在数据库中使用。

    下载数据集,如世界数据库:http://downloads.mysql.com/docs/world_innodb.sql.gz 将目录更改为您下载到的文件夹,例如cd Downloads 解压gunzip world_innodb.sql.gz 登录mysql并创建world数据库

$ mysql mysql> create database world mysql> quit

    使用cat导入mysqldump文件的内容

cat world_innodb.sql | mysql世界

此数据集适合希望练习 SQL 的学习者。

【讨论】:

以上是关于有用的库存 SQL 数据集?的主要内容,如果未能解决你的问题,请参考以下文章

多维数据集 SQL ORA-00936 缺少表达式

如何使用 LSTM Keras 预测未来库存

数据分析:比较两个数据集以设计用于人口分割的有用特征

想获得有用的公开数据集,掌握Python网络爬虫技术少不了!

spark配置

是否有用 REXX 或 CLIST 编写的 TSO 命令可以确定谁已将数据集排入队列?