数据集和数据库有啥区别?

Posted

技术标签:

【中文标题】数据集和数据库有啥区别?【英文标题】:What is the difference between dataset and database?数据集和数据库有什么区别? 【发布时间】:2011-12-08 14:47:17 【问题描述】:

数据集和数据库有什么区别?如果它们不同,那么如何?

为什么现在使用数据库难以管理海量数据?!

请独立于任何编程语言回答。

【问题讨论】:

【参考方案1】:

数据库

这两个术语的定义并不总是很清楚。一般而言,数据库是一组使用数据库管理系统 (DBMS) 组织和访问的数据。数据库通常(但并非总是)由多个链接在一起的组成,这些表经常被不同的用户同时访问、修改和更新。

Cambridge dictionary:

计算机中保存的一组结构化数据,尤其是 可通过多种方式访问​​。

Merriam-webster

通常是为快速组织而组织的大量数据集合 搜索和检索(如通过计算机)

数据集(或数据集)

数据集有时指的是单个数据库表的内容,但这是一个相当严格的定义。一般来说,顾名思义,是一组(或集合)数据,因此有图像数据集,如Caltech-256 Object Category Dataset 或视频,例如A large-scale benchmark dataset for event recognition in surveillance video。数据集的目的通常是为分析而设计的,而不是针对不同用户的持续更新,因此代表数据集合的结束或特定时间的快照。

Oxford dictionary:

相关信息集的集合,由以下各项组成 独立的元素,但可以由计算机作为一个单元进行操作。

‘所有医院必须提供每位患者的标准数据集 详情”

Cambridge dictionary

一组单独的信息集,被视为 电脑单机

【讨论】:

【参考方案2】:

数据集只是一组数据(可能与某人有关,可能与其他人无关),而数据库是组织和存储数据或数据集的软件/硬件组件。两者实际上是不同的东西。

海量数据需要更多的基础架构和组件(硬件和软件)或计算能力和存储,以有效存储或检索数据。更大的数据意味着更多的组件因此变得困难。现代数据库提供了良好的基础设施来处理海量数据的处理(包括读/写),检查 Microsoft 广泛管理关系数据或数据集的数据湖管理。

【讨论】:

请明确说明您所说的 h/w 和 s/w 是什么意思。 是 h/w 表示 - 硬件,s/w 表示软件。对不起,我刚刚纠正了它。【参考方案3】:

在美式英语中,database 通常表示“有组织的数据集合”。数据库通常受数据库管理系统的控制,该系统是一种软件,除其他外,管理对数据库的多用户访问。 (通常但不一定。一些简单的数据库只是用 awk 和 Python 等解释语言处理的文本文件。)

在我最熟悉的 SQL 世界中,数据库包括表、视图、存储过程、触发器、权限和数据等内容。

再一次,在美式英语中,dataset通常是指选择并排列成行和列以供统计软件处理的数据。数据可能来自数据库,但也可能不是。

【讨论】:

那么,如果我的数据是图像而不是数字,我也可以使用 dataset 吗? @Sigur:我会将由统计或人工智能软件处理的图像称为数据集。【参考方案4】:

数据集是数据……通常在表格中,也可以是 XML 或其他类型的数据,但它只是数据……它并没有真正做任何事情。

如您所知,数据库是数据集的容器,通常在其周围有内置的基础设施以与之交互。

对于我的工作而言,管理庞大的数据并不难。我猜你是在问一个与研究相关的问题?

【讨论】:

以上是关于数据集和数据库有啥区别?的主要内容,如果未能解决你的问题,请参考以下文章

验证集与测试集有啥区别?为啥要分训练集、验证集和测试集?

测试数据集 和验证数据集 之间的区别

arcgis网络数据集和拓扑的区别

为啥要划分训练集、验证集和测试集

训练集和测试集

.net中datatable和model有啥区别?