将数据保存到 DocumentDb 中的多个集合中
Posted
技术标签:
【中文标题】将数据保存到 DocumentDb 中的多个集合中【英文标题】:Saving data into multiple collections in DocumentDb 【发布时间】:2014-11-04 22:35:21 【问题描述】:在 DocumentDb 中,解耦数据以便将它们保存在单独的集合中的最佳方式和位置是什么?
到目前为止,大多数关于如何使用 DocumentDb 管理数据的示例都使用简单的对象,但在现实生活中,我们几乎没有这样做过。我只是想了解在将复杂类保存为 DocumentDb 中的 Json 对象之前,我需要如何以及在何处处理它们。
让我们看看下面的例子。我会将我的项目信息保存到 Projects 集合中,但我不想在项目文档中保存项目团队中人员的全名。我只想将他们的 EmployeeId 保存在项目文档中。我有一个单独的员工集合,我想在其中保存人员/员工的特定信息。我的项目对象如下所示:
public class Project
[JsonProperty(PropertyName="id")]
public int ProjectId get; set;
[JsonProperty(PropertyName="projectName")]
public string ProjectName get; set;
[JsonProperty(PropertyName="projectType")]
public string ProjectType get; set;
[JsonProperty(PropertyName="projectTeam")]
public List<TeamMember> ProjectTeam get; set
我的 TeamMember 类继承自 Employee 对象,如下所示:
public class TeamMember : Employee
[JsonProperty(PropertyName="position")]
public string Position get; set;
我的 Employee 类如下所示:
public class Employee
[JsonProperty(PropertyName="id")]
public int EmployeeId get; set;
[JsonProperty(PropertyName="firstName")]
public string FirstName get; set;
[JsonProperty(PropertyName="lastName")]
public string LastName get; set;
[JsonProperty(PropertyName="gender")]
public string Gender get; set;
[JsonProperty(PropertyName="emailAddress")]
public string EmailAddress get; set;
在保存到 Projects 集合之前,以下是我的 Project 文档的示例:
id: 12345,
projectName: "My first project",
projectType: "Construction Project",
projectTeam: [
id: 7777, position: "Engineer" ,
id: 8998, position: "Project Manager"
]
如您所见,我将我的项目信息与员工数据分离,以便将它们分别存储在他们自己的集合、项目和员工集合中。
我们不要讨论为什么我应该或不应该解耦数据。我只想看看我应该如何以及在哪里处理解耦以产生最快的结果。我想遵循最佳实践,所以我只想看看使用 DocumentDb 的专家如何处理这种情况。
我可以想到两个地方来处理这个问题,但我想了解是否有更好、更直接的方法来做到这一点:
-
我可以在我的 C# 代码中将我的 Project 类转换为 JSON 对象,并将 JSON 对象传递给 DocumentDb 进行存储。
或者,我可以将我的 Project 对象直接传递给 DocumentDb,传递给一个 javascript 存储过程,然后我可以处理解耦并将数据存储在 DocumentDb 中的两个或多个集合中。
以下是我想知道的:
-
哪个位置适合处理解耦数据?
哪个会提供更好的性能?
有没有更好的方法来处理这个问题?我一直在阅读有关如何将我的 POCO 类传递给 DocumentDb 的信息,它会为我处理它们。 DocumentDb 会处理这种更复杂的场景吗?如果有,怎么做?
感谢您的帮助。谢谢。
【问题讨论】:
Single or Multiple Entities Per Collection in DocumentDB的可能重复 【参考方案1】:在这样的 NoSql 存储中,您可以将具有不同模式的不同类型的文档存储在同一个集合中。
请不要将集合视为表格。将集合视为执行查询、事务等的分区和边界单元。
因此,考虑到这一点,如图所示存储您的项目文档并将员工文档包含在同一个集合中没有任何问题。
现在说了这么多;如果您仍然想这样做,那么您可以... 为了实现这一点,您的项目对象将不得不改变。 而不是 TeamMember : Employee (这将包括整个 Employee 对象)让 TeamMember 对象模仿您从 JSON 中想要的内容......即
class TeamMember
int id get;set;
string position get;set;
现在,当 DocumentDB 序列化您的项目对象时,您最终会得到与您想要的相似的 JSON。然后您可以将您的 Employee 对象单独保存在其他地方。
如果您不想这样做,或者因为您不控制模型的定义或因为系统的其他部分已经构建为依赖于此而无法这样做,那么您可以研究构建一个为您的 Project 对象定制 JSON 转换器,它会吐出您想要的 JSON。 然后用那个 JsonConverter 装饰你的 Project 对象,当 DocumentDB 进行转换时,每次都会创建正确的结果。
【讨论】:
瑞恩,你是对的!我将集合视为表格。如果我将项目和员工都存储在同一个集合中,我如何知道要查询的文档类型? 今天最简单的方法是为每个 JSON 文档添加一个“类型”属性并将其包含在查询中。 WHERE type=project 或 WHERE type=employee 我知道您今天仅限于 WHERE 中的 3 个子句,但现在很可能会更改以允许更多。我们很想知道是否有其他方法可以让您更轻松地完成此操作,因此请继续提供反馈。以上是关于将数据保存到 DocumentDb 中的多个集合中的主要内容,如果未能解决你的问题,请参考以下文章
我应该在 DocumentDb 中非规范化还是运行多个查询?
天蓝色中的 DocumentDB(通过 MongoDB 协议)集合大小限制