c#立方体/多维数据集

Posted

技术标签:

【中文标题】c#立方体/多维数据集【英文标题】:c# cube / multidimensional dataset 【发布时间】:2010-03-03 05:06:58 【问题描述】:

我正在解决一个问题,我需要使用 C# 处理内存中的多维数据。我的需求类似于 OLAP 多维数据集,但没有那么复杂。例如,我不需要计算或聚合或类似的东西。我基本上想使用多维键来引用数据。例如:

var key = new Key();
key["Dim1"] = "DimValue1";
key["Dim2"] = "DimValue2";
key["Time"] = 1999;
DataSet[key] = 4.43434m;

它允许我迭代数据集的值或切片。你在 C# 中遇到过这样的库吗?

【问题讨论】:

【参考方案1】:

这可能无法满足您的需求,但我发现处理多键数据集的一种简单方法是创建一个对象,其中包含所有“键”字段和“值”键(每个键的数量与您的数量一样多)需要),然后为每个键创建查找表达式。

例如:

class MyData

    // Your keys
    public string Dim1;
    public string Dim2;
    public string Time;

    // Your values
    public string Value;

将被“索引”并像这样检索:

// add all your data to a list or collection
var data = new List<MyData>();

// this provides the entry point to our dataset
var lookupDim1 = data.ToLookup(d => d.Dim1);
var lookupDim2 = data.ToLookup(d => d.Dim2);
var lookupTime = data.ToLookup(d => d.Time);

// sample retrievals
IEnumerable<MyData> sampleData1 = lookupDim1["DimValue1"];
var sampleData2 = lookupDim2["DimValue2"].Intersect( lookupTime["1999"] );

【讨论】:

非常好的主意。我不知道查找。但我认为这会执行得很慢。如果不是 O(n^m),我认为最多 O(n) 进行检索,其中 m 是键的数量。 您的数据集有多大?当我使用超过 500 万条记录时,它运行得非常快,每条记录高达 4KB 左右。我不自称知道 Lookup LINQ 是如何工作的,但它非常快。【参考方案2】:

您可以创建一个字典,其中键类型是您声明的结构。尽管您可以通过过滤来实现它,但它不会给您切片的自动迭代。

【讨论】:

【参考方案3】:

我认为像 MongoDB 和 Redis 这样的键/值存储已经接近我所需要的。但是,我不是 100% 确定。由于我不关心持久性,所以像Redis这样的记忆故事更合适。

【讨论】:

以上是关于c#立方体/多维数据集的主要内容,如果未能解决你的问题,请参考以下文章

处理多维立方体的有效方法

绘制真实的 BI 3D 立方体

OLAP Cube - 数据立方体

使用 REST API 创建 Apache kylin 多维数据集

是否有可能在OpenGL中点击多维数据集的哪个表面?

OLAP 多维数据集 - PHP 和 MongoDB