表示下/上三角矩阵的有效方法
Posted
技术标签:
【中文标题】表示下/上三角矩阵的有效方法【英文标题】:efficient way to represent a lower/upper triangular matrix 【发布时间】:2011-12-18 05:53:10 【问题描述】:我正在使用二维的 C/C++ 程序处理我的数据。这里我的值是成对计算的,foo[i][j]
和foo[j][i]
的值相同。
因此,如果我使用简单的二维数组来实现它,我的一半空间将被浪费。那么什么是表示这个下/上三角矩阵的最佳数据结构。
问候,
【问题讨论】:
这里有一个用 C++ 实现的下三角矩阵示例github.com/fylux/TriangularMatrix 【参考方案1】:如果您有 N 个项目,则没有主对角线的下三角阵列将有 (N - 1) * N / 2 个元素,或 (N + 1) * N / 2 个元素和主对角线。没有主对角线,(I, J) (I,J ∈ 0..N-1, I > J) ⇒ (I * (I - 1) / 2 + J)。对于主对角线,(I,J ∈ 0..N-1, I ≥ J) ⇒ ((I + 1) * I / 2 + J)。
(是的,当您在 2.5 GB 的机器上分配 4 GB 时,将其减少一半确实会产生巨大的影响。)
【讨论】:
【参考方案2】:真的,您最好只使用常规的二维矩阵。 RAM相当便宜。如果您真的不想这样做,那么您可以构建一个具有正确数量元素的一维数组,然后弄清楚如何访问每个元素。例如,如果数组的结构如下:
j
1234
i 1 A
2 BC
3 DEF
4 GHIJ
你把它存储为一个一维数组,从左到右,你可以用array[3]
访问元素C
(2, 2)
。你可以制定一个从[i][j]
到[n]
的函数,但我不会破坏你的乐趣。但是你不必这样做,除非所讨论的三角形数组真的很大或者你非常关心空间。
【讨论】:
【参考方案3】:正如 Dan 和 Praxeolitic 提出的具有对角线但具有修正转换规则的下三角矩阵。
对于 n × n 矩阵,您需要数组 (n+1)*n/2
长度,转换规则为 Matrix[i][j] = Array[i*(i+1)/2+j]
。
#include<iostream>
#include<cstring>
struct lowerMatrix
double* matArray;
int sizeArray;
int matDim;
lowerMatrix(int matDim)
this->matDim = matDim;
sizeArray = (matDim + 1)*matDim/2;
matArray = new double[sizeArray];
memset(matArray, .0, sizeArray*sizeof(double));
;
double &operator()(int i, int j)
int position = i*(i+1)/2+j;
return matArray[position];
;
;
我使用double
完成了它,但您可以将其设置为template
。这只是基本骨架,所以不要忘记实现析构函数。
【讨论】:
【参考方案4】:使用锯齿状数组:
int N;
// populate N with size
int **Array = new Array[N];
for(int i = 0; i < N; i++)
Array[i] = new Array[N - i];
它会像这样创建数组
0 1 2 3 4 5
0 [ ]
1 [ ]
2 [ ]
3 [ ]
4 [ ]
5 [ ]
【讨论】:
这将独立分配各个数组,这可能对缓存行为和内存碎片不利。如果您不太关心性能,这可能没问题,但在这种情况下,您可能应该只使用单个 NxN 数组。如果您确实决定要使用指针数组,则在单个数组中分配 N*(N+1)/2 个元素,并将行指针创建为该数组的偏移量。 @ErikP。 : 我知道用连续数组和计算偏移量的访问方法创建一个类更好,但这是一种更简单的方法。【参考方案5】:唯一元素的数量 m,需要在 n × n 对称矩阵中表示:
主对角线
m = (n*(n + 1))/2
没有对角线(对于 OP 描述的对称矩阵,需要主对角线,但只是为了更好的衡量......)
m = (n*(n - 1))/2
.
如果使用带有截断的整数运算,则在最后一次运算之前不要除以 2。
你还需要做一些算术来找到对应于对角矩阵中行 x 和列 y 的分配内存中的索引 i。
上对角矩阵中第 x 行和第 y 列的已分配内存 i 中的索引:
对角线
i = (y*(2*n - y + 1))/2 + (x - y - 1)
没有对角线
i = (y*(2*n - y - 1))/2 + (x - y -1)
对于下对角矩阵,翻转方程中的 x 和 y。对于对称矩阵,只需在内部选择 x>=y 或 y>=x 并根据需要翻转成员函数。
【讨论】:
这似乎不太正确 - 将 (0,0) 插入“对角线”会产生 -1。 i = (y* (2 * n - y + 1)) / 2 + x;【参考方案6】:重复 Dani 的回答...
您可以分配一个数组来保存数据,并分配一个小数组来保存指向第一次分配中行的指针,而不是分配许多不同大小的数组,这可能会导致内存碎片或奇怪的缓存访问模式。
const int side = ...;
T *backing_data = new T[side * (side + 1) / 2]; // watch for overflow
T **table = new T*[side];
auto p = backing_data;
for (int row = 0; row < side; ++row)
table[row] = p;
p += side - row;
现在您可以使用table
,就好像它是一个锯齿状数组,如 Dani 的回答所示:
table[row][col] = foo;
但是所有数据都在一个块中,否则它可能不会取决于分配器的策略。
使用行指针表可能会也可能不会比使用 Praxeolit 公式计算偏移量更快。
【讨论】:
【参考方案7】:#include <stdio.h>
// Large math problems running on massively parallel systems sometimes use a lot
// of upper triangular matrices. Implemented naively, these waste 50% of the memory
// in the machine, which is not recoverable by virtual memory techniques because it
// is interspersed with data on each row. By mapping the array elements into an
// array that is half the size and not actually storing the zeroes, we can do twice
// the computation in the same machine or use half as many machines in total.
// To implement a safety feature of making the zero-part of an upper triangular matrix
// read-only, we place all the zeroes in write-protected memory and cause a memory violation
// if the programmer attempts to write to them. System dependent but relatively portable.
// Requires that you compile with the -Wno-discarded-qualifiers option.
// for the awkward case (an even-sized array bound):
// +--------/
// row 0, 40 items -> |0 /
// row 1, 39 items -> | /
// row 19, 21 items -> | /
// row 20, 20 items -> |----/ <------ cut and rotate here to form a rectangle.
// row 21, 19 items -> | /
// | /
// row 39, 1 item -> | /
// row 40, 0 items -> |/
// /
// x y x y
// 0,0 39,0
// +----/ | +--------/
// | / | row 0, 40 items -> |0 /| <-- row 40, 0 items
// | / - 20,18 | row 1, 39 items -> | /0| <-- row 39, 1 item
// | /\ | row 19, 21 items -> | / | <-- row 21, 19 items
// |/ 19,19 | row 20, 20 items -> | /???| <-- row 20, 20 items half of row 20 is wasted...
//0,39 v | ~~~~~~~~~~
// | |
// for odd-sized array bounds, there is no need for the wasted half-row marked '???' above...
// And once the mapping above is done, mirror the indexes in x to get a proper Upper Triangular Matrix which
// looks like this...
// ____
// \ |
// \ |
// \|
//
// Rather than store the underlying data in a 2D array, if we use a 1-D array,
// and map the indexes ourselves, it is possible to recover that final half-row...
// The implementation allows for the matrix elements to be any scalar type.
#define DECLARE_TRIANGULAR_MATRIX(type, name, bound, zero) \
type _##name[bound * (bound+1) / 2 + 1]; /* +1 is for a debugging tombstone */ \
type *__##name(int x, int y) \
static const type Zero = zero; /* writing to the lower half of the matrix will segfault */ \
x = (bound-1)-x; /* mirror */ \
if (x+y >= bound) return &Zero; /* requires cc -Wno-discarded-qualifiers */ \
if (y > bound/2) x = (bound-1)-x; y = bound-y; \
return &_##name[y*bound+x]; /* standard mapping of x,y -> X */ \
#define TRIANGULAR_MATRIX(name, x, y) *__##name(x,y)
// ----------------------------------------------------------------------------------------
// Simulate 'int fred[11][11];' as an upper triangular matrix:
#define ARRAYSIZE 11
DECLARE_TRIANGULAR_MATRIX(int, fred, ARRAYSIZE, 0)
#define fred(x, y) TRIANGULAR_MATRIX(fred, x, y)
/* unfortunately we can't #define fred[x][y] here ... In the Imp language which used () both
for array indexes and procedure parameters, we could write a mapping function fred(x,y)
which made the indirected function call indistinguishable from a normal array access.
We attempt to do something similar here using macros, but C is not as cooperative. */
int main(int argc, char **argv)
int x,y, element;
// treat as fully populated 2D array...
for (y = 0; y < ARRAYSIZE; y++)
for (x = 0; x < ARRAYSIZE; x++)
if (y <= x) fred(x,y) = (x+1) * 100 + (y+1); // upper triangle test
fprintf(stdout, "Upper Triangular matrix:\n\n");
fprintf(stdout, " ");
for (x = 0; x < ARRAYSIZE; x++) fprintf(stdout, "%5d", x);
fprintf(stdout, "\n ");
for (x = 0; x < ARRAYSIZE; x++) fprintf(stdout, "_____");
fprintf(stdout, "\n");
for (y = 0; y < ARRAYSIZE; y++)
fprintf(stdout, "%2d |", y);
for (x = 0; x < ARRAYSIZE; x++)
element = fred(x,y);
fprintf(stdout, "%5d", element);
if (y <= x) // upper triangle test
if (element != (x+1) * 100 + (y+1))
fflush(stdout); fprintf(stderr, "Mismatch! at %d,%d (%d != %d)\n", x, y, element, x * 100 + y);
else if (element != 0)
fflush(stdout); fprintf(stderr, "Mismatch! at %d,%d (%d != 0)\n", x, y, element);
fprintf(stdout, "\n");
return 0;
【讨论】:
以上是关于表示下/上三角矩阵的有效方法的主要内容,如果未能解决你的问题,请参考以下文章
R语言使用cor函数计算相关性矩阵进行相关性分析,使用corrgram包可视化相关性矩阵行和列使用主成分分析重新排序下三角形中使用底纹和颜色表示相关性变量按其原始顺序绘制上三角形空白
R语言使用cor函数计算相关性矩阵进行相关性分析,使用corrgram包可视化相关性矩阵行和列使用主成分分析重新排序下三角形中使用底纹和颜色表示相关性(自定义颜色)上三角形中添加相关性数值