用C试一下稀疏矩阵的快速转置
Posted 汀洲杜若
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用C试一下稀疏矩阵的快速转置相关的知识,希望对你有一定的参考价值。
稀疏矩阵使用三元组<行,列,数值>表示。简单起见下面代码使用固定长度的数组。
struct val3 int x, y, e; ; struct mat3 int row, col, count; val3 tab[MAXCOUNT]; ; /*x是列,y是行,从零开始计数,row是矩阵有几行,col是有几列,count是矩阵中非零元的个数*/
先随机生成一个稀疏矩阵:
void init_mat31(mat3 *a) srand(time(NULL)); a->row = rand() % (MAXROW - MINROW + 1) + MINROW; a->col = rand() % (MAXCOL - MINCOL + 1) + MINCOL; a->count = a->row * a->col * FACTOR; //FACTOR暂取0.05 if(a->count < MINCOUNT) a->count = MINCOUNT; else if(a->count > MAXCOUNT) a->count = MAXCOUNT; for(int saved[MAXCOUNT+1],i,x,y, nsave=0,k=0; /*为矩阵生成数据*/ k < a->count; nsave++, k++) again: x = rand() % a->col, y = rand() % a->row; //生成行列位置 saved[nsave] = (x << 16) | y; //行列不超过2^16 for(i = 0; i < nsave; i++) if(saved[i] == saved[nsave]) goto again; //如果位置重复那么重新生成 a->tab[k].x = x, a->tab[k].y = y; a->tab[k].e = rand() % (a->row * a->col);
让三元组以升序排序,排序使用Key<行,列>。
int sort_mat3(mat3 *a) val3 *tab; int k, i, key, minpos, min; if(!(tab = (val3*)malloc(a->count*sizeof(val3))) return -1; memcpy(tab, a->tab, a->count * sizeof(val3));//一个副本 k = 0; //使用选择排序,每次从tab选Key最小的三元组放入a->tab again: // 找第一个没被选择过(*.x<0)的三元组 for(minpos = 0; minpos < a->count && tab[minpos].x < 0; minpos++); if(minpos == a->count) goto done;//找不到,结束排序 min = (tab[minpos].y << 16) | tab[minpos].x; for(i = minpos + 1; i < a->count; i++) if(tab[i].x == -1) // skip invalid items continue; key = (tab[i].y << 16) | tab[i].x; //使用(y<<16)|x做Key if(key < min) min = key, minpos = i; a->tab[k++] = tab[minpos]; tab[minpos].x = -1; // 标记使其不再被选择 goto again; done: free(tab); return 0;
接着做快速转置。下面代码中的w表是关键。
int transpose(mat3 *a) val3* tab; int i, w[MAXCOL], pos; tab = (val3*) malloc(a->count * sizeof(val3)); if(!tab) return -1;/*转置后的三元组先放在tab再复制到a->tab*/ memset(w, 0, sizeof(int) * a->col); for(i = 0; i < a->count; i++) w[a->tab[i].x]++; //先统计各列非零元的个数存到 w for(pos=0, i=0; i < a->col; i++) int nextpos = pos + w[i]; w[i] = pos; //再计算转置后各列第一个非零元在a->tab的位置 pos = nextpos; for(i = 0; i < a->count; i++) /*根据w表执行转置*/ int icol = a->tab[i].x; pos = w[icol]; tab[pos].x = a->tab[i].y; tab[pos].y = a->tab[i].x; tab[pos].e = a->tab[i].e; w[icol]++; memcpy(a->tab, tab, a->count * sizeof(val3)); i = a->row, a->row = a->col, a->col = i; free(tab); return 0;
好的,做个测试。
还行。本来想整一个指针列表用地址排序,但是C的写法太不友好了,所以改用结构体struct val3的写法而不再用int tab[MAXCOUNT][3]的写法了(这样我就得写一个列表int (*ptr[MAXCOUNT])[3],其元素是指针,这指针指向一个数组,这数组有三个整数,吐了)。
稀疏矩阵的列序递增法和一次定位快速转置法
稀疏矩阵:矩阵中大多数元素为0的矩阵,从直观上讲,当非零元素个数低于总元素的30%时,这样的矩阵为稀疏矩阵。
如:
int array [6][5] = {{1, 0, 3, 0, 5},
{0, 0, 0, 0, 0},
{0, 0, 0, 0, 0},
{1, 0, 3, 0, 5},
{0, 0, 0, 0, 0},
{0, 0, 0, 0, 0}};
稀疏矩阵的压缩存储:使用{row,col,value}三元组存储每一个有效数据,三元组按原矩阵中的位置,以行优先级先后顺序依次存放。
矩阵的转置:将原矩阵的行、列对换,也就是将[i][j]和[j][i]位置上的数据对换。
稀疏矩阵的列序递增法:
按照被转置矩阵三元组表A的序列(即转置后三元组表B的行序)递增的顺序进行转置,则转置后矩阵的三元组表B恰好是以“行序为主序的”.
一次定位快速转置法:
在列转置中算法的时间浪费主要在双重循环中,要改善算法的性能,必须去掉双重循环,使得整个转置过程通过一次循环来完成。
为了使得被转置的三元组表A中元素一次定位到三元组表B中,需要计算一下以下数据:
1)RowCounts,三元组表A中每一列有效值的个数,即转置后矩阵三元组表B中每一行有效值的个数。
2)RowStart,三元组表B中每一行有效值的起始位置。
RowStart[i] = RowStart[i - 1] + RowCounts[i - 1];
代码实现:
#include <iostream>
using namespace std;
#include <vector>//动态数组
//三元组
template<class T>
struct Triple
{
size_t _row;
size_t _col;
T _value;
Triple(size_t row = 0, size_t col = 0, const T& value = T())
:_row(row)
, _col(col)
, _value(value)
{}
};
template<class T>
class SparseMatrix
{
public://invalid 非零值
SparseMatrix(T* a = NULL, size_t M = 0, size_t N = 0, const T& invalid = T())
:_rowSize(M)
, _colSize(N)
, _invalid(invalid)
{
for (size_t i = 0; i < M; ++i)
{
for (size_t j = 0; j < N; ++j)
{
if (a[i*N + j] != _invalid)//每行元素个数就是列的个数
{
Triple<T> t;
t._row = i;
t._col = j;
t._value = a[i*N + j];
_a.push_back(t);//在Vector类,插入一个元素
}
}
}
}
void Display()
{
size_t index = 0;
for (size_t i = 0; i < _rowSize; ++i)
{
for (size_t j = 0; j < _colSize; ++j)
{
if (index < _a.size()&& (_a[index]._row == i)&& (_a[index]._col == j))
{
cout << _a[index++]._value << " ";
}
else
{
cout << _invalid << " ";
}
}
cout << endl;
}
}
//矩阵列序递增转置算法,时间复杂度为O(有效数据的个数*原矩阵的列数)
SparseMatrix<T> Transport()
{
SparseMatrix<T> sm;
sm._colSize = _rowSize;
sm._rowSize = _colSize;
sm._invalid = _invalid;
for (size_t i = 0; i < _colSize; ++i)//列序递增
{
size_t index = 0;
while (index < _a.size())
{
if (_a[index]._col == i)
{
Triple<T> t;
t._row = _a[index]._col;
t._col = _a[index]._row;
t._value = _a[index]._value;
sm._a.push_back(t);
}
++index;
}
}
return sm;
}
//一次定位计数快速转置 时间复杂度为O(有效数据的个数+原矩阵的列数)
SparseMatrix<T> FastTransport()
{
SparseMatrix<T> sm;
sm._rowSize = _colSize;
sm._colSize = _rowSize;
sm._invalid = _invalid;
int* RowCounts = new int[_colSize];//计数
int* RowStart = new int[_colSize];//位置
memset(RowCounts, 0, sizeof(int)*_colSize);
memset(RowStart, 0, sizeof(int)*_colSize);
size_t index = 0;//index 非零元素
while (index < _a.size())
{
++RowCounts[_a[index]._col];
++index;
}
for (size_t i = 1; i < _colSize; ++i)
{
RowStart[i] = RowStart[i - 1] + RowCounts[i - 1];
}
index = 0;
sm._a.resize(_a.size());
while (index < sm._a.size())
{
Triple<T> t;
t._row = _a[index]._col;
t._col = _a[index]._row;
t._value = _a[index]._value;
sm._a[RowStart[_a[index]._col]] = t;
++RowStart[_a[index]._col];
++index;
}
delete[] RowCounts;
delete[] RowStart;
return sm;
}
protected:
vector<Triple<T>> _a;
size_t _rowSize;
size_t _colSize;
T _invalid;
};
void Test()
{
int array[5][4] =
{
{ 1, 0, 3, 0 },
{ 0, 0, 0, 0 },
{ 0, 0, 0, 0 },
{ 2, 0, 4, 5 },
{ 0, 0, 0, 0 },
};
SparseMatrix<int> sm1((int*)array, 5, 4, 0);
cout << "打印原矩阵:"<<endl;
sm1.Display();
cout << endl;
cout << "打印转置后的矩阵:" << endl;
SparseMatrix<int> sm2 = sm1.Transport();
/*SparseMatrix<int> sm2 = sm1.FastTransport();*/
sm2.Display();
}
int main()
{
Test();
system("pause");
return 0;
}
运行结果:
打印原矩阵:
1 0 3 0
0 0 0 0
0 0 0 0
2 0 4 5
0 0 0 0
打印转置后的矩阵:
1 0 0 2 0
0 0 0 0 0
3 0 0 4 0
0 0 0 5 0
请按任意键继续. . .
两种算法比较:
假设有效数据的个数为100,原矩阵的列数为100,矩阵列序递增转置算法,时间耗费为O(有效数据的个数*原矩阵的列数),即100*100=10000次;一次定位计数快速转置算法,时间复杂度为O(有效数据的个数+原矩阵的列数),即100+100=200次左右。显然一次定位计数快速转置算法的时间效率要高的多,在时间性能上优于列序递增转置法,但是在空间耗费上增加了两个辅助向量空间,即RowCounts和RowStart,由此可见,算法在时间上的节省是以更多的存储空间为代价的。
本文出自 “岩枭” 博客,请务必保留此出处http://yaoyaolx.blog.51cto.com/10732111/1775877
以上是关于用C试一下稀疏矩阵的快速转置的主要内容,如果未能解决你的问题,请参考以下文章