使用 OPENMP 进行并行归并排序

Posted

技术标签:

【中文标题】使用 OPENMP 进行并行归并排序【英文标题】:Parallel merge sort using OPENMP 【发布时间】:2012-08-14 01:09:43 【问题描述】:

我写了一个如下的顺序归并排序程序:

#include "stdafx.h"
#include "iostream"
#include "omp.h"
#include "fstream"
using namespace std;

int a[50];
void merge(int,int,int); 
void merge_sort(int low,int high)

int mid,newval;
double clock, clock1,clock2;
if(low<high)
 
    mid=(low+high)/2;
    #pragma omp parallel shared(low,mid,high) num_threads(2)
    
        //newval=omp_get_thread_num();
        //cout<<"thread: "<<newval<<endl;
        merge_sort(low,mid);
        clock=omp_get_wtime();
        //cout<<"Clock: "<<clock<<endl;
        merge_sort(mid+1,high);
        merge(low,mid,high);
        clock1=omp_get_wtime();
        //cout<<"Clock1: "<<clock<<endl;
        clock2=clock1-clock;
        cout<<"Clock2: "<<clock2<<endl;
           
    //cout<<"valud=%d"<<low<<endl; 
 
 
 void merge(int low,int mid,int high)
 
 int h,i,j,b[50],k;
 h=low;
 i=low;
 j=mid+1;

 while((h<=mid)&&(j<=high))
 
    if(a[h]<=a[j])
    
        b[i]=a[h];
        h++;
    
    else
    
        b[i]=a[j];
        j++;
    
    i++;
 
 if(h>mid)
 
    for(k=j;k<=high;k++)
    
        b[i]=a[k];
        i++;
    
 
 else
 
    for(k=h;k<=mid;k++)
    
        b[i]=a[k];
        i++;
    
 
 for(k=low;k<=high;k++) a[k]=b[k];
    

    void main()
    
int num,i;
int clock_n,len;
FILE *fp;
char *buf;
char *newchat;//ifstream properfile;


cout<<"********************************************************************************"<<endl;
cout<<"                             MERGE SORT PROGRAM"<<endl;

cout<<"********************************************************************************"<<endl;
cout<<endl<<endl;
cout<<"Please Enter THE NUMBER OF ELEMENTS you want to sort [THEN PRESS ENTER]:"<<endl;
cout<<endl;
//cout<<"Now, Please Enter the ( "<< num <<" ) numbers (ELEMENTS) [THEN PRESS ENTER]:"<<endl;
//for(i=1;i<=num;i++)
//
        fp=fopen("E:\\Study\\Semester 2\\Compsci 711- Parallel and distributed computing\\Assignment\\sample_10.txt","rb");
fseek(fp,0,SEEK_END); //go to end
len=ftell(fp); //get position at end (length)
cout<<"Length is %d"<<len<<endl;
//fseek(fp,0,SEEK_SET); //go to beg.
buf=(char *)malloc(len); //malloc buffer
newchat=buf;
fread(newchat,len,1,fp); //read into buffer
fclose(fp);
//cout<<"Read %c"<<newchat<<endl;

////cin>>num;


//

    merge_sort(1,len);

cout<<endl;
cout<<"So, the sorted list (using MERGE SORT) will be :"<<endl;
cout<<endl<<endl;

for(i=1;i<=num;i++)
cout<<a[i]<<"   ";
cout<<endl<<endl<<endl<<endl;

  

现在我想并行化这段代码(C 中用于并行化的 API 是 OPENMP)。你能帮帮我吗?基本上我使用#pragma parallel num_thread(4),但我不知道是否应该包含其他任何内容以进行并行化。

【问题讨论】:

您使用此代码获得了什么加速?我的意思是并行与无语用?? 还将您的算法与 std::sort 的 gnu 并行实现进行比较... 【参考方案1】:

归并排序算法的主要瓶颈是归并函数。它的复杂度是 O(n)。 前几次合并操作的成本将主导整个应用程序的成本。对更大的数组使用优化的并行算法。

对于较小的数组(

你不应该使用部分而不是#pragma omp parallel shared(low,mid,high) num_threads(2)

【讨论】:

由于元素数量超过 100,我使用并行算法。我应该使用部分吗?由于我是 Openmp 的新手,我发现它很混乱。因为在 java 中我们可以使用 .start(), sleep() 内置函数,但在这里我什至不确定线程​​是否正在运行。 我主要怀疑我上面写的程序对于并行合并排序在逻辑上是否正确。 看,我真的可以在逻辑层面上说话。是否正确必须自己检查,对吗?? Section 是 openMP 中的一个原语,它为块中的所有部分分叉两个线程。部分的优点是您不必担心活动线程的数量和线程调度。 OpenMP 为您处理所有这些。 好的!我吓坏了,因为我是 OpenMP 的新手。有没有办法给我一些例子,说明我应该如何在 OpenMP 中使用这些部分?谢谢。 @linello:我应该如何比较它?【参考方案2】:

如果在 128 个整数 32 位下排序(这将非常适合 cpu 缓存),您应该进行二进制插入排序通常是最好的。

如果对较大的数字进行排序,以下论文将介绍如何进行并行归并排序。

http://www1.chapman.edu/~radenski/research/papers/mergesort-pdpta11.pdf

本文涵盖了 OMP 和 MPI 上的并行拆分,它没有解释的是如何并行进行合并

http://www.cc.gatech.edu/~ogreen3/_docs/Merge_Path_-_Parallel_Merging_Made_Simple.pdf

本文解释了如何在并行中进行合并。尽管它的名字起初让我很困惑,但归根结底,当对两个已经排序的列表进行排序时,等级排序(正常的合并方法)要么下降(向上数组 A)或交叉(向上数组 B)在所谓的合并路径中合并矩阵。如果使用多个处理器,您可以通过使用对角线和二分搜索找到合并路径,将区域拆分并在任何点进行排名排序。

【讨论】:

以上是关于使用 OPENMP 进行并行归并排序的主要内容,如果未能解决你的问题,请参考以下文章

归并排序和快速排序

ForkJoinPool线程池工作原理

排序算法——归并排序

[算法]——归并排序(Merge Sort)

排序算法归并排序

算法 | 归并排序