Parallel并行化编程

Posted shoufengwei

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Parallel并行化编程相关的知识,希望对你有一定的参考价值。

在很多场景中我们需要通过并行化的方式来提高程序运行的速度,比较典型的需求就是并行下载。前期遇到一个需求是要批量下载瓦片,每次大概下载上百万个瓦片,要想提高瓦片的下载速度,只能通过并行化的方式,下面把我解决此问题的思路和代码总结如下:

第一步确定线程个数(ThreadCount),这个要根据网络情况和硬件配置进行确定,可以做成一个配置项由用户自行确定。

第二步将任务分成ThreadCount个,此步需要注意处理任务数较少(小于线程个数)以及任务数除不尽ThreadCount的情况。处理方式为任务数较少时不进行任务细分,由一个线程处理;除不尽的情况解决方案是最后一个任务处理剩下所有的任务。具体代码如下:

 1             var list_thread = new List<List<Location>>();//细分的下载任务(均分)
 2 
 3             if (list.Count >= 1000)//如果比1000个还小不细分,一个线程执行
 4             {
 5                 var count = (int)(list.Count / threadCount);
 6                 for (int i = 0; i < threadCount; i++)
 7                 {
 8                     if (i == threadCount - 1)
 9                         list_thread.Add(list.Skip(i * count).Take(list.Count - count * (threadCount - 1)).ToList());//最后一个取剩下的所有
10                     else
11                         list_thread.Add(list.Skip(i * count).Take(count).ToList());
12                 }
13             }
14             else
15                 list_thread.Add(list);

其中list_thread是细分后的任务列表,list是原始任务。

第三步处理所有任务,并添加到线程列表,等待所有线程执行完毕,即为所有任务处理完毕,具体代码如下:

1             var list = ...;//获取所有任务
2             var list_thread = GetThreadCountList(loc_list);//获取细分的线程任务
3 
4             var listTask = new List<Task>();//存储所有线程任务
5             foreach (var item in list_thread)//几个细分任务就创建几个线程
6             {
7                 listTask.Add(Task.Factory.StartNew(() => DoWork(item)));//处理单个线程
8             }
9             Task.WaitAll(listTask.ToArray());//等待所有线程处理完毕!

以上就是使用Parallel进行并行化编程的方式,看似简单的代码,其实蕴藏了一个哲学问题(所有问题上升到一定程度都是哲学问题)——做事要细分:将一件复杂的事情尽量根据实际情况进行细分,完成一件一件小的任务,整个任务也就完成了。

另最近事情比较多,思绪有些混乱,忘见谅!

以上是关于Parallel并行化编程的主要内容,如果未能解决你的问题,请参考以下文章

如何在 python 中并行化以下代码片段?

C#并行编程--命令式数据并行(Parallel.Invoke)---与匿名函数一起理解(转载整理)

使用降雪包并行化 R 代码

在 pandas groupby 之后并行化应用

转:Linux网络IO并行化技术概览

Parallel