实验中涉及到的并行计算



《实验中涉及到的并行计算》由会员分享,可在线阅读,更多相关《实验中涉及到的并行计算(10页珍藏版)》请在装配图网上搜索。
1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,实验中涉及到的并行计算,李连盟 李佳骏,MJPEG解码程序子任务:,1.,FETCH:负责完成解码流程中的霍夫曼解码、反锯齿扫描及反量化。,2.COMPUTE:最为费时的计算任务反离散余弦变换(IDCT)。,3.DISPATCH:从不同的COMPUTE任务计算完毕的宏块,进行重新组织排列,最终生存图像帧并传送到帧缓存。,进行并行化!,在headers/mjpeg.h中用NB_IDCT定义了线程数,。,在source/main.c中用Posix pthread多线程编程进行并行化。,Posix pthread
2、简介:,1.,数据类型,pthread_t:线程句柄,pthread_attr_t:线程属性句柄,2.函数,int pthread_create(pthread_t*restrict_tidp,const pthread_attr_t*restrict_attr,void*(*start_rtn)(void*),void*restrict arg);,/创建线程。参数:1.线程标识符指针2.线程属性3.运行函数起始地址4.运行函数参数,int pthread_join(pthread_t thread,void*retval);,/以阻塞的方式等待thread指定的线程结束。参数:1.线程标识
3、符2.返回值,int pthread_attr_init(pthread_attr_t*attr);,/初始化线程对象的属性。,程序分析:,1.,标识符定义,pthread_t fetchThread,dispatchThread,idctThreadNB_IDCT;,pthread_attr_t fetchAttr,dispatchAttr;,2.数据分配,Channel*channel2*NB_IDCT+1;,Channel*fetch_channel1+NB_IDCT;,Channel*dispatch_channel1+NB_IDCT;,Channel*idct_channelNB_I
4、DCT2;,/Channel是实现通信的容器 可以连接两个以上的模块,fetch_channel0=channel0;,dispatch_channel0=channel0;,for(uint32_t i=0;i NB_IDCT;i+),fetch_channeli+1=channel2*i+1;,dispatch_channeli+1=channel2*i+2;,idct_channeli0=channel2*i+1;,idct_channeli1=channel2*i+2;,fetch_channeli+1=channel2*i+1;,dispatch_channeli+1=channel
5、2*i+2;,idct_channeli0=channel2*i+1;,idct_channeli1=channel2*i+2;,3.多线程,pthread_create(,for(uint32_t i=0;i NB_IDCT;i+),pthread_create(,#if 0 /预编译语句 0屏蔽某段语句 1恢复,pthread_attr_init(,fetchAttr.procid=0;,pthread_attr_init(,dispatchAttr.procid=3;,#endif,pthread_create(,pthread_join(dispatchThread,NULL);,几个
6、要点:,1.,Channel是实现通信的容器,可以连接两个以上的模块。在这个程序中,Channel用于放置几个不同子程序间数据交互的空间,其中定义的channel、,fetch_channel、dispatch_channel、idct_channel都是指针,指向他们所对应的那块实际的物理地址。,2.通过赋值,channel上的奇数块共享给了fetch和idct二维数组参数里的0号位(图中的红色块),channel上的偶数块共享给了dispatch和idct二维数组参数里的1号位(同种的蓝色块)。,3.整个并行的过程是这样的:主线程创建一个子线程fetchThread运行fetch处理程序,
7、参数是fetch_channel,即把fetch的处理结果分块后放到fetch_channel(红)上;创建N个子线程idctThread,并行运行idct计算程序,参数是,idct_channeli,即第i个子线程运行idct程序,从dict_channeli0(红)上取出fetch的某块运行结果,然后将自己处理后的结果放到dict_channeli1(蓝)上;创建子线程dispatchThread运行dispatch程序,参数为dispatch_channel,即从disptch_channel(蓝)上取出idct的结果,重新组合后,等待diptch运行结束后得出最后结果进行输出。,4.程
8、序中进行的初始数据分配与原始数据无关,而是分配fetch程序运行得到的结果。分多少块,每块多大是由数据大小和线程数来决定的。放在channel上的数据全部是与程序间的通信有关的,只有fetch的结果和idct的结果,原始数据进入fetch串行运行,与其他程序无关。在程序操作channel之前,channel是格式化了的。,性能分析:,多MIPS与运行时间的关系(MIPS数等于线程数),性能分析:,同数量MIPS下,线程数与运行时间的关系,性能分析说明:,1.,从第一张图表中线程数与核数相同,可以很明显看出,并行计算对于计算性能有很好的提升作用。核数达到三个以后,并行的效果达到了极限。线程数与核数相同保证了最好的并行效果,防止了线程数过多造成的伪并行。,2.单纯从并行计算的角度来看,第二张图更能体现并行计算的效果。在相同的核数条件下,开不同的线程数对计算性能的提升作用。图中没有展示各核数下1个线程的计算时间,串行进行基本上需要2个线程并行计算大约两倍的时间。,3.为了与我们之前的测试数据保存一致,我们没有对timer进行修改。图中的数据除以200就可以得到与其他组相当的测试数据。,Thanks,!,
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 踏春寻趣 乐享时光——春季旅游踏春出游活动
- 清明假期至安全不缺席风起正清明安全需守护
- 全国党员教育培训工作规划
- XX中小学公共卫生培训树立文明卫生意识养成良好卫生习惯
- 小学生常见传染病预防知识培训传染病的预防措施
- 3月18日全国爱肝日中西医结合逆转肝硬化
- 肝病健康宣教守护您的肝脏健康如何预防肝炎
- 垃圾分类小课堂教育绿色小卫士分类大行动
- 中小学班主任经验交流从胜任到优秀身为世范为人师表 立责于心履责于行
- 教师数字化转型理解与感悟教师数字化转型的策略与建议
- 团建小游戏团建破冰小游戏团队协作破冰游戏多人互动
- 教师使用deepseek使用攻略让备课效能提升
- 办公室会议纪要培训会议内容会议整理公文攥写
- 党员要注重培塑忠诚奋斗奉献的人格力量
- 橙色卡通风儿童春季趣味运动会