快速内存拷贝

Posted hbg200

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了快速内存拷贝相关的知识,希望对你有一定的参考价值。

    C语言自带memcpy已优化的很好了,通过拷贝一幅图像,测得耗时为1.8ms,经过很多其他方法代换,都无法达到如此速度,为了提速,经过摸索,终于找到更快一点的方法。经测得耗时为1.35ms。

内存拷贝程序

void MemCopy(void *pDst, void *pSrc, DWORD dwSize)//顺序拷贝
{
	_asm
	{
		    mov esi, pSrc;  //传递源指针
		    mov edi, pDst;  //传递目标指针
		    mov ebx, dwSize;//ebx 字节计数
		    shr ebx, 7;     //除 128 (8 * 128bit registers)
	  L1:
		    movdqu xmm0, 0[ESI]; //从内存移动数据到寄存器
		    movdqu xmm1, 16[ESI];
		    movdqu xmm2, 32[ESI];
		    movdqu xmm3, 48[ESI];
		    movdqu xmm4, 64[ESI];
		    movdqu xmm5, 80[ESI];
		    movdqu xmm6, 96[ESI];
		    movdqu xmm7, 112[ESI];

		    movntdq 0[EDI], xmm0; //从寄存器移动数据到内存
		    movntdq 16[EDI], xmm1;
		    movntdq 32[EDI], xmm2;
		    movntdq 48[EDI], xmm3;
		    movntdq 64[EDI], xmm4;
		    movntdq 80[EDI], xmm5;
		    movntdq 96[EDI], xmm6;
		    movntdq 112[EDI], xmm7;

		    add esi, 128;
		    add edi, 128;
		    dec ebx; //减1
		    jnz L1;  //不为0循环

	  	    mov ecx, dwSize;
		    and ecx, 127;
		    rep movsb; //余数循环
	}
}

用完了8个多媒体寄存器,每个寄存器每次传输16个字节,用到了内存拷贝极限。

在vs2017的C++调试通过。

以上是关于快速内存拷贝的主要内容,如果未能解决你的问题,请参考以下文章

c#代码片段快速构建代码

Android 逆向使用 DB Browser 查看并修改 SQLite 数据库 ( 从 Android 应用数据目录中拷贝数据库文件 | 使用 DB Browser 工具查看数据块文件 )(代码片段

Android 逆向使用 DB Browser 查看并修改 SQLite 数据库 ( 从 Android 应用数据目录中拷贝数据库文件 | 使用 DB Browser 工具查看数据块文件 )(代码片段

前端开发工具vscode如何快速生成代码片段

前端开发工具vscode如何快速生成代码片段

C 中的共享内存代码片段