lnux内核的malloc实现(Oracle的cache buffer影子)

Posted zengkefu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了lnux内核的malloc实现(Oracle的cache buffer影子)相关的知识,希望对你有一定的参考价值。

lnux内核的malloc实现(Oracle的cache buffer影子)

本文原创为freas_1990,转载请标明出处:http://blog.csdn.net/freas_1990/article/details/12845059

 


本文介绍一下malloc的原理,对mm感兴趣(或者对Oracle internal实现感兴趣)的同学能在本文找到感兴趣的内容。

malloc主要由两个结构体做支撑。

struct bucket_desc { /* 16 bytes */
 void   *page;
 struct bucket_desc *next;
 void   *freeptr;
 unsigned short  refcnt;
 unsigned short  bucket_size;
};

这个结构体是一个bucket descriptor。所有的object会通过链表链接起来。 

struct _bucket_dir {	/* 8 bytes */
	int			size;
	struct bucket_desc	*chain;
};

这是bucket的目录。

我画了两个图来描述一个page(页面;4k)如何被这两个结构体描述。

技术分享

 

 

一个4k的页面被分配到若刚个16 bytes大小的bucket中

技术分享

 

 

一个4k的页面被分配到若刚个32 bytes大小的bucket中

那么,这些数据结构是如何被初始化的呢?

首先,在内核代码里,硬编码了如下数据。

struct _bucket_dir bucket_dir[] = {
	{ 16,	(struct bucket_desc *) 0},
	{ 32,	(struct bucket_desc *) 0},
	{ 64,	(struct bucket_desc *) 0},
	{ 128,	(struct bucket_desc *) 0},
	{ 256,	(struct bucket_desc *) 0},
	{ 512,	(struct bucket_desc *) 0},
	{ 1024,	(struct bucket_desc *) 0},
	{ 2048, (struct bucket_desc *) 0},
	{ 4096, (struct bucket_desc *) 0},
	{ 0,    (struct bucket_desc *) 0}};   /* End of list marker */

定义了粒度从16起的次方增长。

我写了简化的伪代码来描述整个流程。

malloc的伪代码

	procedure:
		get the bucket_desc with object size(for example 16 bytes)
		if(search bucket_desc list for free space){
			return  bdesc->freeptr
		} else {
			if(init_bucket_desc){
				return  bdesc->freeptr
			} else {
				panic("init_bucket_desc error")
			}
		}
		init_bucket_desc:
			if(page = get_one_page){
				sepreated the page(4k) with dir->size
				link all the pieces
			} else {
				panic("get page error")
			}
	end procedure


free的伪代码

procedure:
		get the bucket_desc with object size(for example 16 bytes)
		if(search bucket_desc list for the related bucket_desc){
			erase bdesc->freeptr
			bdesc->refcnt--
			if(bdesc->refcnt == 0){
				if(whole page NULL){
					if(!free_page(bdesc->page)){
						panic("free_page error")
					}
				}
			}
		} else {
			panic("input pointer not right")
		}
end procedure


关于数据结构性能的思考:

       这里的主要数据结构就是单向链表,查找的时间复杂为O(N),属于暴力查找。

       用了10个元素的数组做分拆,当内存使用过大的时候,这个数据结构就不能承载了。

       或许采用一个hash或者树形结构能解决问题。

       不过,对于20年前的内存来说,完全能应付了:)
 

以上是关于lnux内核的malloc实现(Oracle的cache buffer影子)的主要内容,如果未能解决你的问题,请参考以下文章

内核申请内存的方法

为啥 malloc 不能在 FreeBSD-x64 内核空间分配大内存?

Linux 内核 内存管理内存管理架构 ④ ( 内存分配系统调用过程 | 用户层 malloc free | 系统调用层 brk mmap | 内核层 kmalloc | 内存管理流程 )

内存管理概述内存分配与释放地址映射机制(mm_struct, vm_area_struct)malloc/free 的实现

DPDK — MALLOC(librte_malloc,Memory Manager,内存管理组件)

DPDK — MALLOC(librte_malloc,Memory Manager,内存管理组件)