类型基础及背后的工作原理 数据在内存中的分配与传递 值类型和引用类型它们在内存分配与传递上的区别
内存分配
首先要了解一下内存中栈和堆的概念。
栈(Stack)
##栈是一种先进后出的内存结构。
方法的调用追踪就是在栈上完成的。比如我们有一个main方法(程序入口), 在main方法中会调用一个GetPoint的方法。在线程执行时,会将main方法压入栈底(包括编译好的方法指令,参数,和方法内部变量),然后再将GetPoint的方法压入栈底,GetPoint中没有调用其它方法,压栈完毕。出栈顺序是先进后出,也就是后进先出,栈顶的方法GetPoint先执行完毕,然后出栈,所占内存清空,接着main方法执行后出栈,所占内存清空。
//示意图:自己脑补吧...
从上面方法的压栈出栈中可以看出:
##栈只能在一端对数据进行操作,也就是栈顶端进行操作。’
##栈也是一种内存自我管理的结构,压栈自动分配内存,出栈自动清空所占内存。
另外值得注意的两点:
##栈中的内存不能动态请求,只能为大小确定的数据分配内存,灵活性不高,但是栈的执行效率很高。
##栈的可用空间并不大,所以我们在操作分配到栈上的数据时要注意数据的大小带来的影响。
堆(Heap)
##堆与栈有所区别,堆在C#中用于存储实实例对象,能存储大量数据,而且堆能够动态分配存储空间。
##相比栈只能在一端操作,堆中的数据可以随意存取。
##但堆的结构使得堆的执行效率不如栈高,而且不能自动回收使用过的对象。对于堆中的内存回收,C++程序员需要进行手动回收,这也是C++编程值得注意的一点,否则很容易造成内存溢出。而对于.NET程序员,平台提供了垃圾回收(GC)机制,可以自动回收堆中过期的对象(实现原理大概就是当发现没有“引用”指向此对象时,表明此对象可以回收,此文主要讨论值类型和引用类型,对于GC,感兴趣的可以搜索相关资料)。
值类型和引用类型在栈和堆中的分配
这儿有两个原则:
1.创建引用类型时,runtime会为其分配两个空间,一块空间分配在堆上,存储引用类型本身的数据,另一个块空间分配在栈上,存储对堆上数据的引用,实际上存储的堆上的内存地址,也就是指针。
2.创建值类型时, runtime会为其分配一个空间,这个空间分配在变量创建的地方,如:
##如果值类型是在方法内部创建,则跟随方法入栈,分配到栈上存储。
##如果值类型是引用类型的成员变量,则跟随引用类型,存储在堆上。(对象的成员变量)
在此我们举例说明。
定义一个Point类:
public class Point { public double PointX { get; set; } public double PointY { get; set; } }
StartProgram类,有方法Start()和InitialPoint():
class StartProgram { void Start() { double pointX = 100.1; InitialPoint(pointX); } void InitialPoint(double pointX) { var point = new Point(); point.PointX = pointX; } }
示例分析:假设主线程从Start()进入执行,我们从分析一下方法中的变量在内存中的大致分配情况,不深究细节。
首先将Start()方法指令压入栈底,然后压入局部变量pointX;紧接着将InitialPoint()方法压入栈底,形参pointX压入栈底,在堆上实例化Point对象(包括其成员变量PointX和PointY),并在栈上创建point变量指向堆上的Point对象,最后给成员变量PointX赋值,参考图如下:
注:注意不要混淆code中的pointx,虽然变量名相同,但是它们是不同的变量。
数据传递
按值传递原则
在C#中数据传递默认按值传递,先看一个示例。
现在有一个结构体PointSturct, 一个类PointClass:
public struct PointStruct { public double PointX { get; set; } public double PointY { get; set; } }
public class PointClass { public double PointX { get; set; } public double PointY { get; set; } }
并在一个方法中执行执行以下代码:
1 void Excute() 2 { 3 var pointStruct1 = new PointStruct(); 4 var pointClass1 = new PointClass(); 5 var pointStruct2 = pointStruct1; 6 var pointClass2 = pointClass1; 7 }
示例分析:第3,4行代码分别创建了一个结构体pointStruct1和一个类实例pointClass1, 结合上面的内存分配规则,对于pointSturct1,会在栈上分配内存存储其数据本身,对于pointClass1,会在堆上分配内存存储实例,且在栈上存储指向堆上实例的指针,参考图如下:
经过执行5,6行代码后,内存分配应该是怎样的呢? 对于值类型(pointStruct1),会在栈上开辟一块新的空间,将数据完全复制过去,因此pointStruct2和pointStruct1是互相独立的,对其中一个的修改不会影响到另一个;对于引用类型(pointClass1),也会在栈上开辟一个新的空间,将栈上的数据(指向堆上实例的指针)复制到新的空间, 但是注意,此处复制的是指针,也就是说栈上的两个变量pointClass1和pointClass2虽然是不同的空间,但是它们的存储内容---指针(内存地址), 都是指向堆上的同一实例,所以当通过pointClass2对实例的数据进行修改以后,通过pointClass1再访问实例的数据,将会是修改过的数据,反之亦然,参考图如下:
参数传递
当程序中进行参数传递的时候,也是默认按值传递,值类型复制数据本身,形成独立的数据块,引用类型复制引用,指向同一实例。简单一点就是传递时复制栈上的数据到新的栈上空间。
我们将之前的StartProgram类中的方法改成如下 :
class StartProgram { void Start() { double pointX1 = 100.1; var point1 = new Point(); point1.PointX = 200.1; InitialPoint(pointX1, point1);//值类型复制数据本身 对象传递 复制引用,指向同一实例 Console.WriteLine(string.Format("pointX1:{0}", pointX1)); Console.WriteLine(string.Format("point1.PointX:{0}", point1.PointX)); Console.ReadKey(); } void InitialPoint(double pointX2, Point point2) { pointX2 = 300.1; point2.PointX = pointX2; } } /*Output:pointX1:100.1 point1.PointX:300.1
*/
示例分析:从输出结果可以看到,pointX1还是原来的值,没有受到pointX2影响,而point1.PointX的值是point2对PointX更改后的值。在内存中,将值类型pointX1传递给pointX2后,在栈上形成两个独立的内存块,因此对pointX2更改后,并不会影响到pointX1;而对于引用类型point1,传递给point2后,它们两块内存存储的指针指向同一实例,因此再InitialPoint()方法内对point2.PointX赋值为300.1后,再Start()方法里面取point1取PointX的值,也是300.1。
既然point1和point2指向同一实例,那么如果我们在InitialPoint()方法的最后将point2设置为null,会不会影响到Start()方法里的point1呢?用point.PointX取值的时候,会不会得到实例为null的异常呢?
void InitialPoint(double pointX2, Point point2) { pointX2 = 300.1; point2.PointX = pointX2; point2 = null;//
//将point2设置为null,并不是将堆上的实例变为null,而是设置栈上的point2这块存储指针的内存为null
//栈上point1和point2虽然指向同一实例,但是它们是两块不同的内存,所以将point2设置为null后,point1仍然指向堆上的实例
} /*Output:pointX1:100.1 point1.PointX:300.1 */
示例分析:还是会得到之前的结果,没有检测到null异常。这不难想象,因为我们将point2设置为null,并不是将堆上的实例变为null,而是设置栈上的point2这块存储指针的内存为null,而栈上point1和point2虽然指向同一实例,但是它们是两块不同的内存,所以将point2设置为null后,point1仍然指向堆上的实例,并且point2设置为null是在对堆上的实例进行更新以后,因此point1.PointX的到的值是更新后的值,参考图如下:
按引用传递(Ref和Out关键字)
注:Ref和Out的区别在于Ref在传递前需要初始化。
我们知道C#中的Ref和Out关键字可以在值类型的传参上实现跟引用类型一样的效果,那么在引用类型参数上加入ref和out关键字跟默认的引用类型传参有什么区别呢?很多人觉得应该没有什么用,其实不然,我们继续将StartProgram类的方法改为按ref传递,看看会有什么不同。
class StartProgram {void Start() { double pointX1 = 100.1; var point1 = new Point(); point1.PointX = 200.1; InitialPoint(ref pointX1, ref point1); Console.WriteLine(string.Format("pointX1:{0}", pointX1)); if (point1 != null) Console.WriteLine(string.Format("point1.PointX:{0}", point1.PointX)); else Console.WriteLine(string.Format("point1 is null")); Console.ReadKey(); } void InitialPoint(ref double pointX2, ref Point point2) { pointX2 = 300.1; point2.PointX = pointX2; point2 = null; } /*Output:
pointX1:300.1 point1 is null */
}
示例分析:从运行结果可以看到,对于值类型, pointX2对值的更改影响到了pointX1;对于引用类型,将point2设置为null后,point1也变成了null,之前我们没有加ref参数的时候,point2设置为null,并不会影响到point1本身。我们可以看到,通过加入ref和out参数后,在内存中并不是像值传递一样将栈上的数据拷贝一份到新的空间。在这里,我并没有去研究C#对ref和out参数在内存上的实现原理,但是可以想到,要实现这种效果并不难,在按引用传递时我们将栈上的变量的地址(如存储pointX1,point1的内存地址)copy到新的栈内存空间中,这样就可以将新的变量和旧的变量关联起来,达到互相影响的效果。
Summary
本文从内存中栈和堆的结构特点出发,分析了C#值类型和引用类型在栈和堆上的分配情况,接着分析了数据传递过程,包括按值传递(赋值,参数传递),按引用传递(ref,out关键字),仅供参考。