Loogn.OrmLite映射优化记录

Posted 2020-08-09

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Loogn.OrmLite映射优化记录相关的知识，希望对你有一定的参考价值。

大家对ORM效率的争议多半在映射性能方面。自己的ORMLite也是如此，经过前段时间的折腾，已经找不出一个简单的方法再提升一下这部分的方法了。在此把优化涉及的几点记录一下。

注：用于性能测试的CodeTimer为赵劼先生所写。

注：有两个优化方法为hubro先生所提供，下面会指出。

一、反射的优化

简单的说，反射给了我们动态发现类型信息的能力，Type对象是开启反射之路的入口点。从Type对象那里，我们可以得到该类型的PropertyInfo、MethodInfo、ConstructorInfo等等。在ORM映射中，一般都会用到PropertyInfo。我们可以在PropertyInfo上访问（设置和获取统称为访问）对象的这个属性，但由于是动态发现信息再动态调用，所以性能和直接调用差了很多。我们用一个Person类测试一下：

    public class Person
    {
        public int ID { get; set; }
        public string Name { get; set; }
    }

测试代码：

        public static void Test()
        {
            Person person = new Person();
            var type = person.GetType();
            //先取出来PropertyInfo对象，相当于缓存
            var idPropertyInfo = type.GetProperty("ID");
            var namePropertyInfo = type.GetProperty("Name");

            CodeTimer.Initialize();

            var iteration = 1000000;//一百万次
            CodeTimer.Time("直接访问", iteration, () =>
            {
                person.ID = 23;
                person.Name = "loogn";
            });

            CodeTimer.Time("PropertyInfo访问", iteration, () =>
            {
                idPropertyInfo.SetValue(person, 23);
                namePropertyInfo.SetValue(person, "loogn");
            });
        }

测试结果：

直接访问
        Time Elapsed:   12ms
        CPU Cycles:     31,415,669
        Gen 0:          0
        Gen 1:          0
        Gen 2:          0

PropertyInfo访问
        Time Elapsed:   683ms
        CPU Cycles:     1,698,787,436
        Gen 0:          48
        Gen 1:          0
        Gen 2:          0

请按任意键继续. . .

上面循环了一百万次，尽管对PropertyInfo对象缓存了，调用效率差距还是很大的。后来在网上查询一番，测试一番，最后发现编译成强类型的委托调用起来是最好的（包括用IL生成同等的代码）。

测试代码：

            Person person = new Person();
            var type = person.GetType();
            //先得出来PropertyInfo对象，相当于缓存
            var idPropertyInfo = type.GetProperty("ID");
            var namePropertyInfo = type.GetProperty("Name");
            //这两个委托也是缓存起来的
            var idSetter = (Action<Person, int>)Delegate.CreateDelegate(typeof(Action<Person, int>), null, idPropertyInfo.GetSetMethod(true));
            var nameSetter = (Action<Person, string>)Delegate.CreateDelegate(typeof(Action<Person, string>), null, namePropertyInfo.GetSetMethod(true));

            CodeTimer.Initialize();

            var iteration = 1000000;//一百万次
            CodeTimer.Time("直接访问", iteration, () =>
            {
                person.ID = 23;
                person.Name = "loogn";
            });

            CodeTimer.Time("强类型委托访问", iteration, () =>
            {
                idSetter(person, 23);
                nameSetter(person, "loogn");
            });

测试结果：

直接访问
        Time Elapsed:   11ms
        CPU Cycles:     28,167,714
        Gen 0:          0
        Gen 1:          0
        Gen 2:          0

强类型委托访问
        Time Elapsed:   18ms
        CPU Cycles:     45,133,481
        Gen 0:          0
        Gen 1:          0
        Gen 2:          0

请按任意键继续. . .

小伙伴儿是不是惊呆了！反正当时我是惊呆啦，效率直逼硬编码了。我是一个很乐观的人，看到这样的测试结果，就幸哉幸哉地以为优化之路到此结束！可是经过测试，和Dapper还差那么一点点，于是就闷闷不乐了.....，于是这篇文章还有下面的部分。

二、分支语句与多态

以前从来没有感觉ifelse会有什么效率问题，但是当分支很多的时候，用多态是一种效率更高而且更容易维护的方案。由于上面用了强类型的委托，赋值的时候就用判断字段的类型了。从数据库的类型对应到C#里，大概有十几种，加上可空类型，分支判断就会很多。这里提一下：判断一个对象的类型的时候尽量用is (比如 obj is int)，经过测试，这样比比较Type效率要高。为了让读者明白我具体所指，贴出下面潦草的代码：（由于分支很少，下面代码测试结果并不明显）

    public abstract class Parent
    {
        public abstract void Do(object o);
    }
    public class Sub1 : Parent
    {
        public override void Do(object o)
        {
            var s = (int)o;
        }
    }
    public class Sub2 : Parent
    {
        public override void Do(object o)
        {
            var s = (string)o;
        }
    }

    class Program
    {
        static void Main(string[] args)
        {
            CodeTimer.Initialize();
            var iteration = 5000000;

            Parent p1 = new Sub1();
            Parent p2 = new Sub2();

            CodeTimer.Time("Parse1", iteration, () =>
            {
                Parse1(p1, p2);
            });

            CodeTimer.Time("Parse2", iteration, () =>
            {
                Parse2();
            });
        }

        static void Parse1(Parent p1, Parent p2)
        {
            object o1 = 23;
            p1.Do(o1);
            object o2 = "123456";
            p2.Do(o2);
        }

        static void Parse2()
        {
            object o1 = 23;
            if (o1 is int)
            {
                var s = (int)o1;
            }
            else if (o1 is string)
            {
                var s = (string)o1;
            }

            object o2 = "123456";

            if (o2 is int)
            {
                var s = (int)o2;
            }
            else if (o2 is string)
            {
                var s = (string)o2;
            }
        }
    }

潦草的代码

经过这两部分的优化，效率基本和Dapper持平了，但是hubro先生执意不放：“为什么我们代码基本一样，怎么没你的效率高呢？”，于是有了接下来的两个优化。

三、实例化对象

Activator.CreateInstance给了我们一个很方便的实例化对象的方法。有Type参数和泛型参数的重载方法，如果我们可以用泛型，我们还可以加new()约束，用 T obj=new T()来实例化，但是经我测试，Activator.CreateInstance<T>()和 new T()的效率是一样的。为什么一样呢，用ILDASM查看一下IL代码，原来new T()生成的代码也是调用Activator.CreateInstance<T>()呀！！但是有一天hubro先生告诉了我一个更高效的方法：用表达式编译成强类型委托。

测试代码：

    class Program
    {
        static T NewT<T>() where T : new()
        {
            return new T();
        }
        static T CreateT<T>()
        {
            return Activator.CreateInstance<T>();
        }

        static void Main(string[] args)
        {
            CodeTimer.Initialize();
            var iteration = 5000000;
            var type = typeof(Person);
            var newFun = Expression.Lambda<Func<Person>>(Expression.New(type)).Compile();

            CodeTimer.Time("直接实例化", iteration, () =>
            {
                var p = new Person();
            });

            CodeTimer.Time("强类型委托", iteration, () =>
            {
                var p = newFun();
            });

            CodeTimer.Time("Activator非泛型", iteration, () =>
            {
                var p = Activator.CreateInstance(type);
            });

            CodeTimer.Time("Activator泛型", iteration, () =>
            {
                var p = CreateT<Person>();
            });
            
            CodeTimer.Time("new T()", iteration, () =>
            {
                var p = NewT<Person>();
            });
        }
    }

测试结果：

直接实例化
        Time Elapsed:   51ms
        CPU Cycles:     127,602,465
        Gen 0:          50
        Gen 1:          0
        Gen 2:          0

强类型委托
        Time Elapsed:   135ms
        CPU Cycles:     332,949,042
        Gen 0:          50
        Gen 1:          0
        Gen 2:          0

Activator非泛型
        Time Elapsed:   401ms
        CPU Cycles:     997,865,100
        Gen 0:          50
        Gen 1:          0
        Gen 2:          0

Activator泛型
        Time Elapsed:   496ms
        CPU Cycles:     1,238,255,824
        Gen 0:          50
        Gen 1:          0
        Gen 2:          0

new T()
        Time Elapsed:   484ms
        CPU Cycles:     1,207,260,662
        Gen 0:          50
        Gen 1:          0
        Gen 2:          0

请按任意键继续. . .

可以看出强类型委托实例化效率最接近直接实例化了，出乎意料的是非泛型的Activator.CreateInstance比泛型的还高一点，泛型版本和new T()前面说过了，是一样的。

四、类型转换

mysql数据库类型对应到C#类型的时候，发现有两个不太确定，bit不对应bool,tinyint不对应byte，所以需要自己处理一下。把一个对象转换成值类型用几种方法测试一下：

测试代码：

        static void Main(string[] args)
        {
            CodeTimer.Initialize();
            var iteration = 5000000;
            var type = typeof(Person);
            var newFun = Expression.Lambda<Func<Person>>(Expression.New(type)).Compile();

            object obj = 23;

            CodeTimer.Time("拆箱转换", iteration, () =>
            {
                var a = (int)obj;
            });

            CodeTimer.Time("Convert转换", iteration, () =>
            {
                var a = Convert.ToInt32(obj);
            });

            CodeTimer.Time("Parse转换", iteration, () =>
            {
                var a = int.Parse(obj.ToString());
            });
        }

测试结果：

拆箱转换
        Time Elapsed:   28ms
        CPU Cycles:     70,331,496
        Gen 0:          0
        Gen 1:          0
        Gen 2:          0

Convert转换
        Time Elapsed:   68ms
        CPU Cycles:     169,567,996
        Gen 0:          0
        Gen 1:          0
        Gen 2:          0

Parse转换
        Time Elapsed:   1,141ms
        CPU Cycles:     2,832,437,791
        Gen 0:          63
        Gen 1:          0
        Gen 2:          0

请按任意键继续. . .

所以在转换bool值的时候，可以这样

if (obj is bool)
{
    var b = (bool)obj;
}
else
{
    var b = Convert.ToInt32(obj) > 0;
}

经过这些优化，映射效率已经超过Dapper了。但是又有一天hubro先生给我截图，说他的Mapping已经超过我了，我一下子不淡定了，这怎么可能，我从来都是写一些简单的明显没有效率问题的代码，所以赶紧请教（就是下面要说的）！

五、DbDataReader的GetValue和GetValues

在从DataReader取值的时候，hubro发现用GetValues一下子取出来，比在循环中一个一个取要快，测试了一下果真如此：

        public static List<T> ReaderToObjectList<T>(DbDataReader reader)
        {
            if (!reader.HasRows)
            {
                return new List<T>();
            }
            var refInfo = ReflectionHelper.GetInfo<T>();
            List<T> list = new List<T>();
            var first = true;
            int length = reader.FieldCount;
            ReflectionInfo<T>.Accessor[] accessorArray = new ReflectionInfo<T>.Accessor[length];
            object[] values = new object[length];
            while (reader.Read())
            {
                reader.GetValues(values);
                T obj = refInfo.NewInstance();// Activator.CreateInstance<T>();
                if (first)
                {
                    for (int i = 0; i < length; i++)
                    {
                        var fieldName = reader.GetName(i);
                        var accessor = refInfo.GetAccessor(fieldName);
                        accessorArray[i] = accessor;

                        accessor.Set(obj, values[i]);
                    }
                    first = false;
                }
                else
                {
                    for (var i = 0; i < length; i++)
                    {
                        accessorArray[i].Set(obj, values[i]);
                    }
                }
                list.Add(obj);
            }
            return list;
        }

至此，我们的效率已经甩开Dapper了！

一个大写的完！

以上是关于Loogn.OrmLite映射优化记录的主要内容，如果未能解决你的问题，请参考以下文章