具有任意数量参数的函数的 C# 记忆[关闭]

Posted

技术标签:

【中文标题】具有任意数量参数的函数的 C# 记忆[关闭]【英文标题】:C# Memoization of functions with arbitrary number of arguments [closed] 【发布时间】:2011-02-20 14:00:29 【问题描述】:

我正在尝试为具有任意数量参数的函数创建一个记忆接口,但是我失败得很惨我觉得我的解决方案不是很灵活。我试图为一个函数定义一个接口,该接口在执行时会自动记忆,每个函数都必须实现这个接口。这是一个带有两个参数的指数移动平均函数的示例:

class EMAFunction:IFunction

    Dictionary<List<object>, List<object>> map;

    class EMAComparer : IEqualityComparer<List<object>>
    
        private int _multiplier = 97;

        public bool Equals(List<object> a, List<object> b)
        
            List<object> aVals = (List<object>)a[0];
            int aPeriod = (int)a[1];

            List<object> bVals = (List<object>)b[0];
            int bPeriod = (int)b[1];

            return (aVals.Count == bVals.Count) && (aPeriod == bPeriod);
        

        public int GetHashCode(List<object> obj)
        
            // Don't compute hash code on null object.
            if (obj == null)
            
                return 0;
            

            List<object> vals = (List<object>) obj[0];
            int period = (int) obj[1];

            return (_multiplier * period.GetHashCode()) + vals.Count;

        
    

    public EMAFunction()
    
        NumParams = 2;
        Name = "EMA";
        map = new Dictionary<List<object>, List<object>>(new EMAComparer());
    
    #region IFunction Members

    public int NumParams
    
        get;
        set;
    

    public string Name
    
        get;
        set;
    

    public object Execute(List<object> parameters)
    
        if (parameters.Count != NumParams)
            throw new ArgumentException("The num params doesn't match!");

        if (!map.ContainsKey(parameters))
        
            //map.Add(parameters,
            List<double> values = new List<double>();
            List<object> asObj = (List<object>)parameters[0];
            foreach (object val in asObj)
            
                values.Add((double)val);
            
            int period = (int)parameters[1];

            asObj.Clear();
            List<double> ema = TechFunctions.ExponentialMovingAverage(values, period);
            foreach (double val in ema)
            
                asObj.Add(val);
            
            map.Add(parameters, asObj);
        
        return map[parameters];
    

    public void ClearMap()
    
        map.Clear();
    

    #endregion

这是我对该函数的测试:

private void MemoizeTest()

    DataSet dataSet = DataLoader.LoadData(DataLoader.DataSource.FROM_WEB, 1024);
    List<String> labels = dataSet.DataLabels;

    Stopwatch sw = new Stopwatch();
    IFunction emaFunc = new EMAFunction();
    List<object> parameters = new List<object>();
    int numRuns = 1000;
    long sumTicks = 0;
    parameters.Add(dataSet.GetValues("open"));
    parameters.Add(12);

    // First call

    for(int i = 0; i < numRuns; ++i)
    
        emaFunc.ClearMap();// remove any memoization mappings
        sw.Start();
        emaFunc.Execute(parameters);
        sw.Stop();
        sumTicks += sw.ElapsedTicks;
        sw.Reset();
    
    Console.WriteLine("Average ticks not-memoized " + (sumTicks/numRuns));


    sumTicks = 0;
    // Repeat call
    for (int i = 0; i < numRuns; ++i)
    
        sw.Start();
        emaFunc.Execute(parameters);
        sw.Stop();
        sumTicks += sw.ElapsedTicks;
        sw.Reset();
    
    Console.WriteLine("Average ticks memoized " + (sumTicks/numRuns));

更新: 感谢您指出我的 n00bish 错误...我总是忘记在秒表上调用 Reset!

我也见过another approach to memoization...它不提供n-argument memoization,但是我使用Interface 的方法并没有多大优势,因为我必须为每个函数编写一个类。有没有一种合理的方法可以将这些想法合并成更强大的东西? 我想让记忆函数更容易,而不是让用户为他们打算使用的每个函数编写一个类。

【问题讨论】:

【参考方案1】:

StopWatch.Stop 不会重置秒表,因此您会在每次启动/停止时累积时间。

例如

  Stopwatch sw = new Stopwatch();

  sw.Start();
  System.Threading.Thread.Sleep(100);
  sw.Stop();
  Debug.WriteLine(sw.ElapsedTicks);

  sw.Start();
  System.Threading.Thread.Sleep(100);
  sw.Stop();
  Debug.WriteLine(sw.ElapsedTicks);

给出以下结果

228221
454626

您可以每次使用StopWatch.Restart(Framework 4.0)重新启动秒表,如果不是Framework 4.0,您可以使用StopWatch.Reset重新设置秒表。

【讨论】:

【参考方案2】:

首先,您需要在两次测试之间调用sw.Reset()。否则,第二次测试的结果将与第一次测试的时间相差

其次,您可能不应该在比较器上的GetHashCode() 覆盖中使用vals.GetHashCode(),因为这将导致您为对象获取不同的哈希码,而这些代码将评估为true 用于您的Equals 覆盖。现在,我会担心确保等效对象总是获得相同的哈希码,而不是试图获得代码的均匀分布。如果哈希码不匹配,Equals 将永远不会被调用,因此您最终会多次处理相同的参数。

【讨论】:

好的,我修复了 GetHashCode 函数并调用了 Reset... 现在看起来好多了。我还看到了另一种完成记忆的好方法,关于如何概括它的任何建议:***.com/questions/633508/two-argument-memoization【参考方案3】:

这个怎么样?先写一个单参数memoizer:

static Func<A, R> Memoize<A, R>(this Func<A, R> f)

    var d = new Dictionary<A, R>();
    return a=> 
    
        R r;
        if (!d.TryGetValue(a, out r))
        
            r = f(a);
            d.Add(a, r);
        
        return r;
    ;
  

直截了当。现在写一个函数元组:

static Func<Tuple<A, B>, R> Tuplify<A, B, R>(this Func<A, B, R> f)

    return t => f(t.Item1, t.Item2);

还有一个去元组:

static Func<A, B, R> Detuplify<A, B, R>(this Func<Tuple<A, B>, R> f)

    return (a, b) => f(Tuple.Create(a, b));

现在两个参数的记忆器很容易:

static Func<A, B, R> Memoize<A, B, R>(this Func<A, B, R> f)

    return f.Tuplify().Memoize().Detuplify();

要编写一个三参数 memoizer,只需遵循以下模式:制作一个 3-tuplifier、一个 3-untuplifier 和一个 3-memoizer。

当然,如果你不需要它们,也没有必要将元组设为标称方法:

static Func<A, B, R> Memoize<A, B, R>(this Func<A, B, R> f)

    Func<Tuple<A, B>, R> tuplified = t => f(t.Item1, t.Item2);
    Func<Tuple<A, B>, R> memoized = tuplified.Memoize();
    return (a, b) => memoized(Tuple.Create(a, b));

更新:如果没有元组类型,您会问该怎么做。你可以自己写;这并不难。或者你可以使用匿名类型:

static Func<T, R> CastByExample<T, R>(Func<T, R> f, T t)  return f; 

static Func<A, B, R> Memoize<A, B, R>(this Func<A, B, R> f)

    var example = new  A=default(A), B=default(B) ;
    var tuplified = CastByExample(t => f(t.A, t.B), example);
    var memoized = tuplified.Memoize();
    return (a, b) => memoized(new A=a, B=b);

光滑,嗯?


更新:C# 7 现在在语言中内置了值元组;使用它们而不是滚动你自己的或使用匿名类型。

【讨论】:

那是个好主意...不幸的是,我使用的是 .NET 3.5,并且在一段时间内我将无法切换到 4.0。以上是否有.NET 3.5 兼容版本? @Lirik:编写自己的元组类型并不难。诀窍是确保您得到正确的等式和哈希码计算。或者,有一些非常棘手的方法可以使匿名类型工作,这实际上与元组相同。 我喜欢匿名类型作为任意元组,您可能想指出,当您遇到系统定义的 [Func<...> ](msdn.microsoft.com/en-us/library/system.aspx) 时,您会这样做需要开始实施你自己的。不得不说,如果你正在这样做,也许是时候考虑将 f# 作为一种可能的候选语言了...... 哦,还有CastByExample的链接 和@S​​huggyCoUK,太棒了!我不敢相信它工作得这么好!如果我可以多次投票赞成这个答案,我会!哈哈【参考方案4】:

替代(元组和匿名类型)方法可能如下:

static void Main(string[] args)

    var func = Memoize<int, int, int>(Func);

    Console.WriteLine(func(3)(4));
    Console.WriteLine(func(3)(5));
    Console.WriteLine(func(2)(5));
    Console.WriteLine(func(3)(4));


//lets pretend this is very-expensive-to-compute function
private static int Func(int i, int j)

    return i + j;


private static Func<TArg1, Func<TArg2, TRes>> Memoize<TArg1, TArg2, TRes>(Func<TArg1, TArg2, TRes> func)

     Func<TArg1, Func<TArg2, TRes>> func1 = 
        Memoize((TArg1 arg1) => Memoize((TArg2 arg2) => func(arg1, arg2)));

    return func1;


private static Func<TArg, TRes> Memoize<TArg, TRes>(Func<TArg, TRes> func)

    var cache = new Dictionary<TArg, TRes>();

    return arg =>
    
        TRes res;

        if( !cache.TryGetValue(arg, out res) )
        
            Console.WriteLine("Calculating " + arg.ToString());

            res = func(arg);

            cache.Add(arg, res);
        
        else
        
            Console.WriteLine("Getting from cache " + arg.ToString());
        

        return res;
    ;

基于这两个 Memoize 函数,您可以轻松地为任意数量的 args 构建扩展。

【讨论】:

【参考方案5】:

我最初来这里只是为了寻找一种无参数函数的抽象记忆方法。这不完全是问题的答案,但想分享我的解决方案,以防其他人来寻找简单的案例。

public static class MemoizationExtensions

    public static Func<R> Memoize<R>(this Func<R> f)
    
        bool hasBeenCalled = false; // Used to determine if we called the function and the result was the same as default(R)
        R returnVal = default(R);
        return () =>
        
            // Should be faster than doing null checks and if we got a null the first time, 
            // we really want to memoize that result and not inadvertently call the function again.
            if (!hasBeenCalled)
            
                hasBeenCalled = true;
                returnVal = f();
            
            return returnVal;
        ;
    

如果您使用LinqPad,您可以使用以下代码通过使用LinqPad 超酷的Dump 方法轻松测试功能。

new List<Func<object>>(new Func<object>[] 
        () =>  "Entered func A1".Dump(); return 1; ,
        () =>  "Entered func A2".Dump(); return default(int); ,
        () =>  "Entered func B1".Dump(); return String.Empty; ,
        () =>  "Entered func B2".Dump(); return default(string); ,
        () =>  "Entered func C1".Dump(); return new Name = String.Empty; ,
        () =>  "Entered func C2".Dump(); return null; ,
    )
    .ForEach(f => 
        var f1 = MemoizationExtensions.Memoize(f);
        Enumerable
            .Range(1,3)
            .Select(i=>new Run=i, Value=f1())
            .Dump();
    );

附:您需要在 LinqPad 脚本的代码中包含 MemoizationExtensions 类,否则它将无法工作!

【讨论】:

以上是关于具有任意数量参数的函数的 C# 记忆[关闭]的主要内容,如果未能解决你的问题,请参考以下文章

Java 记忆方法

有角度的记忆游戏

如果我在函数顶部切换注释行的位置,为啥我的代码不起作用?这是一个记忆召回声明[关闭]

有条件的记忆?

如何理解并记忆DataFrame中的Axis参数

注意力机制与外部记忆