python 使用dato分布式SFrame方法的Cumsum原型

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 使用dato分布式SFrame方法的Cumsum原型相关的知识,希望对你有一定的参考价值。


def offset_cumsum(sf, group_by, ordering, summed_column, starting_element=0, prefix='', suffix='_cumsum'):  
     import graphlab as gl
    from copy import copy
    from itertools import islice
    def _cumsum(l, initial, element=lambda (_, i): i, op=lambda acc, el: acc + el):
        prev = copy(initial)
        yield list(l[0] + (copy(initial),))
        if isinstance(initial, collections.Iterable):
            for i in islice(l, 1, None):
                prev = op(prev, list(element(i)))
                yield list(i + (copy(prev),))
        else:
            for i in islice(l, 1, None):
                prev = op(prev, element(i))
                yield list(i + (copy(prev),))

    new_column_name = prefix + summed_column + suffix
    cumsum_sf = sf.groupby(
        group_by,
        {summed_column: gl.aggregate.CONCAT(ordering, summed_column)}
    ).flat_map(
        [ordering, summed_column, new_column_name],
        lambda r: list(_cumsum(sorted(r[summed_column].items(), key=lambda k: k[0]), starting_element))
    ).sort(
        ordering
    )
    sf = sf.sort(ordering)
    sf[new_column_name] = cumsum_sf[new_column_name]
    return sf

以上是关于python 使用dato分布式SFrame方法的Cumsum原型的主要内容,如果未能解决你的问题,请参考以下文章

python 将数据导入SFrame并拆分为测试和训练数据

python︱apple开源机器学习框架turicreate中的SFrame——新形态pd.DataFrame

python 用Dato分类

python un servicio de datos en formato json,con django en python

如何为对象检测任务创建与 TuriCreate 兼容的 SFrame

SFrame中的apple函数