python 使用dato分布式SFrame方法的Cumsum原型
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 使用dato分布式SFrame方法的Cumsum原型相关的知识,希望对你有一定的参考价值。
def offset_cumsum(sf, group_by, ordering, summed_column, starting_element=0, prefix='', suffix='_cumsum'):
import graphlab as gl
from copy import copy
from itertools import islice
def _cumsum(l, initial, element=lambda (_, i): i, op=lambda acc, el: acc + el):
prev = copy(initial)
yield list(l[0] + (copy(initial),))
if isinstance(initial, collections.Iterable):
for i in islice(l, 1, None):
prev = op(prev, list(element(i)))
yield list(i + (copy(prev),))
else:
for i in islice(l, 1, None):
prev = op(prev, element(i))
yield list(i + (copy(prev),))
new_column_name = prefix + summed_column + suffix
cumsum_sf = sf.groupby(
group_by,
{summed_column: gl.aggregate.CONCAT(ordering, summed_column)}
).flat_map(
[ordering, summed_column, new_column_name],
lambda r: list(_cumsum(sorted(r[summed_column].items(), key=lambda k: k[0]), starting_element))
).sort(
ordering
)
sf = sf.sort(ordering)
sf[new_column_name] = cumsum_sf[new_column_name]
return sf
以上是关于python 使用dato分布式SFrame方法的Cumsum原型的主要内容,如果未能解决你的问题,请参考以下文章
python 将数据导入SFrame并拆分为测试和训练数据
python︱apple开源机器学习框架turicreate中的SFrame——新形态pd.DataFrame
python 用Dato分类
python un servicio de datos en formato json,con django en python
如何为对象检测任务创建与 TuriCreate 兼容的 SFrame
SFrame中的apple函数