Zeppelin Apache - 使用 Angular 添加下载按钮,以便下载 Pandas 或 PySpark Dataframe
Posted
技术标签:
【中文标题】Zeppelin Apache - 使用 Angular 添加下载按钮,以便下载 Pandas 或 PySpark Dataframe【英文标题】:Zeppelin Apache - Add Download button using angular so as to download Pandas or PySpark Dataframe 【发布时间】:2016-11-28 18:37:04 【问题描述】:我目前正在使用 Apache Zeppelin,并且我有一个 pandas/pyspark 数据框,我希望最终用户可以选择将其下载为 csv 文件(或任何与 excel 相关的格式)。
为此,我需要使用 AngularJS 语言,但我不知道如何编写必要的代码来获取数据框并将其下载为 Excel 表格。
到目前为止我所做的如下:
我获得了 pandas 数据帧并将其转换为 JSON 字符串 (csv_table_output)。下图 然后我在网上找到了以下角码,我想用它来将表格导出为 CSV 格式:https://gist.github.com/anonymous/815fb404daa94979596db7731934d5bd
stockData55 是我想从 csv_table_output 放置输出字符串的变量。当我按原样使用字符串时,它可以正常工作,但我不知道如何将信息从 csv_table_output 解析为角度变量
如果有更好的方法来代替使用附加的代码,我很高兴看到
【问题讨论】:
【参考方案1】:Zeppelin v0.6.0 包含 ZEPPELIN-997,允许您将数据帧本地导出为 csv 或 tsv,例如:
%pyspark
df = sqlContext.createDataFrame([(1, 'foo'), (2, 'bar')],
('id', 'name'))
z.show(df)
呈现为:
【讨论】:
此按钮在您处于开发模式时可用。当您进入报告模式(您将与其他用户共享的报告)时,所有这些按钮都不可用 此输出由 ZEPPELIN_INTERPRETER_OUTPUT_LIMIT 控制,不能在用户级别设置。以上是关于Zeppelin Apache - 使用 Angular 添加下载按钮,以便下载 Pandas 或 PySpark Dataframe的主要内容,如果未能解决你的问题,请参考以下文章
apache zeppelin 上的 zeppelin_ipyspark.py 获取 SyntaxError:无效语法