如何将流式查询的结果保存为 PDF / XLSX(用于生成报告)?

Posted

技术标签:

【中文标题】如何将流式查询的结果保存为 PDF / XLSX(用于生成报告)?【英文标题】:How to save results of streaming query as PDF / XLSX (for report generation)? 【发布时间】:2019-12-19 05:49:41 【问题描述】:

很想知道我们是否可以使用火花流/火花结构化流生成 PDF 或 XLSX 文件以进行报告。根据官方文档,有文件接收器,但是否支持 PDF 和 XLSX?如果可以,我们可以利用它来生成报告吗?

【问题讨论】:

【参考方案1】:

如果我们可以使用火花流/火花结构化流生成 PDF 或 XLSX 文件进行报告

如果你想以分布式流的方式生成 PDF/XLSX 文件,你真的可以使用 Spark Structured Streaming。

根据官方文档,有 File Sink 但支持 PDF 和 XLSX 吗?

没有。没有对 PDF/XLSX 格式的直接支持,因此您必须自己编写自定义数据源(带有流式接收器)。

如果可以,我们可以利用它来生成报告吗?

我以前从未听说过这样的数据源,但肯定可以自己写一个。


将 Spark 视为通用计算平台,任何可以建模(设计)为分布式计算的东西都应该使用 Spark 机器来实现。

【讨论】:

以上是关于如何将流式查询的结果保存为 PDF / XLSX(用于生成报告)?的主要内容,如果未能解决你的问题,请参考以下文章

Ruby on rails将base64保存为xlsx(或pdf或word)并使用paperclip保存

WPS-Excel如何将xlsx表格文件转换为PDF文件 - 表格转图片 - 表格转PDF

运行CMD里面,怎么把得到的结果数据保存为文本文件

如何通过“ Microsoft打印为PDF”以编程方式将文件和网页打印为PDF?

如何保存为 xlsx 文件?

如何将文本和查询结果组合为 PHP 变量的值