如何将流式查询的结果保存为 PDF / XLSX(用于生成报告)?
Posted
技术标签:
【中文标题】如何将流式查询的结果保存为 PDF / XLSX(用于生成报告)?【英文标题】:How to save results of streaming query as PDF / XLSX (for report generation)? 【发布时间】:2019-12-19 05:49:41 【问题描述】:很想知道我们是否可以使用火花流/火花结构化流生成 PDF 或 XLSX 文件以进行报告。根据官方文档,有文件接收器,但是否支持 PDF 和 XLSX?如果可以,我们可以利用它来生成报告吗?
【问题讨论】:
【参考方案1】:如果我们可以使用火花流/火花结构化流生成 PDF 或 XLSX 文件进行报告
如果你想以分布式流的方式生成 PDF/XLSX 文件,你真的可以使用 Spark Structured Streaming。
根据官方文档,有 File Sink 但支持 PDF 和 XLSX 吗?
没有。没有对 PDF/XLSX 格式的直接支持,因此您必须自己编写自定义数据源(带有流式接收器)。
如果可以,我们可以利用它来生成报告吗?
我以前从未听说过这样的数据源,但肯定可以自己写一个。
将 Spark 视为通用计算平台,任何可以建模(设计)为分布式计算的东西都应该使用 Spark 机器来实现。
【讨论】:
以上是关于如何将流式查询的结果保存为 PDF / XLSX(用于生成报告)?的主要内容,如果未能解决你的问题,请参考以下文章
Ruby on rails将base64保存为xlsx(或pdf或word)并使用paperclip保存
WPS-Excel如何将xlsx表格文件转换为PDF文件 - 表格转图片 - 表格转PDF