如何将流式查询的结果保存为 PDF/XLSX(用于生成报告)?

How to save results of streaming query as PDF / XLSX (for report generation)?

想知道我们是否可以使用火花流/火花结构化流为报告生成 PDF 或 XLSX 文件。根据官方文档,有 File Sink,但是否支持 PDF 和 XLSX?如果可以,我们可以将其用于生成报告吗?

if we can generate PDF or XLSX files for report using spark streaming / spark structured streaming

如果你想以分布式流的方式生成 PDF/XLSX 文件,你真的可以使用 Spark Structured Streaming。

As per the official document there is File Sink but is PDF and XLSX supported?

没有。不直接支持 PDF/XLSX 格式,因此您必须自己编写自定义数据源(使用流式接收器)。

if so can we make use of it for report generations?

我以前从未听说过这样的数据源,但是自己写一个肯定是可以的。


将 Spark 视为通用计算平台,任何可以建模(设计)为分布式计算的东西都应该可以使用 Spark 机器来实现。