用于在多个 Excel 文件中列出 Power Query 源依赖项的脚本

Posted

技术标签:

【中文标题】用于在多个 Excel 文件中列出 Power Query 源依赖项的脚本【英文标题】:Script to list Power Query source dependencies in multiple Excel files 【发布时间】:2021-08-23 21:42:06 【问题描述】:

我使用 Power Query (PQ) 处理相当复杂的数据流。单个文件中的许多查询逐渐延长了计算时间,因此我将 PQ 拆分为多个 Excel 文件。

我想知道,哪些文件依赖于其他文件。我找到了类似this 的单元格引用。

问题:如何在 PQ 中获取指定目录中多个文件的引用源列表(Excel 文件的文件名)?

我已经想到了解决方案:

VBA - 我能够更新引用的脚本以遍历文件,但我不知道访问 Power Query 源的正确方法。 python - 我的蛮力方法是临时解压缩 XLS? 文件并解析 XML 以查找使用的源。

是否有任何框架或工作示例可以列出来自特定 XLS? 文件的所有 PQ 源?

【问题讨论】:

【参考方案1】:

您可以像这样访问 powerQuery 源:

Set t = ThisWorkbook.Queries("Table1")
tf = t.Formula

【讨论】:

仅作记录:我使用了与 python 和 win32com 库相结合的精确属性。使用 Excel 2010 版本(没有 Queries() 方法)苦苦挣扎,一切都适用于 Excel 2016。

以上是关于用于在多个 Excel 文件中列出 Power Query 源依赖项的脚本的主要内容,如果未能解决你的问题,请参考以下文章

如何使用Power Query动态汇总文件夹下多个Excel文件

Power Query 同一文件夹多工作簿合并

如何使用 Power BI 将一张 Excel 工作表中的多个表格转换为一张表格?

【OFFICE 365】Power Query 合并工作表

通过带有 SAS 令牌的 Power Shell 列出 Azure Blob 容器中文件夹中的文件

power pivot 数据导出到excel吗