Tableau实战系列如何在 Google 云平台上安装 Tableau Server
Posted 文宇肃然
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Tableau实战系列如何在 Google 云平台上安装 Tableau Server相关的知识,希望对你有一定的参考价值。
前言
在 Google 计算引擎 (GCE) 虚拟机 (VM) 上安装 Tableau 时,如果想要灵活地纵向和横向扩展,而不必购买和维护昂贵的 服务器集群,则在 GCE VM 上运行 Tableau 是绝佳之选。例如,你可以将 Tableau 配 置为具备高可用性,并与许多组织所依赖的全部常用企业应用程序( 例如,Active Directory) 集成。
关于tableau系列内容博主已经做了一系列的内容分享,有需要的小伙伴可自行订阅,谢谢大家!
1.云服务数据存储
Tableau 可以利用许多原生 Google 云服务:
Google Persistent Disk:用于虚拟机 (VM) 的云端块存储。
Google Cloud Storage:用于数据存档的云端统一对象存储。
Google Cloud Dataflow:用于流式和批数据处理的云端服务。
Google Cloud Dataproc:用于运行 Spark 和 Hadoop 群集的云端服务。
此外,你可以使用任何以下 Google 云服务存储用于 Tableau Server 的数据。Tableau
提供了原生数据连接器,使你能将数据连接到以下 Google 数据源中的数据:
Google Analytics:用于跟踪和报告网站流量的 Web 分析工具。
Google BigQuery:用于分析的托管企业数据仓库。
Google Cloud SQL:托管 SQL 数据库服务。
Google Sheets:Google 文档中包括的电子表格。
2.在 Google 云平台上部署 Tableau Server
你可以将 Tableau Server 部署在 Google 计算引擎 (GCE) 虚拟机 (VM) 上。GCE 上的
Tableau 部署支持以下各项:
自行部署到 Google 计算引擎 VM – 提供最大的灵活性和多种选项以根据你的 环境自定义 Tableau Server。 对于开始简单但以后可能需要扩展的开发、测试和生产环境,建议将 Tableau Server 自行部署到 Google 计算引擎 VM。
3.Google 云平台上的 Tableau Server 拓扑
在 Google 云平台上部署 Tableau Server 时,你可以选择 Tableau Desktop 和 Tableau
Server 在 Google 计算引擎 (GCE) 虚拟机 (VM) 上的集成程度和深度。可以使用
Tableau Desktop 及其从数据源中提取数据的能力来充当数据和 Tableau 之间的纽
带。根据你的需求,或者如果你的 Google 云平台中已经有大量数据,你可能会改为 选择将全部 Google 云平台服务与 Tableau Server 结合使用。下图显示了与 Tableau
Desktop 和 Tableau 的数据源集成。
在下图中,你的所有数据都托管在 Google 云平台上。你可以分析以安全、可扩展的 方式管理的结构化和非结构化数据。你可以利用仅位于 Google 云平台上的数据、位 于 Google 云平台外部的非托管数据或者两者的组合。
4.在 Google 云平台上自行部署单个 Tableau Server
你可以在 Google 计算引擎 (GCE) 虚拟机上安装和运行 Tableau Server。执行以下任 务在 Google 计算引擎 VM 上安装和配置 Tableau Server。
步骤 1:设置 Google 计算引擎 VM
创建将在其中安装 Tableau 的 Google 计算引擎虚拟机 (VM)。
1. 登录到 Google 云平台控制台 (https://console.cloud.google.com/)。
2. 如果尚未创建新项目和设置计费,请进行创建和设置。
3. 在 Google 云平台仪表板上导航窗格中的“Compute”( 计算) 下,单击“Compute
Engine”( 计算引擎) 。
4. 在“Compute Engine VM instances”( 计算引擎 VM 实例) 对话框中,单击 “Create”( 创建) 。
5. 在“Create an instance”( 创建实例) 页面上,指定以下实例属性:
a. Name( 名称) :输入虚拟机 (VM) 的名称。
b. Zone( 区域) :为了减少延迟,请选择离你的数据源和用户最近的区域。
c. Machine type( 虚拟机类型) :选择符合 Tableau Server 系统要求的 VM。 例如,选择“n1-standard-16”虚拟机类型,单击“Customize”( 自定义) ,然 后将内存增加到 64 GB。
d. Container( 容器) :如果已选中,请清除“Deploy a container image to this VM instance”( 将容器映像部署到此 VM 实例) 复选框( 默认值) 。e. Boot disk( 引导磁盘) :单击“Change”( 更改) ,然后选择具有 128 GB SSD 永久性磁盘的“Windows Server 2016 Datacenter”,接着单击 “Select”( 选择) 。
f. Identity and API access( 身份和 API 访问) :使用默认设置。
g. Firewall( 防火墙) :选择“Allow HTTP traffic”( 允许 HTTP 流量) 和“Allow
HTTPS traffic”( 允许 HTTPS 流量) 。
6. 完成设置后,查看你的选择,然后单击“Create”( 创建) 。
步骤 2:连接到 Google 计算引擎 VM
创建 Google 计算引擎 (GCE) 虚拟机 (VM) 之后,你必须连接到该虚拟机并使其做好 安装 Tableau 的准备。
1. 在“Compute Engine”( 计算引擎) 控制台中,单击“VM instances”( VM 实例) 。
2. 在 VM 实例的列表中,选择你的实例。
3. 在“Connect”( 连接) 列中,单击“RDP”弹出式菜单,并单击“Set Windows password”( 设置 Windows 密码) 。
4. 在“Set new Windows password”( 设置新 Windows 密码) 对话框中的“Username”( 用户名) 字段中,指定一个用户名( 或保留默认用户名) 。将用户名 存储在一个安全位置。
5. 单击“Set”( 设置) 以生成密码。“New Windows password”( 新 Windows 密码) 对 话框可能需要几秒钟才会出现。将密码存储在一个安全位置。
注意:这是你复制密码的唯一机会。
6. 在“VM instances”( VM 实例) 页面上的“Connect”( 连接) 列中,单击“RDP”弹出 式菜单,然后选择“Download the RDP file”( 下载 RDP 文件) 。将 .rdp 文件保存 到你的计算机。
7. 使用你保存的 .rdp 文件连接到 VM。提供你在上面为 Google 计算引擎 VM 生成 的用户名和密码。( 如果已登录到 Windows 网络,例如你的组织的网络,请选 择“Other User”( 其他用户) 并在相应的框中输入你的凭据。) 你将看到一条或多条消息,指出无法识别远程连接。这是正常的。
注意:RDP 文件通过使用外部 IP 地址来引用实例。默认情况下,这是一个 短暂 IP 地址,在停止或重新启动服务器时可能会更新。在这种情况下,你 将需要获取一份新的 RDP 文件。为了长期使用,GCP 提供需另行付费的 静态 IP 地址。远程桌面会将你登录到 Google 计算引擎 VM。
步骤 3:在 Google 计算引擎 VM 上安装 Tableau Server
在 Google 计算引擎 (GCE) 虚拟机 (VM) 上安装 Tableau 类似于在任何其他服务器上 安装它。
注意:你只能在初始安装过程中选择本地身份验证或 Active Directory (AD) 身份 验证。只有多工作计算机配置才需要 AD。 用户运行身份必须是服务器实例上的本地用户。
1. 通过执行以下操作之一,将 Tableau Server 安装程序复制到 VM: l 直接下载安装程序。登录到 VM 后,打开浏览器,浏览到 Tableau Server
下载页面,并下载适用于你的操作系统的 Tableau 版本。
注意:Windows Server 上的默认增强安全配置强制规定 Internet Explorer 的“Internet 区域”应始终设置为“高”,并且无法为该区域更改。因此,在使用 Internet Explorer 浏览到公共站点时,你必须将这 些站点添加到受信任的站点列表。
将安装程序复制到 VM。如果计算机上已经有 Tableau 安装程序的副本,
请将其复制到 VM。在 VM 上创建一个要将安装程序放入其中的文件夹。
从计算机中,将 Tableau 安装程序文件( 例如,tableau-server-2020-2-3.x86_64.rpm) 上载到 VM。
2. 在 VM 上运行 Tableau 安装程序,开始服务器安装过程。安装过程的工作方式 与其在任何其他服务器上的工作方式相同。
步骤 4:从远程浏览器中访问 Tableau Server
确保只有授权用户才能访问你在其中安装了 Tableau 的 Google 计算平台虚拟机(VM)。
1. 在 Google 计算平台控制台中的“Compute”( 计算) 下,单击“Compute Engine” ( 计算引擎) ,然后单击“VM instances”( VM 实例) 。查找与 VM 关联的外部 IP 地
址。
2. 在另一台计算机上( 不在 VM 上) ,打开浏览器。
3. 在浏览器中,键入你安装在 VM 上的 Tableau 的外部 IP 地址。例如,
http://13.64.47.61。
注意:该外部 IP 是一个短暂地址。当你停止实例时,它将被释放,并且重 新启动时将会分配一个新的外部 IP。如果停止实例,你可能需要检索新的 外部 IP 地址才能使用浏览器访问服务器。GCP 提供永久性静态 IP 地址。此时 URL 可正确解析,并且你将进入 Tableau Server 实例的登录页面。
4. 使用你在安装过程结束时创建的管理员用户的凭据登录。登录后,你将看到
Tableau Server 的“内容”页面
步骤 5:将数据发布到 Google 计算引擎 VM 上的 Tableau Server
在 Google 计算引擎 (GCE) 虚拟机 (VM) 上设置 Tableau Server 之后,组织中的授权用 户可将工作簿和数据源发布到服务器。该过程的工作方式与 Tableau 安装在本地时 的工作方式相同,只是用户必须登录到 VM 上运行的服务器。
在允许用户发布之前,请确保已在 Tableau Server 中为每个用户创建了“发布者”站点 角色,并且用户具有“发布者”权限。
若要将工作簿和数据源发布到 Tableau,用户必须使用为其分配的凭据通过云服务 器 IP 地址登录到服务器。
步骤 6:管理 Tableau Server 许可证
如果使用 Google 云平台控制台或从 VM 本身内关闭 Google 计算引擎 (GCE) 虚拟机
(VM),则无需管理 Tableau Server 许可证。使用 GCP 计算引擎控制台停止具有永久 性 SSD 磁盘的 Google 计算引擎 VM 时,VM 不会产生费用,但附加到 VM 的资源仍 将产生费用。删除 VM 会释放它的所有资源,包括外部存储。如果不再需要 VM,你可以将其删
除。在关闭并删除 VM 之前,请始终停用 Tableau 许可证。
在删除 VM 之前,执行以下操作:
1. 登录到你的 VM。
2. 创建 Tableau 的备份,然后将 .tsbak 文件复制到 VM 不再可用时可访问的另 一个位置,例如 Google 云存储。有关详细信息,请在 Tableau 帮助中搜索“执 行 Tableau 的完整备份和还原”。
3. 使用 tsm licenses deactivate 命令来停用 Tableau 产品密钥。可以关闭和 删除 VM。
5.在分布式环境中的 Google 云平台上自行部 署 Tableau Server
你可以在分布式环境中的两个虚拟机 (VM) 上运行 Tableau Server,这些虚拟机也称 为群集。但是,如果要在高可用性 (HA) 分布式环境中运行 Tableau Server,则需要 启动相同类型和容量的三个或更多个 Google Compute Engine (GCE) 虚拟机 (Vm), 并将它们配置为附加节点。此情况假设你有三个 Google 计算引擎 VM,每个实例上 都安装了 Tableau Server。一个实例被配置为初始节点,另外两个实例被配置为附 加节点。
以下步骤显示如何在高可用性和高可扩展性配置中的三个 Google 计算引擎 VM 的集 群上安装和部署 Tableau Server。
步骤 1:创建 Google 云平台虚拟私有云 (VPC)
你必须有一个现有 Google 云平台自定义模式虚拟私有云 (VPC),带有跨三个不同区 域的私有和公共子网。
参考设置符合 HIPAA 标准的 Google 云项目教程,并依靠 Cloud Healthcare Data
Protection Toolkit,此体系结构通过将配置视为代码,帮助你轻松构建基于 Google 云 的基础架构。下图说明了该体系结构如何使用可重用的组件( Google 云部署管理器 配置脚本和参数化配置模板) 帮助你满足安全性和合规性最佳做法。
步骤 2:部署三个 Google 计算引擎 VM
在私有子网中部署相同类型和容量的三个 Google 计算引擎虚拟机 (VM),将每个 VM
都放在其自己的区域中。选择符合 Tableau Server 系统要求的 VM。你将在每个
Google 计算引擎 VM 上安装 Tableau Server,并将一个节点用作初始节点,将其他两 个节点用作附加节点
步骤3:为 Tableau Server 群集创建一个 Google 云平台负 载平衡器
在 Google 云平台 虚拟私有云 (VPC) 内启动负载平衡器。
1. 创建和启动面向 Internet 的负载平衡器或内部可访问的负载平衡器:
若要启动面向 Internet 的公共负载平衡器,请按照 Google 网站上的设置HTTP(S) 负载平衡器中的步骤进行操作,并选择两个公共子网。确保使 用 SSL 配置负载平衡器,如 Google 网站上的 SSL 证书中所述。
若要启动内部可访问的负载平衡器,请按照 Google 网站上的设置内部 负载平衡器中的步骤进行操作,并选择两个私有子网。
2. 确保你的 VPC 网络防火墙规则配置为仅允许在端口 80 或 443 上访问,并且 来源限制为将访问 Tableau 的主机或一系列主机。
3. 将 ping 路径指定为 /。
4. 选择 Tableau 实例,并按照 Google 网站上的创建跨区域负载平衡中的说明进 行操作,以便负载平衡器可跨多个区域中的实例对流量进行平衡。
5. 更新 Tableau 以使用负载平衡器。
6.常见问题答疑
1.无法使用 RDP 连接到 VM
以下一个或多个问题可能会使您无法使用 RDP 连接到 VM:
确保使用正确的凭据。
选择“Other User”( 其他用户) 选项,并在该处输入您的凭据。
确保使用在 GCP 实例上有效的用户名。例如,如果您使用管理员帐户myuser 创建了实例,请在 RDP 对话框中输入 .\\myuser 作为用户名。
2.无法从远程浏览器中访问服务器
以下一个或多个问题可能会使您无法从远程浏览器中访问服务器:
登录到实例并确保服务器正在运行。
在实例中,打开浏览器,并以本地方式访问服务器( 例如,使用http://localhost 或 http://localhost:port,其中 port 是服务器配置为在其上侦 听的端口号) 。
在 GCP 计算引擎控制台中,确保配置一个端点以允许进入实例的 HTTP流量。
注意:您无法使用 Windows ping 实用工具来测试与实例的连接。从公 共 Internet 中使用时,ping 实用工具会始终报告超时。
3.Tableau Server 未使用所有 CPU 内核
在使用 Tableau Server 基于内核的许可时,可能会出现以下一个或多个症状:
在安装 Tableau Server 时,对于运行 Tableau Server 的计算机,安装程序 显示的内核数可能比预期显示的内核数少。
在 Tableau Server 的“许可证”页面上,“正在使用的许可证”下列出的内核 数比预期显示的内核数少。
运行 tsm licenses list 时,Tableau Server 报告的内核数可能比预期 显示的内核数少。
以上是关于Tableau实战系列如何在 Google 云平台上安装 Tableau Server的主要内容,如果未能解决你的问题,请参考以下文章
tableau实战系列(三十八)-Tableau Server 端口耗竭的具体表象及如何避免端口耗竭
tableau实战系列(四十七)-Tableau快速生成可视化视图
tableau实战系列(四十七)-Tableau快速生成可视化视图