GKE 节点池状态卡在 PROVISIONING

Posted

技术标签:

【中文标题】GKE 节点池状态卡在 PROVISIONING【英文标题】:GKE Node Pool status stuck as PROVISIONING 【发布时间】:2020-03-31 04:45:15 【问题描述】:

我正在尝试使用 Terraform 创建 GKE 节点池

resource "google_container_node_pool" "node_pool" 
  provider = google-beta
  name       = var.node_pool_name
  location   = var.region
  cluster    = var.cluster_name
  node_count = var.k8s_workers_count

  node_config 
    machine_type = var.k8s_workers_shape

    image_type      = "COS"
    service_account = google_service_account.sa.email
    labels = 
      name = var.node_pool_name
    
    metadata = 
      disable-legacy-endpoints = "true"
    
    workload_metadata_config 
      node_metadata = "GKE_METADATA_SERVER"
    
    oauth_scopes = [
      "https://www.googleapis.com/auth/cloud-platform",
      "https://www.googleapis.com/auth/userinfo.email"
    ]
  

  management 
    auto_repair  = true
    auto_upgrade = true
  

3m 后 TF 控制台返回错误信息

Error: Error reading NodePool "pool1" from cluster "cluster-1": Nodepool "pool1" has status "PROVISIONING" with message ""

Gcloud cli 返回该状态确实 PROVISIONING

config:
  diskSizeGb: 100
  diskType: pd-standard
  imageType: COS
  labels:
    name: pool1
  machineType: n1-standard-4
  metadata:
    disable-legacy-endpoints: 'true'
  oauthScopes:
  - https://www.googleapis.com/auth/cloud-platform
  - https://www.googleapis.com/auth/userinfo.email
  serviceAccount: 
  shieldedInstanceConfig:
    enableIntegrityMonitoring: true
initialNodeCount: 2
instanceGroupUrls:
- https://www.googleapis.com/compute/v1/projects/
management:
  autoRepair: true
  autoUpgrade: true
maxPodsConstraint:
  maxPodsPerNode: '110'
name: pool1
podIpv4CidrSize: 24
selfLink: XXX
status: PROVISIONING
version: 1.13.11-gke.14

但是 console.cloud.google.com 显示状态为绿色,并且集群允许我创建部署等。有什么想法,云英雄?

更新:2019 年 12 月 7 日下午 1:48 - 我能够运行 TF 脚本。不知道是谷歌修复了它还是我很幸运。

【问题讨论】:

我从昨天开始遇到同样的问题... 这里同样适用于欧洲西部 2 你们解决问题了吗?我也遇到了同样的事情 我今天也遇到了同样的问题。直到现在,仍然面临同样的问题。 asia-southeast1 地区的矿山 我正在联系支持团队了解更多详情。我知道更多信息后会尽快通知您。 【参考方案1】:

https://status.cloud.google.com/上有关于这个问题的一些信息:

在 asia-east1-a、asia-east2-c、asia-northeast1-a、asia-northeast2-c、asia-south1-a、asia-southeast1-a、australia-southeast1-a 中新创建的 GKE 节点池, europe-north1-c, europe-west1-c, europe-west2-a, europe-west3-a, europe-west4-a, europe-west6-c, northamerica-northeast1-c, southamerica-east1-a, 我们-central1-b、us-east1-a、us-east1-d、us-east2-a、us-east4-b、us-west1-a 和 us-west2-c 已成功创建,但错误地显示为 PROVISIONING。正在进行的回滚将为新节点池解决此问题。

【讨论】:

以上是关于GKE 节点池状态卡在 PROVISIONING的主要内容,如果未能解决你的问题,请参考以下文章

GKE 不会将节点缩减为零

如何在terraform中更改GKE Cluster的节点池中的节点名称?

使用 terraform 添加带有 GPU 的 GKE 节点池

是否可以在 GKE 的区域集群中创建仅限区域的节点池?

从节点池开始GKE非常慢 - 集群和k8s / gcloud api不可用

如何在 GKE 上调试节点健康错误?