为啥 dig 命令只返回一个 google.com 的 IP 地址?

Posted

技术标签:

【中文标题】为啥 dig 命令只返回一个 google.com 的 IP 地址?【英文标题】:Why dig command is returning only one IP address of google.com?为什么 dig 命令只返回一个 google.com 的 IP 地址? 【发布时间】:2017-03-18 04:22:57 【问题描述】:

据我们所知,谷歌有不止一个 IP 地址。如果我们使用https://toolbox.googleapps.com/apps/dig/#A/google.com@8.8.8.8这个网站,就会产生多个google的IP地址。

如果我运行以下命令,那么情况就不同了:

gyan@localhost:~/codes/java/net$ dig google.com

; <<>> DiG 9.10.3-P4-Ubuntu <<>> google.com
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 11777
;; flags: qr rd ra; QUERY: 1, ANSWER: 1, AUTHORITY: 0, ADDITIONAL: 1

;; OPT PSEUDOSECTION:
; EDNS: version: 0, flags:; udp: 4000
;; QUESTION SECTION:
;google.com.            IN  A

;; ANSWER SECTION:
google.com.     269 IN  A   216.58.220.46

;; Query time: 0 msec
;; SERVER: 10.100.171.1#53(10.100.171.1)
;; WHEN: Fri Nov 04 16:18:07 IST 2016
;; MSG SIZE  rcvd: 55

gyan@localhost:~/codes/java/net$ 

只返回一个IP地址,与上述网站返回的不一样。这个 IP 地址也会不时变化。

但如果我为 amazon.com 运行 dig 命令:

gyan@localhost:~/codes/java/net$ dig amazon.com

; <<>> DiG 9.10.3-P4-Ubuntu <<>> amazon.com
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 55090
;; flags: qr rd ra; QUERY: 1, ANSWER: 6, AUTHORITY: 0, ADDITIONAL: 1

;; OPT PSEUDOSECTION:
; EDNS: version: 0, flags:; udp: 4000
;; QUESTION SECTION:
;amazon.com.            IN  A

;; ANSWER SECTION:
amazon.com.     34  IN  A   54.239.26.128
amazon.com.     34  IN  A   54.239.17.7
amazon.com.     34  IN  A   54.239.25.192
amazon.com.     34  IN  A   54.239.25.208
amazon.com.     34  IN  A   54.239.25.200
amazon.com.     34  IN  A   54.239.17.6

;; Query time: 74 msec
;; SERVER: 127.0.1.1#53(127.0.1.1)
;; WHEN: Fri Nov 04 16:23:17 IST 2016
;; MSG SIZE  rcvd: 135

gyan@localhost:~/codes/java/net$ 

amazon.com 的这 6 个 IP 地址永远不会改变。并且网站https://toolbox.googleapps.com/apps/dig/#A/amazon.com@8.8.8.8也返回相同的6个IP地址。

我怀疑 google.com 的 DNS 查找与 amazon.com 有何不同?为什么 google 只产生一条记录,而不是像 amazon 这样的多条记录?

【问题讨论】:

两个不同域的DNS查找肯定会有所不同;不过,GeoDNS 和 Anycast 可能是您正在寻找的 :) 我不知道他们的工具箱。很有用! 我认为 amazon.com 返回的 6 个 IP 地址是负载均衡器服务器。负载平衡器服务器的 IP 保持不变,然后根据负载平衡算法在内部将请求转发到负载最小的特定服务器。 【参考方案1】:

据我们所知,谷歌拥有多个 IP 地址。

没错。但这并不意味着客户需要了解其中的一个以上。

在过去,服务使用多个 IP 地址响应 DNS 查询以执行负载平衡是很常见的。回复通常是随机的,这意味着客户端会从行为相同的大量服务器地址池中随机获取几个地址的子集。

基于 DNS 的负载平衡一直是个小技巧。由于缓存存在问题:如果ISP的DNS解析器正在缓存回复,大量用户将全部连接到这几个IP地址,从而降低负载平衡的有效性。解决方法是降低记录的 TTL,以确保条目在缓存中保留一小段时间,然后执行新的查询。例如,您发布的 dig 输出中的 amazon.com A 记录的 TTL 设置为 34 秒。

该方法效果不佳。减少 TTL 会进一步增加小型 HTTP 请求的延迟。此外,DNS 负载平衡的结果有点不可预测,因为它不能保证服务器会统一处理负载。

但是,如果您有一个在网络级别工作的负载平衡器(将其视为反向 NAT 盒:一个 IP 面向互联网,将流量多路复用到其后面的大量服务器),它可以处理大量连接,并且正常运行时间也很长,不需要在 DNS 级别进行负载平衡。

因此,您连接的 Google 数据中心很可能不使用 DNS 负载平衡,而 Amazon 的数据中心使用。

另一个问题是为什么如果你从工具箱查询 8.8.8.8 会得到多个地址,而从你的机器查询却只能得到一个。

首先,重要的是要了解,从工具箱查询时,发送 DNS 查询的是 Web 服务器,而不是您的计算机。

DNS 服务器不必向不同的客户端返回相同的回复。实际上,通常会根据客户端的地理位置返回不同的回复:例如,如果欧洲的用户查询 google.com,它将获得欧洲数据中心的 IP 地址,而不是美国。

在这种情况下,我认为 DNS 地理定位用于某些客户端,而不用于其他客户端。它可能与发送查询的网络大小以及网络负载均衡器的容量有关。例如,如果负载平衡器可以同时处理 1,000,000 个连接,并且您发送查询的网络有 100,000 个 IP,则无需进行 DNS 负载平衡。但是如果网络很大(在您的示例中,运行工具箱的数据中心的大小,网络负载平衡器可能无法处理它,因此启用 DNS 负载平衡并且您从池中获取多个随机 IP 地址。

注意:“网络”是指使用相同 DNS 解析器的一组机器。

返回多个 IP 地址的另一个原因是进行基于 DNS 的故障转移。当其中一台机器停止工作时,客户端会尝试连接到另一台机器。但这不是进行故障转移的好方法,因为某些应用程序不会存储所有 IP 地址(尽管我认为大多数浏览器都会存储),而且 DNS 缓存也会阻碍。

【讨论】:

您确定该声明是网络服务器发送 DNS 查询,而不是您的计算机。通常我们在书中读到。该计算机需要向 DNS 服务器发出请求以解析 IP 地址。 @hackwithharsha 我认为他的意思是托管谷歌工具箱的网络服务器。

以上是关于为啥 dig 命令只返回一个 google.com 的 IP 地址?的主要内容,如果未能解决你的问题,请参考以下文章

dig查询中ANSWER SECTION五个字段的含义

dig 命令结果解析

dig这个命令到底怎吗用

DIG命令

dig命令详解

linux dig命令 转