如何减少 Google App Engine 数据存储延迟?
Posted
技术标签:
【中文标题】如何减少 Google App Engine 数据存储延迟?【英文标题】:How can I reduce Google App Engine datastore latency? 【发布时间】:2013-01-03 03:56:26 【问题描述】:通过 appstats,我可以看到我的数据存储查询大约需要 125 毫秒(api 和 cpu 结合),但在执行查询之前通常会有很长的延迟(例如,长达 12000 毫秒)。
我可以看到我的数据存储延迟与我的查询无关(例如,相同的查询/数据有很大不同的延迟),所以我假设这是应用引擎的调度问题。
其他人是否也遇到过同样的问题?
有没有办法减少延迟(例如管理控制台设置)?
这是来自 appstats 的屏幕截图。这个 servlet 几乎没有 cpu 处理。它执行 getObjectByID,然后执行数据存储查询。该查询有一个 OR 运算符,因此它被应用引擎转换为 3 个查询。
. 如您所见,在第一个 getObjectByID 执行之前需要 6000 毫秒。 get操作前没有任何处理(除了获取pm)。我认为这 6000 毫秒的延迟可能是由于实例预热造成的,因此我将空闲实例增加到 2 个以防止任何预热。
然后在 getObjectByID 和查询之间有大约 1000 毫秒的第二次延迟。获取和查询之间有零行代码。该代码仅获取 getObjectByID 的结果并将数据用作查询的一部分。
总计为 8097 毫秒,但我的数据存储操作(以及 99.99% 的 servlet)只有 514 毫秒(45 毫秒 api),尽管每次运行 servlet 时数字都会发生变化。这是另一个针对相同数据在同一 servlet 上运行的 appstats 屏幕截图。
这是我的 java 代码的基础知识。出于安全考虑,我不得不删除一些详细信息。
user = pm.getObjectById(User.class, userKey);
//build queryBuilder.append(...
final Query query = pm.newQuery(UserAccount.class,queryBuilder.toString());
query.setOrdering("rating descending");
query.executeWithArray(args);
编辑: 使用 Pingdom,我可以看到 GAE 延迟从 450 毫秒到 7,399 毫秒不等,或相差 1,644%!这是有两个空闲实例且站点上没有用户。
【问题讨论】:
你的问题听起来很奇怪。 Appstats 不会在执行您的查询时表示任何调度延迟。您能否附上您的 appstats 页面的图片以查看您在说什么? 是的,很奇怪。我已经用 appstat 图像和更多细节更新了这个问题。感谢您的帮助。 你能发布正在执行的相关代码吗? 好的,已将代码添加到问题中。 鉴于你并不总是观察到延迟,我怀疑你的代码是主要问题(这并不意味着它最终可以被优化,但我怀疑这个问题会通过改变而消失你的代码)。我的猜测是,正如您所建议的那样,您正在经历预热延迟。在我分享类似问题的经验的地方查看我的答案。 【参考方案1】:我在一些应用中观察到非常相似的延迟(在 7000-10000 毫秒范围内)。我认为问题的大部分(那 6000 毫秒)不在于您的代码。
根据我的观察,该问题与 AppEngine 启动新实例有关。设置最小空闲实例可能有助于缓解,但它不会解决它(我尝试了最多 2 个空闲实例),因为基本上即使您有 N 个空闲实例,应用引擎也会更喜欢启动动态实例,即使单个请求进来,并将“保存”空闲的请求以防出现疯狂的流量高峰。这是非常违反直觉的,因为您希望它使用已经存在的实例并为将来的请求启动动态实例。
无论如何,根据我的经验,这个问题(10000 毫秒延迟)很少发生在任何非零负载量下,而且许多人不得不每隔几分钟恢复到某种 ping 之王(可能是 cron 作业)(以前可以有 5 分钟,但最近实例死得更快,所以它更像是每 2 分钟一次 ping)以保持动态实例为在没有其他人打开时访问站点的用户提供服务。这种 ping 并不理想,因为它会吃掉您的免费配额(每 5 分钟 ping 一次会吃掉一半以上),但到目前为止我真的还没有找到更好的选择。
回顾一下,总的来说,我发现应用引擎在负载下非常棒,但在网站上只有很少 (1-3) 个用户时并不出色。
【讨论】:
感谢您的回答。有道理。我会尝试 ping 的想法。【参考方案2】:Appstats 仅在您进行 GAE API/RPC 调用时帮助诊断性能问题。
就您的图表而言,“空白”时间用于在您的实例上运行您的代码。这不会是安排时间。
您猜测初始延迟可能是因为实例预热很可能。它可能是正在执行的框架代码。 我无法猜测 Get 和 Query 之间的延迟。可能是有0行代码,但是你在Query中调用了一些需要时间处理的函数。
如果不了解语言、框架或实际代码,没有人可以帮助您。
您需要自行添加某种性能跟踪来诊断此问题。最简单(但不是非常准确)的方法是在代码执行时添加计时器并记录计时器值。
【讨论】:
感谢您的反馈。我在上面添加了代码。这是一个使用 JDO 访问数据存储的非常简单的 java servlet。它没有使用任何框架。在我的应用程序的其他部分,我正在使用 GWT,但如果它影响了这个 servlet,我会感到惊讶。 我还应该指出,相同的 servlet 和数据请求并不总是有很长的延迟。我附上了另一个快速运行的 appstats 屏幕截图。以上是关于如何减少 Google App Engine 数据存储延迟?的主要内容,如果未能解决你的问题,请参考以下文章
如何从本地 Google App-engine 数据存储中删除所有实体?
如何使用 Google App Engine 验证表单数据? [关闭]
如何将数据从 Android 移动设备发送到 Google App Engine 数据存储区?
您如何在 Java 中使用 Google App Engine 数据存储中的列表属性?