bigquery重复记录中的数据顺序
Posted
技术标签:
【中文标题】bigquery重复记录中的数据顺序【英文标题】:Order of data in bigquery repeated records 【发布时间】:2013-04-22 19:19:59 【问题描述】:使用聚合函数时,如何知道(或控制)重复字段中记录的返回顺序?
例如,如果我在子项中使用“group_concat(children.name)”,我可以假设连接顺序与插入到 JSON 中的表中的顺序相同吗?
同样适用于孩子中的 first(children.name)。
有没有一种方法可以在不使用整个表的 ORDER BY 的情况下对数据进行排序,这从资源的角度来看是极其昂贵的? (尝试执行此操作时,我不断收到“在查询执行期间超出资源”)。
谢谢
【问题讨论】:
【参考方案1】:应在嵌套或重复字段中的记录之间保留顺序。
如果不使用 order by,就无法进行排序。如果您只需要前几个值,您可以尝试使用TOP()
或将其拆分为两个查询并执行WHERE
子句限制。例如。对于第一个查询,您会找到一个分割点(可能使用QUANTILES()
),您添加的第二个查询WHERE field < split_point
。
【讨论】:
以上是关于bigquery重复记录中的数据顺序的主要内容,如果未能解决你的问题,请参考以下文章