Hive 使用问题记录(未完...)
Posted 学而不思则罔,思而不学则殆
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive 使用问题记录(未完...)相关的知识,希望对你有一定的参考价值。
group by 中出现的字段不能再select 后面单独显示,必须配合函数使用
上面中的
select id,collect_set(time) as t from t_action_login where time<=‘20150906‘ group by id
总结:
- Hive不允许直接访问非group by字段;
- 对于非group by字段,可以用Hive的collect_set函数收集这些字段,返回一个数组;
- 使用数字下标,可以直接访问数组中的元素;
分区是以文件夹的形式,桶是以文件的形式
关于桶的操作 http://blog.csdn.net/lzm1340458776/article/details/43272379
以上是关于Hive 使用问题记录(未完...)的主要内容,如果未能解决你的问题,请参考以下文章
[未解决问题记录]python asyncio+aiohttp出现Exception ignored:RuntimeError('Event loop is closed')(代码片段