提问者:小点点

来自HDFS Twitter数据的Hive查询


我一直在关注这篇关于如何用Hive分析twitter数据的文章:http://blog . cloud era . com/blog/2012/11/analyzing-Twitter-data-with-Hadoop-part-3-query-semi-structured-data-with-Hive/

我设置了水槽来收集twitter数据并写入HDFS。我已经设置了一个指向同一HDFS位置的配置单元表。

当我从hive运行这样的命令时:SELECT entities.user_mentions[0]。screen_name来自推文;

我得到如下响应:OK耗时:0.16秒。

不管我运行什么查询,我都不会得到任何结果。

由于我是Hive新手,我希望在Hive命令行中看到结果,还是必须从mySQL中挖掘结果。mySQL是元存储数据库。


共1个答案

匿名用户

当hive数据使用目录进行分区时,需要对其进行检索以查看分区/分区。因此,运行msck修复表your_table_name应该可以解决您的问题。