我一直在关注这篇关于如何用Hive分析twitter数据的文章:http://blog . cloud era . com/blog/2012/11/analyzing-Twitter-data-with-Hadoop-part-3-query-semi-structured-data-with-Hive/
我设置了水槽来收集twitter数据并写入HDFS。我已经设置了一个指向同一HDFS位置的配置单元表。
当我从hive运行这样的命令时:SELECT entities.user_mentions[0]。screen_name来自推文;
我得到如下响应:OK耗时:0.16秒。
不管我运行什么查询,我都不会得到任何结果。
由于我是Hive新手,我希望在Hive命令行中看到结果,还是必须从mySQL中挖掘结果。mySQL是元存储数据库。
当hive数据使用目录进行分区时,需要对其进行检索以查看分区/分区。因此,运行msck修复表your_table_name
应该可以解决您的问题。