Kafka + Spark + Hbase + ElasticSearch 一个练手的项目 抓取网页上的数据进行分析,分析完成后加入到Kafka中,进行Hbase持久化存储和ElasticSearch的分词查询功能。 需要的部件 1、抓取客户端,使用HttpClient进行抓取 2、Spark数据清洗的客户端 3、Hbase仓库持久化 4、ElasticSearch分词查询 Hbase仓库持久化