纵有疾风起
人生不言弃

hadoop

Hadoop学习笔记—16.Pig框架学习-起风网

Hadoop学习笔记—16.Pig框架学习

男闺蜜尚淼阅读(298)评论(0)

一、关于Pig:别以为猪不能干活 1.1 Pig的简介   Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-LIKE语言叫Pig Latin,该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapRedu...

Hadoop学习笔记—18.Sqoop框架学习-起风网

Hadoop学习笔记—18.Sqoop框架学习

Queen阅读(304)评论(0)

一、Sqoop基础:连接关系型数据库与Hadoop的桥梁 1.1 Sqoop的基本概念     Hadoop正成为企业用于大数据分析的最热门选择,但想将你的数据移植过去并不容易。Apache Sqoop正在加紧帮助客户将重要数据从数据库移到...

Hadoop学习笔记—17.Hive框架学习-起风网

Hadoop学习笔记—17.Hive框架学习

vicky阅读(316)评论(0)

一、Hive:一个牛逼的数据仓库 1.1 神马是Hive?   Hive 是建立在 Hadoop 基础上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的...

Hadoop学习笔记—19.Flume框架学习-起风网

Hadoop学习笔记—19.Flume框架学习

Bodyontheocean阅读(299)评论(0)

START:Flume是Cloudera提供的一个高可用的、高可靠的开源分布式海量日志收集系统,日志数据可以经过Flume流向需要存储终端目的地。这里的日志是一个统称,泛指文件、操作记录等许多数据。 一、Flume基础理论 1.1 常见的分...

Hadoop入门学习笔记总结系列文章导航-起风网

Hadoop入门学习笔记总结系列文章导航

deee阅读(287)评论(0)

一、为何要学习Hadoop?   这是一个信息爆炸的时代。经过数十年的积累,很多企业都聚集了大量的数据。这些数据也是企业的核心财富之一,怎样从累积的数据里寻找价值,变废为宝炼数成金成为当务之急。但数据增长的速度往往比cpu和内存性能增长的速...

Hadoop学习笔记—21.Hadoop2的改进内容简介-起风网

Hadoop学习笔记—21.Hadoop2的改进内容简介

vicky阅读(362)评论(0)

Hadoop2相比较于Hadoop1.x来说,HDFS的架构与MapReduce的都有较大的变化,且速度上和可用性上都有了很大的提高,Hadoop2中有两个重要的变更: (1)HDFS的NameNode可以以集群的方式布署,增强了NameN...