Hadoop
hadoop系列四:MapReduce详解
一、MapReduce概述 1.MapReduce定义 MapReduce是一个分布式运算程序的编程框架,是用户开发“基于Hadoop的数据分析应用”的核心框架。 MapReduce的核心功能是将用户 【阅读更多...】
hadoop系列三:Hdfs详解
一、HDFS概述 1.HDFS定义 HDFS(Hadoop Distributed File System),它是一个文件系统,用于存储文件,通过目录树来定位文件;其次,它是分布式的,有很多服务器联合 【阅读更多...】
hadoop系列二:Hadoop集群搭建
一、准备工作 1.安装centos7虚拟机 2.安装VMTools 3.关闭防火墙 systemctl stop firewalld systemctl disable firewalld 4.设置静 【阅读更多...】
hadoop系列一:Hadoop简介
一、hadoop介绍 HADOOP是apache旗下的一套开源软件平台 HADOOP提供的功能:利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理 HADOOP的核心组件有 HDFS( 【阅读更多...】