且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

《深入理解大数据:大数据处理与编程实践》一一第1章 大数据处理技术简介

更新时间:2022-10-01 10:34:48

第1章 大数据处理技术简介

近年来,大数据技术在全世界迅猛发展,引起了全世界的广泛关注,掀起了一个全球性的发展浪潮。大数据技术发展的主要推动力来自并行计算硬件和软件技术的发展,以及近年来行业大数据处理需求的迅猛增长。其中,大数据处理技术最直接的推动因素,当数Google公司发明的MapReduce大规模数据分布存储和并行计算技术,以及Apache社区推出的开源Hadoop MapReduce并行计算系统的普及使用。为此,本书将重点介绍目前成为大数据处理主流技术和平台Hadoop MapReduce并行处理和编程技术。
本章将简要介绍大数据处理相关的基本概念、技术及发展状况。大数据处理的核心技术是分布存储和并行计算,因此,本章首先简要介绍并行计算的基本概念和技术;在此基础上,将简要介绍MapReduce的基本概念、功能和技术特点;最后本章将进一步简要介绍开源Hadoop系统的基本功能特点和组成。