海量编程文章、技术教程与实战案例

网站首页 > 技术文章 正文

大数据概述及Hadoop入门

yimeika 2025-05-23 21:54:07 技术文章 5 ℃

online-school

本课程是大数据学科的入门教程,将会为您讲述大数据概述和Hadoop的分布式集群搭建,对大数据做了简单的介绍并讲述了开源大数据框架Hadoop的使用和原理。对Hadoop生态圈的其他开源项目做了简单的介绍,以帮助我们构建大数据的知识图谱。 Hadoop实现了一个分布式文件系统,简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的硬件上。HDFS放宽了POSIX的要求,可以以流的形式访问文件系统中的数据。Hadoop中的分布式计算框架,使的分布式编程简单,能够很好的处理存储在hdfs上的数据。

最近发表
标签列表