网站首页 > 技术文章 正文
Sqoop(SQL to Hadoop)是一个用来将 Hadoop 和关系型数据库中的数据相互转移的工具 ,可以将一个关系型数据库(例如 : MySQL、 Oracle 、 PostgreSQL 等)中的数据导入到 Hadoop 的 HDFS 中,也可以将HDFS 的数据导入到关系型数据库中。
Sqoop 工作机制利用 MapReduce 分布式批处理,加快了数据传输速度,保证了容错性。
选择 Sqoop 的理由通常基于三个方面的考虑:
(1)它可以高效地利用资源,可以通过调整任务数来控制任务的并发度。
(2)它可以自动地完成数据类型映射与转换。
(3)它支持多种数据库,比如 MySQL 、 Oracle 和 PostgreSQL 等数据库。
Sqoop发展至今主要演化了两大版本,Sqoop1和 Sqoop2。 Sqoop1的最高版本为 1.4.7,如图所示。而Sqoop1.99.7 属于 Sqoop2。 Sqoop1和Sqoop2是两个完全不兼容的版本。
猜你喜欢
- 2025-05-21 你不知道的PostgreSQL数据库安装及实现跨库查询PG和Oracle
- 2025-05-21 PostgreSQL、MySQL 数据库被入侵究竟有多么普遍?有人做了一项实验
- 2025-05-21 史上最全:PostgreSQL DBA常用SQL查询语句(建议收藏学习)
- 2025-05-21 PostgreSQL 配置文件核心参数深度解析与实战优化
- 2025-05-21 postgresql的6种索引介绍
- 2025-05-21 PostgreSQL
- 2025-05-21 PostgreSQL是不是你的下一个JSON数据库?
- 最近发表
- 标签列表
-
- axure 注册码 (25)
- exploit db (21)
- mutex_lock (30)
- oracleclient (27)
- think in java (14)
- javascript权威指南 (19)
- nfs (25)
- componentart (17)
- yii框架 (14)
- springbatch (28)
- oracle数据库备份 (25)
- iptables (21)
- 自动化单元测试 (18)
- python编写软件 (14)
- dir (26)
- connectionstring属性尚未初始化 (23)
- output (32)
- panel滚动条 (28)
- centos 5 4 (23)
- sql学习 (33)
- dfn (14)
- http error 503 (21)
- pop3服务器 (18)
- 图表组件 (17)
- android退出应用 (21)