博客
关于我
《大数据: Hadoop(HDFS) 读写数据流程分析》
阅读量:256 次
发布时间:2019-03-01

本文共 445 字,大约阅读时间需要 1 分钟。

HDFS数据写入流程概述

Hadoop Distributed File System (HDFS) 作为一种分布式存储系统,其数据写入流程涉及多个关键组件和步骤。以下将从客户端和服务端两个维度详细阐述HDFS的数据写入过程。

  • 1. 服务端启动HDFS组件
  • a. NameNode (NN) 和 DataNode (DN) 的启动
  • b. NameNode 处理高级功能
  • 2. 客户端初始化文件系统客户端
  • a. 客户端与 NameNode 连接
  • b. 客户端获取文件系统信息
  • 3. 数据上传前的准备工作
  • a. 文件路径校验
  • b. 权限检查
  • 4. 数据块大小和副本数配置
  • a. 客户端设置默认块大小(0-128M)
  • b. 自定义副本数(默认为3)
  • 5. 数据块上传过程
  • a. NameNode 返回目标 DataNode 节点列表
  • b. 客户端选择最近网络的 DataNode 进行数据传输
  • 6. 数据块传输与写入
  • a. DataNode 接收并存储数据块
  • b. 数据块校验与复制(根据副本数)

转载地址:http://lkut.baihongyu.com/

你可能感兴趣的文章
P1908 逆序对
查看>>
P2158 [SDOI2008]仪仗队
查看>>
P2161 [SHOI2009]Booking 会场预约
查看>>
P2260 [清华集训2012]模积和
查看>>
P2x与P3x的区别
查看>>
P3203 [HNOI2010]弹飞绵羊 —— 懒标记?分块?
查看>>
P3240 [HNOI2015]实验比较 树形DP
查看>>
SpringBoot中集成Minio高性能分布式存储文件服务入门
查看>>
P3383 素数筛
查看>>
P3455 [POI2007]ZAP-Queries
查看>>
P3950部落冲突
查看>>
P4 Tutorials Flowlet Switching
查看>>
P4313 文理分科
查看>>
P4491 [HAOI2018] 染色
查看>>
SpringBoot中集成LiteFlow(轻量、快速、稳定可编排的组件式规则引擎)实现复杂业务解耦、动态编排、高可扩展
查看>>