Hadoop的I/O 操作是什么


Hadoop的I/O 操作是什么,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。检测数据是否损坏在数据第一次引入系统时计算校验和并在数据通过一个不可靠的通道进行传输时再次计算校验和校验和也是可能损坏的错误检测码CRC-32 HDFS 使用的是一个更有效的变体CRC-32CHDFS 的数据完整性对写入的所有数据计算校验和,并在读取数据时验证校验和hadoop fs -checksum 检查一个文件的校验和LocalFileSystem 执行客户端的校验和验证ChecksumFileSystem优势:减少存储文件所需要的磁盘空间,并加速数据在网络和磁盘上的传输所有压缩算法都需要权衡空间/时间bzip2的压缩能力强于gzip,但速度慢codec最好使用原生类库,而不是Java实现大量压缩和解压缩,可以考虑使用CodecPool压缩和输入分片在MapReduce 中使用压缩对map任务输出进行压 香港云主机缩定义:序列化是指将结构化对象转化为字节流以便在网络上传输或写到磁盘进行永久存储的过程,反序列化是指将字节流转回结构化对象的逆过程序列化用于分布式数据处理的两大领域:进程间通信和永久存储Writable 接口
IntWritableWritableComparableorg.apache.hadoop.ioVIntWritable VLongWritable (变长格式会更节省空间)Text 最大2GB关于SequenceFile适合二进制类型的数据hadoop fs -text numbers.seq|head关于MapFileMapFile 是已经排过序的SequenceFile,它有索引,所以可以按键查找。索引自身就是一个SequenceFile,包含了map中的一小部分健Avro 数据文件以上几个都是面向行的数据格式,还有面向列的格式 RCFile看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注开发云行业资讯频道,感谢您对开发云的支持。

相关推荐: 电脑使用HDMI线连接电视后没有声音怎么解决

今天小编给大家分享一下电脑使用HDMI线连接电视后没有声音怎么 香港云主机解决的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。1、右键桌面右下角的…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

Like (0)
Donate 微信扫一扫 微信扫一扫
Previous 08/13 10:20
Next 08/13 10:20

相关推荐