Hadoop生态系统

副标题:无

作   者:Kevin

分类号:

ISBN:9787512395985

微信扫一扫,移动浏览光盘

简介


本书每一章都介绍了不同的主题(例如核心技术或数据传输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说,使用Hadoop是一个全新的挑战,但如果有了这本便利的参考书,你将很容易领会使用Hadoop的精妙所在。

主要包括如下主题:

核心技术。Hadoop分布式文件系统(HDFS)、MapReduce、YARN和Spark。

数据库和数据管理。Cassandra、HBase、MongoDB和Hive。

序列化。Avro、JSON和Parquet。

管理和监视。Puppet、Chef、Zookeeper和Oozie。

分析辅助。Pig、Mahout和MLLib。

数据传输。Scoop、Flume、distcp和Storm。

安全、访问控制和审计。Sentry、Kerberos和Knox。

云计算和虚拟化。Serengeti、Docker和Whirr。


目录


前言 1

第1章关键技术 7

11 Hadoop分布式文件系统(HDFS) 8

12 MapReduce 11

13 YARN 13

14 Spark 15

第2章数据库及数据管理 17

21 Cassandra 19

22 HBase 21

23 Accumulo 24

24 Memcached 26

25 Blur 28

26 Solr 30

27 MongoDB 32

28 Hive 34

29 Spark SQL ( 前身是 Shark) 36

210 Giraph 38

第3章序列化 41

31 Avro 43

32 JSON 46

33 Protocol Buffers (protobuf) 48

34 Parquet 50

第4章管理与监控 53

41 Ambari 54

42 HCatalog 56

43 Nagios 58

44 Puppet 59

45 Chef 61

46 ZooKeeper 63

47 Oozie 66

48 Ganglia 68

第5章分析辅助 69

51 MapReduce 接口69

52 分析库 70

53 Pig 72

54 Hadoop Streaming 74

55 Mahout 76

56 MLLib 78

57 Hadoop 图像处理接口(HIPI) 80

58 SpatialHadoop 81

第6章数据传输 83

61 Sqoop 85

62 Flume 87

63 DistCp 89

64 Storm 90

第7章安全、访问控制和审计 93

71 Sentry 95

72 Kerberos 97

73 Knox 99

第8章云计算和虚拟化 101

81 Serengeti 103

82 Docker105

83 Whirr 107


已确认勘误

次印刷

页码 勘误内容 提交人 修订印次

Hadoop生态系统
    • 名称
    • 类型
    • 大小

    光盘服务联系方式: 020-38250260    客服QQ:4006604884

    意见反馈

    14:15

    关闭

    云图客服:

    尊敬的用户,您好!您有任何提议或者建议都可以在此提出来,我们会谦虚地接受任何意见。

    或者您是想咨询:

    用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问

    Video Player
    ×
    Audio Player
    ×
    pdf Player
    ×
    Current View

    看过该图书的还喜欢

    some pictures

    解忧杂货店

    东野圭吾 (作者), 李盈春 (译者)

    loading icon