大数据大家谈

副标题:无

作   者:张华平 等著

分类号:

ISBN:9787121301810

微信扫一扫,移动浏览光盘

简介

张华平,北京理工大学计算机语言信息处理研究所副所长,兼任网络搜索与挖掘实验室主任,博士,副研究员,汉语分词系统ICTCLAS的创始人,研究生导师,"百星计划”首批入选者,钱伟长中文信息处理科学技术奖一等奖获得者(2010年);同时担任首都师大兼职硕导,辽宁师大客座教授,中国计算机学会高级会员,北京市重点产业知识产权联盟专家,北京市科委评审专家,中关村管委会技术评审专家,先后获得计算所所长特别奖,中科院院长奖。主要研究领域为:自然语言处理、信息检索、网络信息内容安全,先后主持了国家863、242等相关的课题15项,研制的天玑舆情系统已经广泛地应用于中国证监会、银监会、广电、工信部等 单位,已经成为实际的业务系统。

目录

第1章 大数据技术及其相关政策1
1.1 大数据产生的背景1
1.2 大数据的概念和特征3
1.2.1 大数据的概念3
1.2.2 大数据的特征3
1.3 大数据技术发展趋势4
1.3.1 大数据带来的决策方式的革命4
1.3.2 大数据面临的挑战及其对应的技术概览7
1.3.3 大数据架构下的人才需求及产业结构12
1.4 大数据近期政策及其响应14
1.5 本章小结17
参考文献18
第2章 大数据的开放式创新20
2.1 开放数据21
2.2 基于数据安全流通和定价的数据市场23
2.3 开放的基础设施26
2.4 开放的社会化分析服务28
2.5 跨越领域界限的开放数据思维30
2.6 本章小结31
参考文献31
第3章 流动的大数据33
3.1 总论33
3.2 三个案例看互联网34
3.3 “爽”的体验与流动性35
3.4 从个体到关系:笛卡儿两分法的破灭38
3.5 本章小结40
参考文献41
第4章 大数据技术架构与发展趋势42
4.1 大数据技术概览42
4.2 Hadoop生态系统46
4.3 Spark生态系统54
4.4 Spark和Hadoop的性能对比59
4.5 大数据技术前景及未来62
4.6 本章小结64
参考文献66
第5章 大数据语义分析关键技术68
5.1 引言68
5.2 国内外研究现状及发展动态分析71
5.2.1 语义计算71
5.2.2 文本表示72
5.2.3 语义知识本体构建73
5.2.4 情感分析74
5.3 技术框架76
5.3.1 信息客体表示模型77
5.3.2 跨语言本体概念空间的大数据自动构建78
5.3.3 知识抽取与大数据关联分析79
5.3.4 社会个体的语义表示与群体发现79
5.3.5 基于知识本体的语义计算与情感量化分析80
5.3.6 面向公共安全事件的群体态势推演81
5.4 关键科学问题与技术特色82
5.5 研究方法84
5.6 技术路线85
5.6.1 信息客体表示模型85
5.6.2 跨语言本体概念空间的大数据自动构建86
5.6.3 知识抽取与大数据关联分析87
5.6.4 社会个体的语义表示与群体发现89
5.6.5 基于知识本体的语义计算与情感量化分析90
5.6.6 面向公共安全事件的群体态势推演91
5.7 基于知识本体大数据语义分析技术的应用实践93
5.7.1 NLPIR大数据搜索与挖掘共享平台93
5.7.2 JZSearch语义精准搜索引擎101
参考文献108
第6章 社会网络大数据的情感分析与情绪感知技术112
6.1 概述112
6.2 国内外相关研究进展115
6.3 基于微博热点话题的情感分析及其应用116
6.4 基于多维度分析的群体情感摘要抽取及其应用122
6.5 基于统计学习的情绪分类及其时序变化分析应用125
6.6 未来研究方向129
6.7 本章小结130
参考文献130
第7章 大数据时代的数据挖掘与可视化传播133
7.1 大数据时代来临133
7.2 大数据的基本特征134
7.3 大数据挖掘与应用136
7.4 大数据与小数据139
7.5 数据挖掘的基本原理与方法140
7.6 大数据时代的数据可视化技术145
7.7 大数据挖掘和数据可视化工具148
第8章 大规模社会多媒体数据搜索与处理156
8.1 社会多媒体简介156
8.1.1 社会多媒体的发展156
8.1.2 社会多媒体的特点和挑战158
8.2 大规模社会多媒体数据的搜索160
8.3 社会多媒体搜索模式161
8.3.1 基于开放API的搜索161
8.3.2 基于页面的搜索161
8.3.3 基于语义模式的搜索162
8.4 社会多媒体的在线实时搜索架构165
8.4.1 在线分布式实时搜索166
8.4.2 反封堵管理模块167
8.5 大规模社会多媒体的基本处理技术168
8.5.1 社会多媒体存储计算169
8.5.2 社会多媒体数据的特征学习172
8.6 大规模社会多媒体数据的挖掘与应用176
8.6.1 以用户为中心的社会多媒体建模178
8.6.2 以内容为中心的社会多媒体建模180
8.6.3 基于用户和内容的关联挖掘183
8.7 本章小结186
参考文献186
第9章 第四范式下的大数据分析 模型构建189
9.1 第四范式的提出189
9.2 第四范式真的不需要理论吗190
9.2.1 总体问题190
9.2.2 因果关系问题191
9.2.3 效度低191
9.3 如何用理论模型来架构网络数据191
9.4 传播学理论的应用198
9.5 简单的效果分析模型——品牌明星代言调查201
9.6 本章小结203
第10章 大数据视角下的新媒体指数205
10.1 新媒体指数简介205
10.2 大数据视角下的新媒体指数205
10.2.1 从信息源看新媒体指数205
10.2.2 从信息分析方法看新媒体指数207
10.2.3 从数据应用场景看新媒体指数209
10.3 本章小结210
第11章 企业级数据仓库向大数据基础设施转型中的若干问题212
11.1 扩容与换代叠加213
11.2 迁移与新需求交织213
11.3 设备轻型化、平台开源化与团队重构同步214
11.4 “互联网+”与非结构化数据爆炸214
第12章 金融行业大数据综述216
12.1 金融行业大数据相关政策216
12.1.1 中央政府的相关政策216
12.1.2 地方政府的相关政策217
12.2 金融大数据的定义与概述217
12.3 金融大数据的市场分析219
12.4 金融大数据支撑的业务220
12.4.1 第三方支付220
12.4.2 P2P业务222
12.4.3 互联网征信223
12.4.4 众筹225
12.4.5 互联网银行225
12.5 主要互联网金融公司介绍227
12.5.1 阿里巴巴227
12.5.2 腾讯228
12.5.3 百度228
12.5.4 大象金服230
第13章 金融行业大数据应用235
13.1 导言235
13.2 大数据技术在金融行业的实际应用235
13.2.1 第一类应用:个体公司内部数据的动员236
13.2.2 第二类应用:行业数据平台238
13.2.3 第三类应用:行业外部数据在金融行业的应用240
13.2.4 金融行业数据从关系型数据库向大数据技术平台的迁移242
13.3 金融行业的应用对大数据技术提出严格的要求243
13.4 本章小结249
第14章 智慧旅游大数据应用251
14.1 导言251
14.2 旅游舆情分析252
14.2.1 中国旅游目的地网络舆情指数252
14.2.2 舆情分析方法253
14.2.3 舆情热点分析255
14.3 基于大数据的游客行为分析256
14.3.1 旅游大数据预测257
14.3.2 电商OTA数据分析259
14.3.3 交通数据分析259
14.4 基于运营商的LBS数据的游客轨迹分析及用户画像260
14.4.1 游客画像监测260
14.4.2 游客轨迹分析262
14.5 本章小结263

已确认勘误

次印刷

页码 勘误内容 提交人 修订印次

大数据大家谈
    • 名称
    • 类型
    • 大小

    光盘服务联系方式: 020-38250260    客服QQ:4006604884

    意见反馈

    14:15

    关闭

    云图客服:

    尊敬的用户,您好!您有任何提议或者建议都可以在此提出来,我们会谦虚地接受任何意见。

    或者您是想咨询:

    用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问

    Video Player
    ×
    Audio Player
    ×
    pdf Player
    ×
    Current View

    看过该图书的还喜欢

    some pictures

    解忧杂货店

    东野圭吾 (作者), 李盈春 (译者)

    loading icon