新媒体数据挖掘——基于R语言

副标题:无

作   者:王小峰

分类号:

ISBN:9787302493228

微信扫一扫,移动浏览光盘

简介


计算传播领域尤其是新媒体数据挖掘方向一直缺乏系统的教材,《新媒体数据挖掘——基于R语言》旨在为计算传播和计算社会科学领域的读者提供学习R编程语言和开发平台的捷径,希望能够填补这方面的空白。“让学习层次变得更宏观,让学习过程变得更轻松,让学习所获变得更通用”是《新媒体数据挖掘——基于R语言》的编写理念与特色。《新媒体数据挖掘——基于R语言》首先剖析了社会科学研究范式的革新,介绍了R语言的作用和特点;然后系统讲解了编程语言的通用学习方法和R语言的基本组成;*后展开实战应用,包括网络数据采集、文本挖掘和情感分析、社会网络分析、社交编程平台协作等非常有趣且有意义的内容。《新媒体数据挖掘——基于R语言》适合作为计算传播和计算社会科学领域相关专业本科和研究生教材。高职高专学校也可以选用部分内容开展教学。《新媒体数据挖掘——基于R语言》还适合作为计算传播学和计算社会科学科研人员的自学书籍。《新媒体数据挖掘——基于R语言》课件可通过网站http://www.tupwk.com.cn/downpage免费下载。

目录


第1章 为什么学习R语言 1

1.1R是什么2

1.1.1 R是一款优秀的现代科研

软件 2

1.1.2 R的优势与不足 3

1.1.3 R和Python的区别 3

1.2 计算社会科学的兴起——以计算

传播学为例 4

1.2.1 什么是计算社会科学 4

1.2.2 计算传播学的起源和概念 7

1.3R在计算传播学中的典型应用 9

1.3.1 用R进行文本分析初探 9

1.3.2 互联网在线数据收集 10

1.3.3 社会网络分析 12

1.4 总结与提高 13

1.5 习题14

第2章 R语言开发环境 15

2.1R的获取、安装和基本使用 16

2.1.1 RGui的下载与安装 16

2.1.2 RGui的使用介绍 19

2.1.3 示例:使用RCommander实现

统计功能 21

2.1.4 R的内置数据集和扩展

功能包 26

2.1.5 R的帮助系统 27

2.1.6 R的工作空间和工作目录 27

2.2R的IDE开发环境——RStudio 27

2.2.1 RStudio的下载和安装 28

2.2.2 RStudio的*简标准操作 28

2.2.3 RStudio的工作界面 31

2.2.4 RStudio的用户自定义配置 32

2.3示例:我的*个R项目

“网页爬虫” 32

2.3.1 组织项目需求 33

2.3.2 新建项目环境 33

2.3.3 编写应用程序代码并运行 34

2.3.4 执行代码并根据实际结果修改

和再次运行 35

2.4 总结与提高 37

2.5 习题38

第3章 R语言基础——数据 39

3.1无障碍学习编程语言的两个

诀窍 40

3.1.1 从“哲学”的角度了解编程

语言 40

3.1.2 从“语言学”的角度学习编程

语言语法 41

3.2 R的基本数据类型(数值、字符、

逻辑) 42

3.2.1 基本数据类型 42

3.2.2 数据类型的两个属性:模式和

长度 43

3.2.3 两个特殊常量 44

3.3R的复合数据类型 45

3.3.1 向量 46

3.3.2 矩阵 46

3.3.3 数组 47

3.3.4 数据框 48

3.3.5 列表 49

3.3.6 因子 51

3.3.7 时间序列 52

3.4数据的导入和导出 54

3.4.1 数据的导入 55

3.4.2 数据的导出 59

3.5总结与提高 59

3.6习题 59

第4章 R语言基础——代码 61

4.1 R代码的基本单位:语句=

数据 运算符; 62

4.1.1 基本运算符 62

4.1.2 表达式、语句、语句块 65

4.2R的流程控制 66

4.2.1 顺序结构 66

4.2.2 选择/分支结构 67

4.2.3 循环结构 70

4.3R代码复用——函数和过程 73

4.3.1 “模块化”编程思想与函数 73

4.3.2 函数的定义与调用 75

4.3.3 过程的定义与调用 76

4.4 总结与提高 77

4.5 习题77

第5章 R绘图——数据可视化呈现 79

5.1 概述80

5.2R的绘图函数 81

5.2.1 图形窗口绘图操作函数(图形的

创建和保存) 82

5.2.2 R图形参数 83

5.2.3 高级绘图函数 86

5.2.4 低级绘图函数 89

5.3常用的R可视化功能包 91

5.3.1 ggplot2功能包 91

5.3.2 rCharts功能包 93

5.3.3 plotly功能包 95

5.3.4 map功能包 96

5.4 总结与提高 97

5.5 习题98

第6章 网络数据程序化采集 99

6.1网络数据的获取途径及相关

基础知识 100

6.1.1 Web数据的获取途径 100

6.1.2 Web的结构与原理 101

6.2使用R收集Web数据 106

6.2.1 获取静态Web内容 107

6.2.2 网络数据的应用级API采集

(以豆瓣为例) 109

6.2.3 获取动态Web内容 111

6.3 总结与提高 114

6.4 习题114

第7章 文本挖掘和情感分析 115

7.1R环境下的文本挖掘 116

7.1.1 中文分词 117

7.1.2 分词包jiebaR的使用 118

7.1.3 词云包wordcloud2的使用 127

7.2情感分析 129

7.2.1 情感分析概述 129

7.2.2 情感分析的简单实现 131

7.3总结与提高133

7.4习题 133

第8章 社会网络分析 135

8.1网络社会与社会网络分析136

8.1.1 社会的构成 136

8.1.2 网络社会与社会网络分析 137

8.1.3 现代网络社会与社会网络

分析 140

8.1.4 网络与关系的描述 142

8.2社会网络分析的发展、意义

和步骤 143

8.2.1 社会网络分析的三个方向 143

8.2.2 社会网络分析的几个主要

步骤 144

8.2.3 社会网络分析的几个重要

指标 144

8.3社会网络分析的常用工具 146

8.3.1 NodeXL的使用 146

8.3.2 R的iGraph功能包 147

8.3.3 UCINET 149

8.4总结与提高149

8.5 习题150

第9章 社交编程平台:GitHub 151

9.1自己架设PHP实验站点并深入

探索RCurl功能包152

9.1.1 基于PHP网页服务器端技术

架设网站实验环境 152

9.1.2 深入探索RCurl包 157

9.2挖掘和分析社交编程平台GitHub的

信息 162

9.2.1 GitHub的基本使用 162

9.2.2 探索GitHubAPI165

9.3总结与提高175

9.4 习题175

附录177

附录1 计算社会科学宣言 177

附录2 计算传播学:宣言与版图 182

附录3 服务器版RStudio的安装与

配置(基于Ubuntu14.04)191

附录4 RStudio的常用快捷键192

附录5 使用devtools包从GitHub

中安装R包 196

附录6 使用Rtools自制R扩展

软件包 197

参考文献203



已确认勘误

次印刷

页码 勘误内容 提交人 修订印次

新媒体数据挖掘——基于R语言
    • 名称
    • 类型
    • 大小

    光盘服务联系方式: 020-38250260    客服QQ:4006604884

    意见反馈

    14:15

    关闭

    云图客服:

    尊敬的用户,您好!您有任何提议或者建议都可以在此提出来,我们会谦虚地接受任何意见。

    或者您是想咨询:

    用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问

    Video Player
    ×
    Audio Player
    ×
    pdf Player
    ×
    Current View

    看过该图书的还喜欢

    some pictures

    解忧杂货店

    东野圭吾 (作者), 李盈春 (译者)

    loading icon