且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

《R语言与数据挖掘***实践和经典案例》—— 导读

更新时间:2022-10-04 23:15:53

《R语言与数据挖掘***实践和经典案例》—— 导读

前言

数据挖掘自产生以来就是以分析数据、理解数据的实际需求为推动力的,其研究发展也逐步渗透到工业、农业、医疗卫生和商业的实际需求当中。R语言是在S语言的基础上逐步衍生出来的致力于数据统计分析与制图的语言。目前开源软件R也成为了世界上最流行的数据分析和处理工具之一,在学术研究和商业应用中都得到了广大数据分析者的青睐。

本书不是一本入门指导书,没有详细介绍数据挖掘技术的概念和理论,也没有介绍R语言的语言环境和语法规则,每一章节都结合具体例子详细介绍了R语言在数据挖掘的数据分析中的使用,实用性强。本书的读者***具备数据挖掘和R语言的基础知识,通过结合本书介绍的具体案例分析来进一步了解R的对象、函数以及程序包,通过完整的R代码进一步理解数据挖掘技术在R语言工具上的具体实现,包括聚类、分类、关联规则分析、时间序列分析等。非常适合想要进一步学习R语言的人。
本书的代码都是采用R语言编写的,所使用的程序包都可以从CRAN网站上下载。R程序包数量众多,所涵盖的领域也越来越广泛,包括生物学、统计学、遗传学、金融学等。相信使用R语言进行数据挖掘工作也能让读者尽快领略到这门学科的精妙之处。
感谢所有在翻译过程中一直给予支持和鼓励的家人和朋友,感谢所有帮助和指导我的人。由于译者水平有限,本书的翻译难免会出现疏漏,还望各位读者不吝提出意见和建议。

目 录

第1章 简介
1.1 数据挖掘
1.2 R
1.3 数据集
1.3.1 iris数据集
1.3.2 bodyfat数据集

第2章 数据的导入与导出
2.1 R数据的保存与加载
2.2 .CSV文件的导入与导出
2.3 从SAS中导入数据
2.4 通过ODBC导入与导出数据
2.4.1 从数据库中读取数据
2.4.2 从Excel文件中导入与导出数据

第3章 数据探索
3.1 查看数据
3.2 探索单个变量
3.3 探索多个变量
3.4 更多探索
3.5 将图表保存到文件中

第4章 决策树与随机森林
4.1 使用party包构建决策树
4.2 使用rpart包构建决策树
4.3 随机森林
第5章 回归分析
5.1 线性回归
5.2 逻辑回归
5.3 广义线性回归
5.4 非线性回归
第6章 聚类
6.1 k-means聚类
6.2 k-medoids聚类
6.3 层次聚类
6.4 基于密度的聚类