且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

《机器学习与数据科学(基于R的统计学习方法)》——1.11 小结

更新时间:2022-09-12 20:13:53

本节书摘来异步社区《机器学习与数据科学(基于R的统计学习方法)》一书中的第1章,第1.11节,作者:【美】Daniel D. Gutierrez(古铁雷斯),更多章节内容可以访问云栖社区“异步社区”公众号查看。

1.11 小结

在本章中,我们对机器学习领域(也被称为统计学习)进行了介绍。另外,我们做好了开始一个数据科学项目的准备,并提供了一个路线图来作为本书的向导。建立一个机器语言解决方案的第1步是探索以各种常用格式连接数据集的方法。在第2章中,你将看到很多连接数据的例子,可以加入到你的数据科学工具箱中。

下面是本章知识点小结:

简要介绍了接下去要学习的两种机器学习类型:监督学习和非监督学习。
使用Kaggle数据科学挑战赛网站,介绍几个用机器学习解决实际问题的案例以及一些其他领域未来可能解决的问题。
学习了数据科学处理时涉及的步骤。
讨论了如何才能成为一名资深的数据科学家,以及需要逐渐掌握的数学基本功。
本书基于R统计环境编写,所以我们讨论了这个重要的工具,以及如何在RStudio环境下使用它。
讨论了在机器学习中R包的威力,并介绍如何使用多种R包来处理数据集。
最后,我们讨论了如何在生产系统中使用R,这也是很多项目的终极目标。