且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

R 实例——预测海藻数量之问题描述与目标、数据集格式| 学习笔记

更新时间:2022-09-05 14:30:47

开发者学堂课程【大数据之 R 语言速成与实战R实例——预测海藻数量之问题描述与目标、数据集格式】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/363/detail/4344


R实例——预测海藻数量之问题描述与目标、数据集格式

 

目录

一.问题描述与目标

二.数据集的导入

 

一.问题描述与目标

--某些高浓度的有害藻类对河流生态环壙的强大破坏是一个严重的问题,它们不仅破坏流的生物,也破坏水质。能够监测井在早眀对海藻的繁殖进行预测对提高河流质量是很有必要的。

--针对这一问题,在大约一年的时间内,在不同时间收集了欧洲多条河流的水样,对于每个水样,测定了它们的不同化学性质以及7种有害藻类的存在频率,其他的些特性,如收集的季节、河流大小和水流的速度也收集了来。

--本案例研究的主要动机之一是化学监测价格便宜,并且易于自动化,而通过分析生物样品来识别水中的藻类要涉及显微镜检验,需要训练有素的工作人员,因此既昂贵又缓慢。

--因此构建一个可以基于化学性质来准确预测藻类的模型有动于建立益测有害蘂类的廉价自动化系统。

 

二.数据集的导入

--第一个数据集有200个水样,每条记录是同一条河流在该年同一季度的三个月收集水样的平均值。

--第二个数据集由140个额外观测值构成,基本结构同第一个数据集一样,但它不包含7种藻类的频率数目,这些额外的观测值可以视为测试集。

 

--实验的目标:

预测140个水样中7种类的频率

head (algae)eason size speed mxPH mno2 C1 NO3medium8.009.860,8006.238578.000105.000170.00050,02 spring small medium8.358.057.7501.288370.000428.750558.7501.3sma11 medium8.1011.440.0205.330346.667125.667187.05715.64 spring small medium8.074.877.3642.30298.18261.182138.7001.45 auturn small mediu8.069.055.35010.416233.70058.22297.58010.56 winter sma11Hh8.2513.165.7509.248430.00018.25056.66728.433.353.61.90.00.00.09.61.40.022.512.62.9

 

示例:

instan. packages (nR)Error in install packages objectDilt' not foundliarary(ONns)Loading required packageoading required packpackage

nstall packages(nRin install packages object,liarary(ONe)aas builturder R version 1.2.5