且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

R 基本数据管理--如何处理缺失值、日期值得使用、数据类型转换|学习笔记

更新时间:2022-09-02 16:00:48

开发者学堂课程【大数据之R语言速成与实战R 基本数据管理--如何处理缺失值、日期值得使用、数据类型转换】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/363/detail/4334


R 基本数据管理--如何处理缺失值、日期值得使用、数据类型转换

 

内容简介:

一、如何处理缺失值-

二、日期值的使用

三、数据类型的判断及转换

四、数据排序

 

一、如何处理缺失值(不能用来比较)

>manager <-c(1,2,3,4,5)

>date<-c("10/24/08",'10/28/08","10/1/08","10/12/08","5/1/09")

>country <-c("US","US","UK","UK","UK")

>gender <- c("M","F","F","M","F")

>age <- c(32,45,25,39,99)

>q1<-c(5,3.3.3.2)

>q2<-c(4.5.5.,3.2)

>q3<-c(5,2,5,4,1)

>q4<-c(5,5,5,NA,2)

>q5<-c(5,5,2,NA,1)

>survey<-data.frame(manager,date,country,gender,age,q1,q2,q3,q4, q5,stringsAsFactors=FALSE)

>is.na(survey[,6:10])

>survey[4,9]

>survey[4,9]==NA

>is.na(survey[4,9])

 

二、日期值的使用

> mydate <- as.Date("2016-01-20")

> mydate

[1]"2016-01-20"

>mydate1 <- c("01/05/2006","01/29/2007")

> date <- as.Date(mydatel,"%m/%d/%Y")

> date

[1] "2006-01-05""2007-01-29"

> Sys.Date()

[1] "2016-01-20"

> date()

[1] "wed Jan 20 21:33:51 2016"

> today<-Sys.Date()

>today

[1]"2016-01-20"

>format(today,format="%B %d %Y")

[1]"一月 20  2016"

>format(today,format="%y")

[1]"16"

>startdate <- as.Date("2003-01-23")

>enddate<- as.Date("2011-09-18")

>days <- enddate- startdate

>days

Time difference of 3160 days

 

三、数据类型的判断及转换

>a<-c(2,5,7)

>a

[1] 2 5 7

> is.numeric(a)

[1] TRUE

>b<-as.character(a)

>b

[1] "2" "5" "7"

> is.numeric(b)

[1] FALSE

is.vector(b)

[1] TRUE

> 

 

四、数据排序

> datal <- survey[order(survey$gender,survey$age),]

> datal

> data <- survey[order(-survey$age),]

> data