代码作业_01-05 - R训练营笔记库

1.将图片中的数据框写成代码

library(tidyr)
df <- tibble(Medical.Science=c("clinical medicine","Nursing","Basic Medcine","pharmacy"),
       score=c(1,2,NA,4))
print(df)

2.提取含有Nursing的行

df[which(df=="Nursing"),]

3.输出所有列名

colnames(df)
# 使用names()函数默认就是列名，可以少打三个字母哦~
names(df)

4.改名

colnames(df)[2] <- "Scale"
print(df)

统计Medical.Science列中元素出现的次数

suppressMessages(library(tidyverse))
# tidyverse就是他将自己所写的包整理成了一整套数据处理的方法，
# 包括ggplot2，dplyr，tidyr，readr，purrr，
# tibble，stringr, forcats
table(df$Medical.Science)
df %>% count(Medical.Science)

我们处理数据的时候，最好把处理后的数据还原成数据框或者向量，这样会省点事情，而且ggplot2里几何函数和统计函数其实差别就在count这里，然后这里其实还会有报错的时候，如果使用rename函数命名新列名=旧列名，输入反了会报一个无瓜的错误：

# Error: Can't rename columns that dont exist
# x Column scale doesnt exist
# Run rlang: last_error@ to see where the error occurred

所以这种报错在熟悉一下，前五道题旧没有什么可以扩展的了