1.将图片中的数据框写成代码
library(tidyr)
df <- tibble(Medical.Science=c("clinical medicine","Nursing","Basic Medcine","pharmacy"),
score=c(1,2,NA,4))
print(df)
2.提取含有Nursing的行
df[which(df=="Nursing"),]
3.输出所有列名
colnames(df)
# 使用names()函数默认就是列名,可以少打三个字母哦~
names(df)
4.改名
colnames(df)[2] <- "Scale"
print(df)
统计Medical.Science列中元素出现的次数
suppressMessages(library(tidyverse))
# tidyverse就是他将自己所写的包整理成了一整套数据处理的方法,
# 包括ggplot2,dplyr,tidyr,readr,purrr,
# tibble,stringr, forcats
table(df$Medical.Science)
df %>% count(Medical.Science)
我们处理数据的时候,最好把处理后的数据还原成数据框或者向量, 这样会省点事情,而且ggplot2里几何函数和统计函数其实差别就在count这里,然后这里其实还会有报错的时候,如果使用rename函数命名新列名=旧列名,输入反了会报一个无瓜的错误:
# Error: Can't rename columns that dont exist
# x Column scale doesnt exist
# Run rlang: last_error@ to see where the error occurred
所以这种报错在熟悉一下,前五道题旧没有什么可以扩展的了