目前,国内的中文编码主要有 GBK 编码和 UTF-8 编码,有时会遇到编码错误造成
4)缺失值用 NA 表示,统计计算中经常会遇到缺失值,表示记录丢失、因为错误
而不能用、节假日没有数据等,注意: R 支持特殊的 Inf 值,这是实数型值,表示
量都有变量名,注意,变量名必须以字母、数字、下划线和句点组成, 变量名的
据类型的判断,也是一个重要的内容,虽然简单,但后面很容易因为不注意而报错,
这里,需要注意几点:
同时,给大家补充一个内容,rep(c(1,3), c(2,4))需要利用 R 的一般向量化规则,
对此方法,需要注意一点,即向量的连接,哪个长则以哪个为准
将短的向量 x1 进行一轮重复,形成等长向量,然后进行计算,当然,注意一点,
这里注意,在 R 语言里面,Warning 警告不算报错,继续运行即可,只有 Error 的
出现才会认为报错。
这个也是向量循环的一个应用,R 里面会自动进行循环补充,向量与标量的运算是
这里注意一个符号,在 R 里面,=表示赋值的含义,而==表示判断是否相等,其最
所以第二部分没有参加计算,否则的话第二部分的计算会因为函数自变量范围错误
函数 identical(x,y)比较两个 R 对象 x 与 y 的内容是否完全相同,这里需要注意
函数 duplicated返回每个元素是否为重复值的结果,注意一点,当一个变量第
注意,空字符串并不能自动认为是缺失值,字符型的缺失值仍用 NA 表示。
collapse=参数可以把字符型向量的各个元素连接成一个单一的字符串。
paste(c("a", "b", "c"), collapse=""),最后的结果相当于"abc"。
注意:这两个 函 数 可 以 用 于 不 区 分 大 小 写 的 比 较 , 不 论 x 的 值 是 'JAN',
两个矩阵对应元素相乘(注意这不是线性代数中的矩阵乘法), 用/表示两个矩阵对
用%*%表示矩阵乘法而不是用*表示,同时注意矩阵乘法要求左边的矩阵的列数等
这里需要注意一点,不要在内置数据集上修改内容,一旦修改,它会永远保存下
函数 data.frame可以生成数据框,注意一点,data.frame函数会将字符型列
下面,补充一个比较常用的函数家族 apply家族,后面经常会用到,所以给大家
补充一下。对于 apply 函数,主要用于数据汇总,关于数据汇总,就是按照分类水
这里需要注意一点,在 FUN 部分,应该写 sum,而不是 sum,当然,我们可以