两个好东西:

radian. 号称是「A 21 century R console」.

其实 21 世纪也都过了 20 年了,下个月 R 4.0 也将赶着 20 周年的日子发布。但这都不是重点。重点是每次为了运行一两行指令而打开「笨重」的 IDE 从来都不是我所喜欢的操作行为。之前用过 console 里的 R,但总觉得差点意思。如果说用一张图来概括 radian 的优点,那就是这样的:

img

另外一个是老朋友 janitor package 了,曾经在看 R for Data Science 的时候用过一阵子,但是 package 这种东西你看到了不用就废了,或者用过一次之后隔一段时间不用,也等于废了。于是抽空在 radian 里把几个主要 functions 过了一下,觉得还是在处理「比较规整的、网上下载的数据」的时候比较方便。总结了一下功用:

  • clean_names(). 转为小写+下划线的变量名格式,能够处理特殊符号。
  • tably(). 输入 vector 输出频率和频数统计 table.
    • 另外如果含有 NA 则不会计入统计。
    • 可以用 remove_empty(x, which = c("rows", “cols”)) 去除整行和(或)整列为 NA的数据。
    • tably() 后跟随多个 vectors 则输出 crosstabulation 结果。
  • get_dupes(x). 输入 data frame 和 变量名 x,输出重复的数据(行)。
  • excel_numeric_to_data(). 将某些载入 Excel 文件时被转化的日期还原为 Date 类型。