R语言数据处理方法~小结
(1)dplyr 可以连接数据库 (1)使用与本地数据框操作一样的语法 (3)只支持生成SELECT语句 (4)支持SQLite,PostgreSQL/Redshift,MySQL/MariaDB,BigQuery,MonetDB 3.7 利用窗体函数变换数据 4. tidyr tidyr包的作者也是Hadley Wickham,与dplyr包结合使用,是reshape2包的替代。(先挖坑...) 5. 字符串处理 5.1 字符个数 nchar nchar()能够获取字符串的长度,它和length()的结果是有区别的。 paste()不仅可以连接多个字符串,还可以将对象自动转换为字符串再相连,另外它还能处理向量,所以功能更强大。 paste默认的分隔符是空格,必须指定sep=""。还有一个collapse参数,可以把这些字符串拼成一个长字符串,而不是放在一个向量中。 (1)sub 只做一次替换(不管有几次匹配) (2)gsub 把满足条件的匹配都做替换 虽然sub和gsub是用于字符串替换的函数,但严格地说R语言没有字符串替换的函数,因为R语言不管什么操作对参数都是传值不传址。所以原字符串并没有改变,要改变原变量我们只能通过再赋值的方式。 sub和gsub函数可以使用提取表达式(转义字符+数字)让部分变成全部 (1)grep 返回匹配项的下标 (2)grepl 返回所有查询结果的逻辑向量 (3)regexpr (4)gregexpr (5)regexecregexpr、gregexpr和regexec这三个函数返回的结果包含了匹配的具体位置和字符串长度信息,可以用于字符串的提取操作。 (1)大小写转换 tolower与toupper (2)列表转换为向量unlist (4)重复输入rep() (编辑:西安站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |