3.1.2 方案

    两个常用字符串搜索函数 和 grepl()。两个常用字符串替换函数 sub()gsub()。它们都是向量化操作,会应用到输入字符向量的每一个元素中。

    3.1.2.1 文本搜索

    grep()grepl() 函数输入的第一个参数都是带有正则表达式的字符串或者固定的字符串(需要设定选项 ),它们的不同之处是前者返回匹配的索引或值向量,而后者返回一个逻辑向量。

    grep() 函数设定选项 value=TRUE 可以返回匹配的值。

    正则表达式提供了一种表达字符模式的强大方式(详情查看 ?regex),我们可以将它应用于文本的搜索中。例如,我们想搜索字符向量中有4个数字连续出现的字符:

    3.1.2.2 文本替换

    例如,我们想要将字符向量中的年份全部替换为 2019。

    要操作的对象第二个元素包含2个可以匹配的模式,使用 sub() 只会将第一个替换为 2019,而使用 gsub() 会将所有能够匹配的模式都替换为 2019。