文本处理

    本文以一个实战例子抛砖引玉,介绍如何运用 grepawksedcut 等命令进行文本处理,以 快速 完成原本很繁琐的操作。

    笔者开发机上有很多 镜像,现在需要删除名为 的那些:

    如何操作呢?莫非手工一个个删除么?

    1. $ docker image rm f0fa889be9e8

    试想,如果有上百个这样的镜像待删,要搞到何年何月!但如何改进呢?

    文本过滤

    1. $ docker images | grep none
    2. <none> <none> f0fa889be9e8 2 days ago 956MB
    3. <none> <none> 257954316455 2 days ago 956MB
    4. <none> <none> 52b10754a70c 2 days ago 956MB
    5. <none> <none> 86878eefdd39 2 days ago 956MB

    接着,将容器 ID 一列提取出来,这对 awk 来说简直是小儿科:

    当然了,通过 cut 命令进行 字段切分 也可以得到相同的结果。由于 cut 只能按单个字符进行切分,而原文本中的空格为多个,因此需要先进行 文本替换

    文本替换

    文本替换是 sed 命令擅长的事,下面将一个或多个空格替换成一个:

    1. <none> <none> f0fa889be9e8 2 days ago 956MB
    2. <none> <none> 257954316455 2 days ago 956MB
    3. <none> <none> 99739acbfe7a 2 days ago 956MB
    4. <none> <none> 52b10754a70c 2 days ago 956MB
    5. <none> <none> 86878eefdd39 2 days ago 956MB

    接下来,使用 cut 命令对结果进行进一步切分并取出第三个字段:

    1. $ docker images | grep none | sed 's/ */ /g' | cut -d ' ' -f 3
    2. f0fa889be9e8
    3. 257954316455
    4. 86878eefdd39

    批量删除

    接下来,通过 xargs 批量删除镜像:

    在这个例子中, xargs 最终将执行以下命令:

    1. $ docker image rm f0fa889be9e8 257954316455 99739acbfe7a 52b10754a70c 86878eefdd39

    看到没有,所有不想要的镜像都删除干净了,而且只需要进行一次操作:

    1. $ docker images
    2. REPOSITORY TAG IMAGE ID CREATED SIZE
    3. api-adapter v1 e9bc8e28af2a 3 hours ago 7.67MB
    4. golang 1.10 0a19f4d16598 12 days ago 729MB
    5. python 3 1e80caffd59e 12 days ago 923MB

    下面这个操作也是等价的:

    小菜学编程

    参考文献