1. 爬虫小案例

    • 明确目标(确定在哪个网站搜索)
    • 爬(爬下内容)
    • 取(筛选想要的)
    • 文档:
    • API
      • re := regexp.MustCompile(reStr),传入正则表达式,得到正则表达式对象
      • ret := re.FindAllStringSubmatch(srcStr,-1):用正则对象,获取页面页面,srcStr是页面内容,-1代表取全部
    • 爬邮箱
    • 方法抽取
    • 爬手机号
    • 爬身份证号
      • 如果连接失效了自己找一个就好了
    • 爬图片链接

    下面的两个是即将要爬的网站,如果网址失效自己换一个就好了