1. 爬虫小案例
- 明确目标(确定在哪个网站搜索)
- 爬(爬下内容)
- 取(筛选想要的)
- 文档:
- API
- re := regexp.MustCompile(reStr),传入正则表达式,得到正则表达式对象
- ret := re.FindAllStringSubmatch(srcStr,-1):用正则对象,获取页面页面,srcStr是页面内容,-1代表取全部
- 爬邮箱
- 方法抽取
- 爬手机号
- http://www.zhaohaowang.com/ 如果连接失效了自己找一个有手机号的就好了
- 爬身份证号
- 如果连接失效了自己找一个就好了
- 爬图片链接
下面的两个是即将要爬的网站,如果网址失效自己换一个就好了