第1章 机器学习实战-复习版(问题汇总)
2.GitHub的使用说明
参考文档:
注意: https://github.com/apachecn/MachineLearning (这是本项目的地址,记得修改链接。。)
2.样本数据按照一定比例来划分:训练数据集 + 测试数据集
如下图:用于评估模型的效果。(测试样本的预测类别 和 测试样本的实际类别 的diff,就是我们的错误率)
5.监督学习和无监督学习的区别:是否有目标变量(也就是:是否存在分类结果)
- 下载书籍:
8.学习原理后,如果成为调包侠?调包侠是否很丑?
- 学习原理后,就看看 sklearn中文文档: , 转型做调包侠
- 调包侠一点都不丑,为什么呢?
- 便于分析业务,快速发现问题
- 开发速度快,便于优化和维护
- 2.7.X版本测试比较稳定,没有Bug
- 3.X 的朋友刚好可以上手去熟悉 API 并 锻炼自我解决问题的能力,算是自我学习的一个方式吧
- 对于使用 3.X的朋友,可以提交 Pull Requests 到 3.X 分支,成为开源的贡献者,方便更多的人学习你的代码
4.复习的时间和资料
- 形式:直播+讨论组
- 周期:周一 ~ 周五
- 学习文档:
- 下载书籍: https://github.com/apachecn/MachineLearning/tree/python-2.7/books
- 活动日期:2017-11-20 ~ 2017-12-08(共15天,1章1天)
- 活动详情:
- QQ:在讨论组共享屏幕(实时)
- 视频会在 讨论组中进行分享
- B站的直播地址(延迟)
6.机器学习QQ群
- ApacheCN - 学习机器学习群【629470233】