思维导图备注

AI算法工程师手册
首页 BookChat 小程序 小程序 下载 阅读记录
  • 书签 我的书签
  • 添加书签 添加书签 移除书签 移除书签
编辑文档

统计学习

来源 1 浏览 1875 扫码 分享 2020-05-31 17:48:07
  • 2.支持向量机
  • 4.决策树
  • 7.梯度提升树
  • 9.模型评估
  • 11.聚类
  • 14.最大熵算法
  • 16.概率图与条件随机场
上一篇:
下一篇:
  • 书签
  • 添加书签 移除书签
  • 介绍
  • 工具
    • pandas 使用指南
      • 一、基本数据结构
        • 1. Series
        • 2. Index
        • 3. MultiIndex
        • 4. DataFrame
      • 十、 DataFrame 绘图
      • 十一、 移动窗口函数
      • 十二、 数据加载和保存
        • 1. 文本文件
        • 2. Json
        • 3. 二进制文件
        • 4. Excel 文件
        • 5. HTML 表格
        • 6. SQL
      • 二、 内部数据结构
      • 三、 下标存取
        • 1. [ ] 操作符
        • 2. loc/iloc/ix 存取器
        • 3. at/iat 存取器
        • 4. query 方法
        • 5. 多级索引
        • 6. 整数 label
      • 四、 运算
        • 1. 数值运算
        • 2. 排序
        • 3. 统计
      • 五、变换
        • 1. 索引和轴的变换
        • 2. 合并数据
        • 3. 索引旋转
      • 六、数据清洗
        • 1. 移除重复数据
        • 2. apply
        • 3. 缺失数据
        • 4. 离散化
      • 七、 字符串操作
      • 八、 聚合与分组
        • 1. 分组
        • 2. GroupBy对象
        • 3. 分组级运算
        • 4. 透视表和交叉表
      • 九、时间序列
        • 1. Python 中的时间
        • 2. 时间点 Timestamp
        • 3. 时间段 Period
        • 4. DatetimeIndex
        • 5. PeriodIndex
        • 6. resample 和频率转换
    • matplotlib 使用指南
      • 一、matplotlib配置
      • 二、 matplotlib Artist
        • 1. container Artist:
        • 2. primitive
      • 三、基本概念
        • 1. backend
        • 2. 交互式模式
        • 3. matplotlib的颜色
        • 4. matplotlib.cm
        • 5. matplotlib.colors
        • 6. matplotlib.colorbar
      • 四、布局
        • 1. 简单布局
        • 2. 使用 pyplot.subplot2grid() 函数
        • 3. 使用 GridSpec 和 SubplotSpec
      • 五、 Path
      • 六、 path effect
      • 七、坐标变换
        • 1. 用户的 data 坐标系
        • 2. Axes 坐标系
        • 3. 混合坐标系
        • 4. 利用坐标变换制造阴影效果
        • 5. 直角坐标系、对数坐标系、极坐标系
      • 八、 3D 绘图
      • 九、技巧
    • scipy 使用指南
      • 一、 常数和特殊函数
      • 二、 拟合与优化
      • 三、线性代数
      • 四、 统计
        • 1. 连续随机变量
        • 2. 离散随机变量
        • 3. 核密度估计
        • 4. 常见分布
      • 五、数值积分
      • 六、 稀疏矩阵
    • lightgbm使用指南
      • 一、安装
      • 二、调参
        • 2.1 调参指导
        • 2.2 参数
      • 三、进阶
      • 四、API
        • 4.1 数据接口
        • 4.2 模型接口
        • 4.4 绘图API
        • 4.5 Booster API 转换
      • 五、Docker
    • numpy 使用指南
      • 一、 ndarray
        • 1. ndarray 对象的内存结构
        • 2. 数组的创建
        • 3. 数组的索引
        • 4. 操作多维数组
        • 5.打印数组
        • 6. Nan 和无穷大
      • 二、 ufunc 函数
        • 1. 广播
        • 2. 四则运算
        • 3. 比较运算
        • 4. 逻辑运算
        • 5. 位运算
        • 6. 自定义 ufunc 函数
        • 7. ufunc 对象的方法
        • 8. 数学函数
      • 三、 函数库
        • 1. 随机数库
        • 2. 统计量
        • 3. 分段函数
        • 4. 多项式
        • 5. 内积、外积、张量积
        • 6. 线性代数
      • 四、数组的存储和加载
        • 1. 二进制
        • 2. 文本文件
    • xgboost使用指南
      • 一、安装
      • 二、调参
        • 2.1 调参指导
        • 2.2 参数
      • 三、外存计算
      • 四、 GPU计算
      • 五、单调约束
      • 六、 DART booster
      • 七、Python API
        • 7.1 数据接口
        • 7.2 模型接口
        • 7.3 绘图API
    • CRF++
      • 一、安装
      • 二、使用
      • 三、Python接口
      • 四、常见错误
    • scikit-learn
      • 3.监督学习模型
        • 一、线性模型
        • 二、支持向量机
        • 三、贝叶斯模型
        • 四、决策树
        • 五、KNN
        • 六 、AdaBoost
        • 七、梯度提升树
        • 八、Random Forest
      • 6.半监督学习模型
      • 1.预处理
        • 一、特征处理
        • 二、特征选择
        • 三、字典学习
        • 四、PipeLine
      • 2.降维
        • 一、PCA
        • 二、MDS
        • 三、Isomap
        • 四、LocallyLinearEmbedding
        • 五、FA
        • 六、FastICA
        • 七、t-SNE
      • 7.隐马尔可夫模型
        • 一、Hmmlearn
        • 二、seqlearn
      • 5.聚类模型
        • 一、KMeans
        • 二、DBSCAN
        • 三、MeanShift
        • 四、AgglomerativeClustering
        • 五、BIRCH
        • 六、GaussianMixture
        • 七、SpectralClustering
      • 4.模型评估
        • 一、数据集切分
        • 二、性能度量
        • 三、验证曲线 && 学习曲线
        • 四、超参数优化
    • spark
      • 2.rdd使用
        • 一、概述
        • 二、创建 RDD
        • 三、转换操作
        • 四、行动操作
        • 五、其他方法和属性
        • 六、持久化
        • 七、分区
        • 八、混洗
      • 1.基础概念
      • 3.dataframe使用
        • 一、概述
        • 二、SparkSession
          • 2.1 属性
          • 2.2 方法
        • 三、DataFrame 创建
          • 3.1 从列表创建
          • 3.2 从 RDD 创建
          • 3.3 从 pandas.DataFrame 创建
          • 3.4 从数据源创建
          • 3.5 从 Hive 表创建
        • 四、 DataFrame 保存
          • 4.1 通用保存
          • 4.2 专用保存
        • 五、DataFrame
          • 5.1 属性
          • 5.2 方法
          • 5.2.3 其它方法
        • 六、Row
        • 七、Column
        • 八、GroupedData
        • 九、functions
          • 9.1 数学函数
          • 9.2 字符串函数
          • 9.3 日期函数
          • 9.4 聚合函数
          • 9.5 逻辑与按位函数
          • 9.6 排序、拷贝
          • 9.7 窗口函数
          • 9.8 其它
      • 4.累加器和广播变量
        • 一、累加器
        • 二、广播变量
  • 数学基础
    • 2.概率论基础
      • 一、概率与分布
      • 二、期望和方差
      • 三、大数定律及中心极限定理
      • 五、常见概率分布
      • 六、先验分布与后验分布
      • 七、信息论
      • 八、其它
    • 1.线性代数基础
      • 一、基本知识
      • 二、向量操作
      • 三、矩阵运算
      • 四、特殊函数
    • 4.蒙特卡洛方法与 MCMC 采样
      • 一、蒙特卡洛方法
      • 二、马尔可夫链
      • 三、MCMC 采样
    • 3.数值计算基础
      • 一、数值稳定性
      • 二、梯度下降法
      • 三、二阶导数与海森矩阵
      • 四、牛顿法
      • 五、拟牛顿法
      • 六、 约束优化
  • 深度学习
    • 6.循环神经网络
      • 一、RNN计算图
      • 二、训练算法
      • 三、长期依赖
      • 四、常见 RNN 变种
    • 8.词向量
      • 一、向量空间模型 VSM
      • 二、LSA
      • 三、Word2Vec
      • 四、GloVe
      • 五、FastText
      • 六、ELMo
      • 七、变种
    • 13.图神经网络
      • 一、GNN
      • 二、GCN
      • 三、Fast GCN
      • 四、Semi-Supervised GCN
      • 五、分子指纹GCN
      • 六、GGS-NN
      • 七、PATCHY-SAN
      • 八、GraphSage
      • 九、GAT
    • 11.Graph Embedding
      • 一、DeepWalk
      • 十、EOE
      • 十一、metapath2vec
      • 十二、GraphGAN
      • 十三、struc2vec
      • 十四、GraphWave
      • 十五、NetMF
      • 十六、NetSMF
      • 二、LINE
      • 三、GraRep
      • 四、TADW
      • 五、DNGR
      • 六、Node2Vec
      • 七、WALKLETS
      • 八、SDNE
      • 九、CANE
    • 0.深度学习简介
      • 一、 介绍
      • 二、历史
    • 12.Graph Embedding(续)
      • 十七、PTE
      • 十八、HNE
      • 十九、AANE
    • 2.反向传播算法
      • 一、链式法则
      • 二、反向传播
      • 三、算法实现
      • 四、自动微分
    • 5.1.CNN之图片分类
      • 一、LeNet
      • 二、AlexNet
      • 三、VGG-Net
      • 四、Inception
      • 五、ResNet
      • 六、ResNet 变种
      • 七、SENet
      • 八、 DenseNet
      • 九、小型网络
    • 10.神经网络 CTR 预估模型
      • 一、DSSM
      • 十、xDeepFM
      • 十一、ESMM
      • 十二、DIN
      • 十三、DIEN
      • 十四、DSIN
      • 十五、DICM
      • 二、FNN
      • 三、PNN
      • 四、DeepCrossing
      • 五、Wide&Deep
      • 六、DCN
      • 七、DeepFM
      • 八、NFM
      • 九、AFM
    • 9.传统 CTR 预估模型
      • 一、LR 模型
      • 二、POLY2 模型
      • 三、FM模型
      • 四、FFM模型
      • 五、GBDT-LR 模型
      • 六、FTRL模型
      • 七、LS-PLM 模型
    • 4.最优化基础
      • 一、代价函数
      • 十、Normalization
      • 十一、Online Learning
      • 二、神经网络最优化挑战
      • 三、 mini-batch
      • 四、基本优化算法
      • 五、自适应学习率算法
      • 六、二阶近似方法
      • 七、共轭梯度法
      • 八、优化策略和元算法
      • 九、参数初始化策略
    • 7.Transformer
      • 一、Transformer
      • 二、Universal Transformer
      • 三、Transformer XL
      • 四、GPT
      • 五、BERT
      • 六、ERNIE
      • 七、XLNet
      • 八、MT-DNN
      • 九、BERT 扩展
    • 5.卷积神经网络
      • 一、卷积运算
      • 二、卷积层、池化层
      • 三、基本卷积的变体
      • 四、应用
      • 五、 历史和现状
    • 15.工程实践指导原则
    • 1.深度前馈神经网络
      • 一、基础
      • 二、损失函数
      • 三、输出单元
      • 四、隐单元
      • 五、结构设计
      • 六、历史小记
    • 14.传统推荐算法
    • 3.正则化
      • 一、参数范数正则化
      • 十、其它相关
      • 二、显式约束正则化
      • 三、数据集增强
      • 四、噪声鲁棒性
      • 五、早停
      • 六、参数相对约束
      • 七、dropout
      • 八、对抗训练
      • 九、正切传播算法
  • 统计学习
    • 7.梯度提升树
      • 一、提升树
      • 二、xgboost
      • 三、LightGBM
    • 15.隐马尔可夫模型
      • 一、隐马尔可夫模型HMM
      • 二、 HMM 基本问题
      • 三、 最大熵马尔科夫模型MEMM
    • 13.EM算法
      • 一、示例
      • 二、EM算法原理
      • 三、EM算法与高斯混合模型
      • 四、EM 算法与 kmeans 模型
      • 五、EM 算法的推广
    • 18.主题模型
      • 一、Unigram Model
      • 二、pLSA Model
      • 三、LDA Model
      • 四、LDA优化
      • 五、sentence-LDA
      • 六、模型讨论
    • 4.决策树
      • 一、 原理
      • 二、 特征选择
      • 三、生成算法
      • 四、剪枝算法
      • 五、CART 树
      • 六、连续值、缺失值处理
      • 七、多变量决策树
    • 3.朴素贝叶斯
      • 一、贝叶斯定理
      • 二、朴素贝叶斯法
      • 三、半朴素贝叶斯分类器
      • 四、其它讨论
    • 14.最大熵算法
      • 一、最大熵模型MEM
      • 二、分类任务最大熵模型
      • 三、最大熵的学习
    • 0.机器学习简介
      • 一、基本概念
      • 二、监督学习
      • 三、机器学习三要素
    • 1.线性代数基础
      • 一、线性回归
      • 二、广义线性模型
      • 三、对数几率回归
      • 四、线性判别分析
      • 五、感知机
    • 6.集成学习
      • 一、集成学习误差
      • 二、 Boosting
      • 三、Bagging
      • 四、集成策略
      • 五、多样性分析
    • 8.特征工程
      • 一、缺失值处理
      • 二、特征编码
      • 三、数据标准化、正则化
      • 四、特征选择
      • 五、稀疏表示和字典学习
      • 六、多类分类问题
      • 七、类别不平衡问题
    • 16.概率图与条件随机场
      • 一、概率图模型
      • 二、贝叶斯网络
      • 三、马尔可夫随机场
      • 四、条件随机场 CRF
    • 10.降维
      • 一、维度灾难
      • 二、主成分分析 PCA
      • 三、核化线性降维 KPCA
      • 四、流形学习
      • 五、度量学习
      • 六、概率PCA
      • 七、独立成分分析
      • 八、t-SNE
      • 九、LargeVis
    • 17.边际概率推断
      • 一、精确推断
      • 二、近似推断
    • 5.knn
      • 一、k 近邻算法
      • 二、 kd树
    • 11.聚类
      • 一、性能度量
      • 二、原型聚类
      • 三、密度聚类
      • 四、层次聚类
      • 五、谱聚类
    • 9.模型评估
      • 一、泛化能力
      • 二、过拟合、欠拟合
      • 三、偏差方差分解
      • 四、参数估计准则
      • 五、泛化能力评估
      • 六、训练集、验证集、测试集
      • 七、性能度量
      • 七、超参数调节
      • 八、传统机器学习的挑战
    • 12.半监督学习
      • 一、生成式半监督学习方法
      • 二、半监督 SVM
      • 三、图半监督学习
      • 四、基于分歧的方法
      • 五、半监督聚类
      • 六、 总结
    • 2.支持向量机
      • 一、 线性可分支持向量机
      • 二、线性支持向量机
      • 三、非线性支持向量机
      • 四、支持向量回归
      • 五、SVDD
      • 六、序列最小最优化方法
      • 七、其它讨论
暂无相关搜索结果!

    本文档使用 BookStack 构建

    展开/收起文章目录

    分享,让知识传承更久远

    文章二维码

    手机扫一扫,轻松掌上读

    文档下载

    请下载您需要的格式的文档,随时随地,享受汲取知识的乐趣!
    PDF文档 EPUB文档 MOBI文档

    微信小程序阅读

    BookChat 微信小程序阅读
    微信扫一扫,知识掌上学

    书签列表

      阅读记录

      阅读进度: 0.00% ( 0/0 ) 重置阅读进度