梦里风林
  • Introduction
  • Android
    • activity
      • Activity四种启动模式
      • Intent Flag
      • 多task的应用
      • Task和回退栈
    • sqlite
      • 【源码】CursorWindow读DB
      • Sqlite在Android上的一个Bug
    • Chromium
    • ListView读取DB数据最佳实践
    • Android Project结构
    • 一个由Proguard与FastJson引起的血案
    • 琐碎的一些tips
  • Computer Vision
    • 特征提取
    • 三维视觉
    • 计算机视觉常用工具
    • 浅谈深度学习数据集设计
    • 随笔
  • Machine Learning
    • 技巧
      • FaceBook: 1 hour training ImageNet
      • L2 Norm与L2 normalize
    • 实践
      • Pytorch实验代码的亿些小细节
    • 工具
      • Tensorflow学习笔记
      • MXNet踩坑手记
      • PyTorch踩坑手记
      • PyTorch模型剪枝
      • Keras踩坑手记
      • mscnn
      • Matlab
        • Matlab Remote IPC自动化数据处理
    • Papers
      • Classification
      • Re-identification
        • CVPR2018:TFusion完全解读
        • ECCV2018:TAUDL
        • CVPR2018:Graph+reid
        • Person Re-identification
        • CVPR2016 Re-id
        • Camera topology and Person Re-id
        • Deep transfer learning Person Re-id
        • Evaluate
      • Object Detection
        • 读论文系列·干货满满的RCNN
        • 读论文系列·SPP-net
        • 读论文系列·Fast RCNN
        • 读论文系列·Faster RCNN
        • 读论文系列·YOLO
        • 读论文系列·SSD
        • 读论文系列·YOLOv2 & YOLOv3
        • 读论文系列·detection其他文章推荐
      • Depth
      • 3D vision
        • 数据集相关
        • 光流相关
      • Hashing
        • CVPR2018: SSAH
      • 大杂烩
        • CNCC2017 琐记
        • ECCV 2016 Hydra CCNN
        • CNCC2017深度学习与跨媒体智能
        • MLA2016笔记
    • 《机器学习》(周志华)读书笔记
      • 西瓜书概念整理
        • 绪论
        • 模型评估与选择
        • 线性模型
        • 决策树
        • 神经网络
        • 支持向量机
        • 贝叶斯分类器
        • 集成学习
        • 聚类
        • 降维与度量学习
        • 特征选择与稀疏学习
        • 计算学习理论
        • 半监督学习
        • 概率图模型
        • 规则学习
        • 强化学习
        • 附录
  • Java
    • java web
      • Servlet部署
      • 琐碎的tips
    • JNI
    • Note
    • Effective Java笔记
  • 后端开发
    • 架构设计
    • 数据库
    • java web
      • Servlet部署
      • 琐碎的tips
    • Spring boot
    • django
    • 分布式
  • Linux && Hardware
    • Ubuntu安装与初始配置
    • 树莓派相关
      • 树莓派3B+无线网卡监听模式
      • TP-LINK TL-WR703N v1.7 openwrt flashing
  • Python
    • django
    • 原生模块
    • 设计模式
    • 可视化
    • 常用库踩坑指南
  • web前端
    • header div固定,content div填充父容器
    • json接口资源
  • UI
  • kit
    • vim
    • git/github
      • 刷爆github小绿点
    • Markdown/gitbook
      • 琐碎知识点
      • gitbook添加disqus作为评论
      • 导出chrome书签为Markdown
      • Markdown here && 微信公众号
    • LaTex
      • LaTex琐记
    • 科学上网
    • 虚拟机
  • thinking-in-program
    • 怎样打日志
  • 我的收藏
  • 琐记
    • 论文心得
    • 深圳买房攻略
  • 赞赏支持
由 GitBook 提供支持
在本页

这有帮助吗?

  1. Machine Learning
  2. 《机器学习》(周志华)读书笔记
  3. 西瓜书概念整理

绪论

第一章 绪论

  • Page2: 标记(label)

    示例结果的信息,例如“好瓜”,称为标记

  • Page2: 假设(269)(hypothesis)

    学得模型对应了数据的某种潜在的规律,因此亦称假设

  • Page2: 示例(instance)

    数据集中的每条记录是关于某个事件或对象的描述,称为一个“示例”或“样本”

  • Page2: 属性(attribute)

    反映事务或对象在某方面的表现或性质的事项,如“色泽”,称为属性或特征

  • Page2: 属性空间(attribute space)

    属性长成的空间称为属性空间,样本空间,或输入空间

  • Page2: 数据集(data set)

    数据记录的集合称为一个数据集

  • Page2: 特征(247)(feature)

    同属性

  • Page2: 学习(learning)

    从数据中学得模型的过程称为学习或训练

  • Page2: 学习器(learner)

    学习过程就是为了找出或逼近真相,有时将模型称作学习器

  • Page2: 训练(training)

    同学习

  • Page2: 训练集(training data)

    训练过程中使用的数据称为“训练集”,其中每个样本称为一个“训练样本”,训练样本组成的集合称为训练集

  • Page2: 训练样本(training sample)

    见训练集

  • Page2: 样本(sample)

    同示例

  • Page2: 样本空间(sample space)

    同属性空间

  • Page2: 样例(sample)

    同示例(instance)

  • Page2: 真相(ground-truth)

    潜在规律本身称为真相或真实

  • Page3: 标记空间(label space)

    所有标记的集合称为标记空间或输出空间

  • Page3: 测试(testing)

    学得模型后,使用其进行预测的过程称为测试,被预测的样本称为测试样本

  • Page3: 测试样本(testing sample)

    见测试

  • Page3: 簇(197)(cluster)

    将训练集中的西瓜分成若干组,称为聚类,每个组称为一个簇

  • Page3: 独立同分布(267)(independent and identically distributed)

    我们获得的每个样本都是独立的从一个分布上采样获得的,即“独立同分布”

  • Page3: 多分类(multi-class classification)

    预测值涉及多个类别时,称为“多分类”

  • Page3: 二分类(binary classification)

    预测值设计两个分类的任务

  • Page3: 泛化(121,350)(generalization)

    学得模型适用于新样本的能力,称为“泛化”能力

  • Page3: 分类(classification)

    如果预测的是离散值,此类学习任务称为分类

  • Page3: 回归(regression)

    如果预测的值是连续值,此类学习任务称为回归

  • Page3: 监督学习(supervised learning)

    根据训练数据是否拥有标记信息,学习任务可以大致分为两大类:监督学习和无监督学习,分类和回归是前者的代表,聚类是后者的代表

  • Page3: 聚类(197)(clustering)

    见簇

  • Page3: 无导师学习

    同无监督学习

  • Page3: 无监督学习(197)(unsupervised learning)

    见有监督学习

  • Page3: 有导师学习

    同有监督学习

  • Page4: 概念学习(17)(concept learning)

    广义的归纳学习大体相当于从样例中学习,而狭义的归纳学习则要求从训练数据中学得概念,因此亦称为概念学习或概念形成

  • Page4: 归纳学习(11)(inductive learning)

    从样例中学习

  • Page5: 版本空间(version space)

    存在着一个与训练集一致的假设集合,称之为“版本空间”

  • Page6: 归纳偏好(inductive bias)

    机器学习算法在学习过程中对某种类型假设的偏好,称为归纳偏好

  • Page6: 偏好

    同归纳偏好

  • Page7: 奥卡姆剃刀(17)(Occam's razor)

    若有多个假设与观察一致,则选最简单的那个

  • Page10: 符号主义(363)(symbolism)

    基于逻辑表示

  • Page10: 连接主义(connectionism)

    基于神经网络

  • Page10: 人工智能

    有很多种说法。。见仁见智

  • Page11: 机械学习

    信息存储与检索

  • Page11: 类比学习

    通过观察和发现学习

  • Page11: 示教学习

    从指令中学习

  • Page12: 统计学习(139)

    如SVM,核方法

  • Page14: 数据挖掘

    从海量数据中发掘知识

  • Page16: WEKA

  • Page17: 迁移学习

    类比学习升级版

上一页西瓜书概念整理下一页模型评估与选择

最后更新于6年前

这有帮助吗?