专栏名称: 机器学习研究会
机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织,旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外,协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。
目录
相关文章推荐
爱可可-爱生活  ·  [CL]《Generalization ... ·  20 小时前  
新机器视觉  ·  图像处理中的经典机器学习方法 ·  昨天  
AI前线  ·  被“网暴”两个月后,Yann LeCun ... ·  2 天前  
黄建同学  ·  1X公司发布了最新的AI模型Redwood, ... ·  2 天前  
51好读  ›  专栏  ›  机器学习研究会

【西瓜书】周志华《机器学习》学习笔记与习题探讨(一)

机器学习研究会  · 公众号  · AI  · 2017-07-19 23:51

正文

请到「今天看啥」查看全文



1.2 基本术语


要进行机器学习,先要有数据。

数据集: 一组记录的集合。

示例/样本/特征向量: 每条记录(关于一个事件或对象的描述)或空间中的每一个点(对应一个坐标向量)。

属性/特征: 反应事件或对象在某方面的表现或性质的事项。

属性值: 属性上的取值。

属性空间/样本空间/输入空间: 属性张成的空间。

维数: 属性的个数。

模型需要从数据中学得。

学习/训练: 从数据中学得模型的过程。

训练数据: 训练过程中使用的数据。

训练样本: 每个样本。

训练集: 训练样本组成的集合。

假设: 学习模型对应了关于数据的某种潜在的规律。

真相/真实: 这种潜在规律自身。

学习过程就是为了找出或逼近真相。

获得训练样本的结果信息,才能建立“预测”的模型。

标记: 关于示例结果的信息。

样例: 拥有了标记信息的示例。

标记空间: 所有标记的集合。








请到「今天看啥」查看全文