专栏名称: needrunning
互联网行业一线技术开发者,对云计算,大数据等分支感兴趣,欢迎交流讨论
目录
相关文章推荐
央视网  ·  这一中国“顶流”水果,在海外卖爆了! ·  14 小时前  
央视网  ·  这一中国“顶流”水果,在海外卖爆了! ·  14 小时前  
南方生活广播  ·  预防冠心病、动脉硬化、胆石症等疾病 ·  2 天前  
家有好大事  ·  合肥最新发布:免费乘车! ·  2 天前  
51好读  ›  专栏  ›  needrunning

【理论】数据仓库中的名词解释

needrunning  · 简书  ·  · 2017-09-24 10:09

正文

请到「今天看啥」查看全文


数据仓库的目的是支持决策,面向企业高层管理人员

三分类
分类属于监督学习;
这些类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。

四聚类分析
聚类分析是描述建模的典型例子,而描述建模是数据挖掘任务之一。

数据挖掘任务.png

聚类属于无监督学习;
压根不知道数据会分为几类(研究人员可以指定聚类数),通过聚类分析将数据聚合成几个群体;聚类的目的是使得属于同类别的对象之间的差别尽可能的小,而不同类别上的对象的差别尽可能的大







请到「今天看啥」查看全文