题目
[不定项选择题]数据挖掘的定义包含以下几层含义(    ) 。
  • A.数据源必须是真实的、大量的、有噪声的
  • B.发现的是用户感兴趣的知识
  • C.所有发现的知识都是绝对的
  • D.发现的知识是可接受、可理解、可运用的
  • E.并不要求发现放之四海而皆准的知识,仅支持特定的发现问题
答案解析
答案: A,B,D,E
答案解析:

本题考查数据挖掘。

数据挖掘(data mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐藏在其中但又有潜在价值的信息和知识的过程。该定义包含以下几层含义:

①数据源必须是真实的、大量的、有噪声的;【A选项正确】

②发现的是用户感兴趣的知识;【B选项正确】

③发现的知识是可接受、可理解、可运用的;【D选项正确】

④并不要求发现放之四海而皆准的知识,仅支持特定的发现问题。【E选项正确】

因此,本题正确答案为选项ABDE。

查看答案
本题来源:第二十三章 第5节 数据科学与大数据
去题库练习
拓展练习
第1题
[单选题]下列选项中不属于大数据“4V”特性的是(    )。
  • A.数据量大
  • B.数据多样性
  • C.价值密度高
  • D.数据的产生和处理速度快
答案解析
答案: C
答案解析:

本题考查大数据。

大数据具有数据量大、数据多样性、价值密度低、数据的产生和处理速度快的“4V”特性。

因此,本题正确答案为选项C。

点此查看答案
第2题
[不定项选择题]大数据的“4V”特性有(    )。
  • A.数据量大
  • B.数据多样性
  • C.价值密度低
  • D.数据的产生和处理速度快
  • E.数据易被取得
答案解析
答案: A,B,C,D
答案解析:

本题考查大数据。

大数据的“4V”特性有数据量大、数据多样性、价值密度低、数据的产生和处理速度快。

因此,本题正确答案为ABCD。

点此查看答案
第3题
[单选题]数据科学最早由( )提出。
  • A.哈特莱
  • B.申农
  • C.维纳
  • D.彼得·诺尔
答案解析
答案: D
答案解析:

本题考查数据科学。

“数据科学”这个词已有60年历史,最早由丹麦的计算机科学领域先驱彼得·诺尔提出。

因此,本题正确答案为选项D。

点此查看答案
第4题
[不定项选择题]下列各项中,属于监督学习中常用的分类方法的有(    )。
  • A.文本归类
  • B.逻辑斯特回归
  • C.随机森林
  • D.因子分析
  • E.支持向量机
答案解析
答案: B,C,E
答案解析:

本题考查数据挖掘。

监督学习中有两大类典型任务:分类和回归。

分类是通过特征变量确定观测单位所属的类别,因变量是分类变量。常用的分类方法有逻辑斯特回归、决策树、随机森林和支持向量机等【选项BCE正确】

回归是通过特征变量确定观测单位因变量的取值,因变量是定量变量。常用的回归方法有线性回归、非线性回归和分位数回归等。

文本归类属于常用的聚类方法之一,因子分析属于常用的降维方法之一【选项AD错误】

因此,本题正确答案为选项BCE。

点此查看答案
第5题
[不定项选择题]常用的无监督学习方法有(    )。
  • A.

    聚类分析

  • B.

    回归分析

  • C.降维分析
  • D.分类分析
  • E.半监督分类分析
答案解析
答案: A,C
答案解析:

本题考查数据挖掘。

无监督学习有两大类典型任务:聚类和降维【选项AC正确】

监督学习有两大类典型任务:分类和回归【选项BD错误】

半监督分类属于半监督学习【选项E错误】

因此,本题正确答案为选项AC。

点此查看答案
  • 领取礼包
  • 咨询老师
  • 在线客服
  • 购物车
  • App
  • 公众号
  • 投诉建议