数据挖掘的定义包含以下几层含义（）。-之了课堂

题目

[不定项选择题]数据挖掘的定义包含以下几层含义（）。

A.数据源必须是真实的、大量的、有噪声的
B.发现的是用户感兴趣的知识
C.所有发现的知识都是绝对的
D.发现的知识是可接受、可理解、可运用的
E.并不要求发现放之四海而皆准的知识，仅支持特定的发现问题

答案解析

答案： A,B,D,E

答案解析：

本题考查数据挖掘。

数据挖掘（data mining）就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中，提取隐藏在其中但又有潜在价值的信息和知识的过程。该定义包含以下几层含义：

①数据源必须是真实的、大量的、有噪声的；【A选项正确】

②发现的是用户感兴趣的知识；【B选项正确】

③发现的知识是可接受、可理解、可运用的；【D选项正确】

④并不要求发现放之四海而皆准的知识，仅支持特定的发现问题。【E选项正确】

因此，本题正确答案为选项ABDE。

查看答案

本题来源：第二十三章第5节数据科学与大数据

去题库练习

拓展练习

第1题

[单选题]下列选项中不属于大数据“4V”特性的是（）。

A.数据量大
B.数据多样性
C.价值密度高
D.数据的产生和处理速度快

答案解析

答案： C

答案解析：

本题考查大数据。

大数据具有数据量大、数据多样性、价值密度低、数据的产生和处理速度快的“4V”特性。

因此，本题正确答案为选项C。

点此查看答案

第2题

[不定项选择题]大数据的“4V”特性有（）。

A.数据量大
B.数据多样性
C.价值密度低
D.数据的产生和处理速度快
E.数据易被取得

答案解析

答案： A,B,C,D

答案解析：

本题考查大数据。

大数据的“4V”特性有数据量大、数据多样性、价值密度低、数据的产生和处理速度快。

因此，本题正确答案为ABCD。

点此查看答案

第3题

[单选题]数据科学最早由（　）提出。

A.哈特莱
B.申农
C.维纳
D.彼得·诺尔

答案解析

答案： D

答案解析：

本题考查数据科学。

“数据科学”这个词已有60年历史，最早由丹麦的计算机科学领域先驱彼得·诺尔提出。

因此，本题正确答案为选项D。

点此查看答案

第4题

[不定项选择题]下列各项中，属于监督学习中常用的分类方法的有（）。

A.文本归类
B.逻辑斯特回归
C.随机森林
D.因子分析
E.支持向量机

答案解析

答案： B,C,E

答案解析：

本题考查数据挖掘。

监督学习中有两大类典型任务：分类和回归。

分类是通过特征变量确定观测单位所属的类别，因变量是分类变量。常用的分类方法有逻辑斯特回归、决策树、随机森林和支持向量机等【选项BCE正确】。

回归是通过特征变量确定观测单位因变量的取值，因变量是定量变量。常用的回归方法有线性回归、非线性回归和分位数回归等。

文本归类属于常用的聚类方法之一，因子分析属于常用的降维方法之一【选项AD错误】。

因此，本题正确答案为选项BCE。

点此查看答案

第5题

[不定项选择题]常用的无监督学习方法有（）。

A.
聚类分析
B.
回归分析
C.降维分析
D.分类分析
E.半监督分类分析

答案解析

答案： A,C

答案解析：

本题考查数据挖掘。

无监督学习有两大类典型任务：聚类和降维【选项AC正确】。

监督学习有两大类典型任务：分类和回归【选项BD错误】。

半监督分类属于半监督学习【选项E错误】。

因此，本题正确答案为选项AC。

点此查看答案