题目
[单选题]数据科学最早由( )提出。
  • A.哈特莱
  • B.申农
  • C.维纳
  • D.彼得·诺尔
答案解析
答案: D
答案解析:

本题考查数据科学。

“数据科学”这个词已有60年历史,最早由丹麦的计算机科学领域先驱彼得·诺尔提出。

因此,本题正确答案为选项D。

查看答案
本题来源:第二十三章 第5节 数据科学与大数据
去题库练习
拓展练习
第1题
[单选题]从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐藏在其中但又有潜在价值的信息和知识的过程是(    )。
  • A.数据分析
  • B.数据挖掘
  • C.数据可视化
  • D.数据研究
答案解析
答案: B
答案解析:

本题考查数据挖掘。

【B选项正确】数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐藏在其中但又有潜在价值的信息和知识的过程。

因此,本题正确答案为选项B。

点此查看答案
第2题
[不定项选择题]数据挖掘的定义包含以下几层含义(    ) 。
  • A.数据源必须是真实的、大量的、有噪声的
  • B.发现的是用户感兴趣的知识
  • C.所有发现的知识都是绝对的
  • D.发现的知识是可接受、可理解、可运用的
  • E.并不要求发现放之四海而皆准的知识,仅支持特定的发现问题
答案解析
答案: A,B,D,E
答案解析:

本题考查数据挖掘。

数据挖掘(data mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐藏在其中但又有潜在价值的信息和知识的过程。该定义包含以下几层含义:

①数据源必须是真实的、大量的、有噪声的;【A选项正确】

②发现的是用户感兴趣的知识;【B选项正确】

③发现的知识是可接受、可理解、可运用的;【D选项正确】

④并不要求发现放之四海而皆准的知识,仅支持特定的发现问题。【E选项正确】

因此,本题正确答案为选项ABDE。

点此查看答案
第3题
[不定项选择题]大数据的“4V”特性有(    )。
  • A.数据量大
  • B.数据多样性
  • C.价值密度低
  • D.数据的产生和处理速度快
  • E.数据易被取得
答案解析
答案: A,B,C,D
答案解析:

本题考查大数据。

大数据的“4V”特性有数据量大、数据多样性、价值密度低、数据的产生和处理速度快。

因此,本题正确答案为ABCD。

点此查看答案
第4题
[不定项选择题]下列各项中,属于监督学习中常用的分类方法的有(    )。
  • A.文本归类
  • B.逻辑斯特回归
  • C.随机森林
  • D.因子分析
  • E.支持向量机
答案解析
答案: B,C,E
答案解析:

本题考查数据挖掘。

监督学习中有两大类典型任务:分类和回归。

分类是通过特征变量确定观测单位所属的类别,因变量是分类变量。常用的分类方法有逻辑斯特回归、决策树、随机森林和支持向量机等【选项BCE正确】

回归是通过特征变量确定观测单位因变量的取值,因变量是定量变量。常用的回归方法有线性回归、非线性回归和分位数回归等。

文本归类属于常用的聚类方法之一,因子分析属于常用的降维方法之一【选项AD错误】

因此,本题正确答案为选项BCE。

点此查看答案
第5题
[不定项选择题]聚类分析常用于(    )。
  • A.客户细分
  • B.因子分析
  • C.文本归类
  • D.结构分组
  • E.行为跟踪
答案解析
答案: A,C,D,E
答案解析:

本题考查数据挖掘。

聚类分析常用于客户细分、文本归类、结构分组、行为跟踪等【选项ACDE正确】

因子分析法属于常用的降维方法【选项B错误】

因此,本题正确答案为选项ACDE。

点此查看答案
  • 领取礼包
  • 咨询老师
  • 在线客服
  • 购物车
  • App
  • 公众号
  • 投诉建议