题目
[不定项选择题]大数据的“4V”特性有(    )。
  • A.数据量大
  • B.数据多样性
  • C.价值密度低
  • D.数据的产生和处理速度快
  • E.数据易被取得
答案解析
答案: A,B,C,D
答案解析:

本题考查大数据。

大数据的“4V”特性有数据量大、数据多样性、价值密度低、数据的产生和处理速度快。

因此,本题正确答案为ABCD。

查看答案
本题来源:第二十三章 第5节 数据科学与大数据
去题库练习
拓展练习
第1题
[单选题]数据科学最早由( )提出。
  • A.哈特莱
  • B.申农
  • C.维纳
  • D.彼得·诺尔
答案解析
答案: D
答案解析:

本题考查数据科学。

“数据科学”这个词已有60年历史,最早由丹麦的计算机科学领域先驱彼得·诺尔提出。

因此,本题正确答案为选项D。

点此查看答案
第2题
[不定项选择题]下列各项中,属于监督学习中常用的分类方法的有(    )。
  • A.文本归类
  • B.逻辑斯特回归
  • C.随机森林
  • D.因子分析
  • E.支持向量机
答案解析
答案: B,C,E
答案解析:

本题考查数据挖掘。

监督学习中有两大类典型任务:分类和回归。

分类是通过特征变量确定观测单位所属的类别,因变量是分类变量。常用的分类方法有逻辑斯特回归、决策树、随机森林和支持向量机等【选项BCE正确】

回归是通过特征变量确定观测单位因变量的取值,因变量是定量变量。常用的回归方法有线性回归、非线性回归和分位数回归等。

文本归类属于常用的聚类方法之一,因子分析属于常用的降维方法之一【选项AD错误】

因此,本题正确答案为选项BCE。

点此查看答案
第3题
[单选题]监督学习有两大类典型任务:分类和回归。下列各项中,属于回归的是(    )。
  • A.根据发件人、主题等信息判断是否为垃圾邮件
  • B.根据房屋面积、位置等信息预测房价
  • C.根据用户满意度、评价信息判断用户到期后是否会续约
  • D.

    根据客户的能力、品格、担保、资本等特征评价客户的信用等级

答案解析
答案: B
答案解析:

本题考查数据挖掘。

回归是通过特征变量确定观测单位因变量的取值,因变量是定量变量。

例如,根据钻石的克拉数、颜色、切割工艺等信息预测钻石的价格,根据房屋面积、位置、楼层等信息预测房价【选项B正确】

根据发件人、主题等信息判断是否为垃圾邮件属于监督学习中的分类【选项A错误】

根据用户满意度、评价信息判断用户到期后是否会续约也属于监督学习中的分类【选项C错误】

根据客户的能力、品格、担保、资本等特征评价客户的信用等级属于无监督学习中的降维【选项D错误】

因此,本题正确答案为选项B。

点此查看答案
第4题
[不定项选择题]聚类分析常用于(    )。
  • A.客户细分
  • B.因子分析
  • C.文本归类
  • D.结构分组
  • E.行为跟踪
答案解析
答案: A,C,D,E
答案解析:

本题考查数据挖掘。

聚类分析常用于客户细分、文本归类、结构分组、行为跟踪等【选项ACDE正确】

因子分析法属于常用的降维方法【选项B错误】

因此,本题正确答案为选项ACDE。

点此查看答案
第5题
[不定项选择题]常用的降维方法包括(    )。
  • A.

    决策树

  • B.

    支持向量机

  • C.

    主成分分析法

  • D.文本归类
  • E.因子分析法
答案解析
答案: C,E
答案解析:

本题考查数据挖掘。

常用的降维方法包括主成分分析法、因子分析法等【选项CE正确】

决策树、支持向量机属于常用的分类方法【选项AB错误】

文本归类属于聚类分析【选项E错误】

因此,本题正确答案为选项CE。

点此查看答案
  • 领取礼包
  • 咨询老师
  • 在线客服
  • 购物车
  • App
  • 公众号
  • 投诉建议