本题考查数据挖掘。
聚类分析常用于客户细分、文本归类、结构分组、行为跟踪等【选项ACDE正确】。
因子分析法属于常用的降维方法【选项B错误】。
因此,本题正确答案为选项ACDE。
本题考查数据挖掘。
【B选项正确】数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐藏在其中但又有潜在价值的信息和知识的过程。
因此,本题正确答案为选项B。
本题考查大数据。
大数据的“4V”特性有数据量大、数据多样性、价值密度低、数据的产生和处理速度快。
因此,本题正确答案为ABCD。
本题考查数据挖掘。
监督学习中有两大类典型任务:分类和回归。
分类是通过特征变量确定观测单位所属的类别,因变量是分类变量。常用的分类方法有逻辑斯特回归、决策树、随机森林和支持向量机等【选项BCE正确】。
回归是通过特征变量确定观测单位因变量的取值,因变量是定量变量。常用的回归方法有线性回归、非线性回归和分位数回归等。
文本归类属于常用的聚类方法之一,因子分析属于常用的降维方法之一【选项AD错误】。
因此,本题正确答案为选项BCE。
本题考查数据挖掘。
回归是通过特征变量确定观测单位因变量的取值,因变量是定量变量。
例如,根据钻石的克拉数、颜色、切割工艺等信息预测钻石的价格,根据房屋面积、位置、楼层等信息预测房价【选项B正确】。
根据发件人、主题等信息判断是否为垃圾邮件属于监督学习中的分类【选项A错误】。
根据用户满意度、评价信息判断用户到期后是否会续约也属于监督学习中的分类【选项C错误】。
根据客户的能力、品格、担保、资本等特征评价客户的信用等级属于无监督学习中的降维【选项D错误】。
因此,本题正确答案为选项B。
本题考查数据挖掘。
无监督学习有两大类典型任务:聚类和降维【选项AC正确】。
监督学习有两大类典型任务:分类和回归【选项BD错误】。
半监督分类属于半监督学习【选项E错误】。
因此,本题正确答案为选项AC。