本题考查数据挖掘。
常用的降维方法包括主成分分析法、因子分析法等【选项CE正确】。
决策树、支持向量机属于常用的分类方法【选项AB错误】。
文本归类属于聚类分析【选项E错误】。
因此,本题正确答案为选项CE。
本题考查数据挖掘。
【B选项正确】数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐藏在其中但又有潜在价值的信息和知识的过程。
因此,本题正确答案为选项B。
本题考查数据挖掘。
数据挖掘(data mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐藏在其中但又有潜在价值的信息和知识的过程。该定义包含以下几层含义:
①数据源必须是真实的、大量的、有噪声的;【A选项正确】
②发现的是用户感兴趣的知识;【B选项正确】
③发现的知识是可接受、可理解、可运用的;【D选项正确】
④并不要求发现放之四海而皆准的知识,仅支持特定的发现问题。【E选项正确】
因此,本题正确答案为选项ABDE。
本题考查数据挖掘。
回归是通过特征变量确定观测单位因变量的取值,因变量是定量变量。
例如,根据钻石的克拉数、颜色、切割工艺等信息预测钻石的价格,根据房屋面积、位置、楼层等信息预测房价【选项B正确】。
根据发件人、主题等信息判断是否为垃圾邮件属于监督学习中的分类【选项A错误】。
根据用户满意度、评价信息判断用户到期后是否会续约也属于监督学习中的分类【选项C错误】。
根据客户的能力、品格、担保、资本等特征评价客户的信用等级属于无监督学习中的降维【选项D错误】。
因此,本题正确答案为选项B。
本题考查数据挖掘。
无监督学习有两大类典型任务:聚类和降维【选项AC正确】。
监督学习有两大类典型任务:分类和回归【选项BD错误】。
半监督分类属于半监督学习【选项E错误】。
因此,本题正确答案为选项AC。
本题考查数据挖掘。
聚类分析常用于客户细分、文本归类、结构分组、行为跟踪等【选项ACDE正确】。
因子分析法属于常用的降维方法【选项B错误】。
因此,本题正确答案为选项ACDE。