监督学习的数据集中,每个观测单位既有自变量(特征Xi)又有因变量(标签yi)。根据已有的数据集,训练出模型可以根据自变量数据得到因变量预测结果的过程称为监督学习。模型学习的好坏可以根据因变量的实际值和预测值之间的差异判断。监督学习中有两大类典型任务:分类和回归。分类是通过特征变量确定观测单位所属的类别,因变量是分类变量。例如,根据用户的满意度、财务信息判断用户合约到期后是否会续约,根据发件人、主题、内容等信息判断邮件是否是垃圾邮件。常用的分类方法有逻辑斯特回归(选项D)、决策树、随机森林和支持向量机(选项C)等。回归是通过特征变量确定观测单位因变量的取值,因变量是定量变量。例如,根据钻石的克拉数、颜色、切割工艺等信息预测钻石的价格,根据房屋面积、位置、楼层等信息预测房价。常用的回归方法有线性回归、非线性回归和分位数回归等。
一元线性回归模型Y=β0+β1X+ε中的ε是( )。
一元线性回归模型中,β0和β1为模型的参数;β0+β1X反映了由于自变量X的变化而引起的因变量Y的线性变化;误差项ε是个随机变量,表示除X和Y的线性关系之外的随机因素对Y的影响,是不能由X和Y的线性关系所解释的Y的变异性。
中央财政收入:关税,海关代征消费税和增值税,消费税,各银行总行、各保险公司总公司等集中交纳的收入(包括利润和城市维护建设税),证券交易印花税,车辆购置税(选项C正确),出口退税,船舶吨税,未纳入共享范围的中央企业所得税,中央企业上缴的利润等。
中央与地方财政共享收入:增值税中央分享 50%,地方分享 50%(选项E错误);纳入共享范围的企业所得税和个人所得税中央分享60%,地方分享 40%(选项D错误);资源税按不同的资源品种划分,海洋石油资源税为中央收入,其余资源税为地方收入(选项B错误)。
地方收入:地方企业上缴利润,城镇土地使用税,城市维护建设税(不含各银行总行、各保险公司总公司集中缴纳的部分),房产税,车船税 ,印花税 (不含证券交易印花税),耕地占用税,契税(选项A正确),烟叶税,土地增值税,国有土地有偿使用收入等。