位置:首页 > 题库频道 > 其它分类 > 招考类其它 > 企事业内部考试类电力电力计算机相关多选题

关于特征向量的缺失值处理方式如下:缺失值较多,直接将该特征舍弃掉,否则可能会带入较大的noise,对结果造成不良影响;缺失值较少,其余的特征缺失值都在10%以内,可以采取的处理方式有(   )。

发布时间:2024-07-13

A.把NaN直接作为一个特征,假设用0表示

B.用均值填充

C.用随机森林等算法预测填充

D.以上选项都不正确

试卷相关题目

  • 1HighBias (高偏差)的解决方式有(    )。

    A.Boosting

    B.复杂模型(非线性模型、增加神经网络中的层)

    C.更多特征

    D.以上选项都不正确

    开始考试点击查看答案
  • 2下列关于AUC面积的描述正确的有(   )。

    A.AUC被定义为ROC曲线下与坐标轴围成的面积

    B.AUC面积的值大于1

    C.AUC面积的值等于0.5时,真实性最低,无应用价值

    D.AUC面积的值越接近1.0,检测方法真实性越高

    开始考试点击查看答案
  • 3重新划分样本到正例类和反例类。下列说法正确的有( )。

    A.增加阈值不会提高召回率

    B.增加阈值会提高召回率

    C.增加阈值不会降低查准率

    D.增加阈值会降低查准率

    开始考试点击查看答案
  • 4一个监督观测值集合会被划分为( )。

    A.训练集

    B.验证集

    C.测试集

    D.预处理集

    E."

    开始考试点击查看答案
  • 5下列关于Ridge回归的说法正确的有(   )。

    A.若λ=0,则等价于一般的线性回归

    B.若λ=0,则不等价于一般的线性回归

    C.若λ=+∞,则得到的权重系数很小,接近于零

    D.若λ=+∞,则得到的权重系数很大,接近与无穷大

    开始考试点击查看答案
  • 6如果将A、B、C三个分类器的P-R曲线画在一个图中,其中A、B的P-R曲线可以完全包含住C的P-R曲线,A、B的P-R曲线有交点,A、B、C的平衡点分别 为0.79、0.66. 0.58,则下列说法中正确的有( )。

    A.学习器A的性能优于学习器C

    B.学习器A的性能优于学习器B

    C.学习器B的性能优于学习器C

    D.学习器C的姓能优于学习器B

    开始考试点击查看答案
  • 7下列可以用来评估线性回归模型的指标有( )。

    A.R-Squared

    B.Adjusted R-Squared

    C.F Statistics

    D.RMSE / MSE / MAE

    开始考试点击查看答案
  • 8如果希望减少数据集中的特征数量,则可以采取的措施有( )。

    A.使用正向选择法(Forward Selection )

    B.使用反向消除法(Backward Elimination )

    C.逐步选择消除法(Stepwise )

    D.计算不同特征之间的相关系数,删去相关系数高的特征之一

    开始考试点击查看答案
  • 9下列可以用于特征降维的方法有( )。

    A.主成分分析PCA

    B.线性判别分析LDA

    C.深度学习SparseAutoEncoder

    D.矩阵奇异值分解SVD

    开始考试点击查看答案
  • 10下列关于L1和L2范数的描述正确的有(   )。

    A.L1范数为x向量各个元素绝对值之和

    B.L2范数为x向量各个元素平方和的1/2次方,L2范数又称Euclidean范数或Frobenius 范数

    C.L1范数可以使权值稀疏,方便特征提取

    D.L2范数可以防止过拟合,提升模型的泛化能力

    开始考试点击查看答案
返回顶部