位置:首页 > 题库频道 > 其它分类 > 招考类其它 > 企事业内部考试类电力电力计算机相关多选题

如果想要训练一个ML模型,样本数量为100万个,特征维度为5000个,面对如此大数据,那么有效地训练模型可以采取的措施有(  )。

发布时间:2024-07-13

A.对训练集随机采样,在随机采样的数据上建立模型

B.尝试使用在线机器学习算法

C.使用PCA算法减少特征维度

试卷相关题目

  • 1假设目标遍历的类别非常不平衡,即主要类别占据了训练数据的99%,假设现在模型在训练集上表现为99%的准确度,那么下列说法正确的有(   )。

    A.准确度并不适合衡量不平衡类别问题

    B.准确度适合衡量不平衡类别问题

    C.精确度和召回率适合于衡量不平衡类别问题

    D.精确度和召回率不适合衡量不平衡类别问题

    开始考试点击查看答案
  • 2下列对模型性能提高有帮助的有( )。

    A.数据预处理

    B.特征工程

    C.机器学习算法

    D.模型集成

    开始考试点击查看答案
  • 3机器学习的三个关键组成要素包含( )。

    A.任务T

    B.性能指标P

    C.目标函数V

    D.经验来源E

    开始考试点击查看答案
  • 4下列关于范数规则化的描述正确的有(   )。

    A.L0是指向量中0的元素的个数

    B.L1范数是指向量中各个元素绝对值之和

    C.L2范数向量元素绝对值的平方和再开平方

    D.L0是指向量中非0的元素的个数

    开始考试点击查看答案
  • 5影响Apriori算法的计算复杂度的有(   )。

    A.支持度阈值

    B.项数(维度)

    C.事务数

    D.事务平均宽度

    开始考试点击查看答案
  • 6下列关于机器学习的理解正确的有(   )。

    A.非监督学习的样本数据是要求带标签的

    B.监督学习和非监督学习的区别在于是否要求样本数据带标签

    C.强化学习以输入数据作为对模型的反馈

    D.卷积神经网络一般用于图像处理等局部特征相关的数据

    开始考试点击查看答案
  • 7下列属于机器学习生成式模型的有(   )。

    A.朴素贝叶斯

    B.隐马尔科夫模型

    C.线性回归模型

    D.深度信念网络

    开始考试点击查看答案
  • 8集成学习中增强多样性的常见做法有(   )。

    A.数据样本扰动

    B.输入属性扰动

    C.输出表示扰动

    D.算法参数扰动

    开始考试点击查看答案
  • 9常用的冲突消解策略包括(   )。

    A.投票法

    B.排序法

    C.元规则法

    D.调研法

    开始考试点击查看答案
  • 10下列关于学习器结合的描述正确的有(   )。

    A.避免单学习器可能因误选而导致泛化性能不佳

    B.降低陷入局部极小点的风险

    C.假设空间扩大有可能学得更好的近似

    D.多学习器结合有可能冲突

    开始考试点击查看答案
返回顶部