位置：首页 > 题库频道 > 其它分类 > 招考类其它 > 企事业内部考试类电力电力计算机相关多选题

如果想要训练一个ML模型，样本数量为100万个，特征维度为5000个，面对如此大数据，那么有效地训练模型可以采取的措施有（）。

发布时间：2024-07-13

A.对训练集随机采样，在随机采样的数据上建立模型

B.尝试使用在线机器学习算法

C.使用PCA算法减少特征维度

查看最佳答案免验证查看最佳答案

试卷相关题目

1假设目标遍历的类别非常不平衡，即主要类别占据了训练数据的99%,假设现在模型在训练集上表现为99%的准确度，那么下列说法正确的有（）。
A.准确度并不适合衡量不平衡类别问题
B.准确度适合衡量不平衡类别问题
C.精确度和召回率适合于衡量不平衡类别问题
D.精确度和召回率不适合衡量不平衡类别问题
开始考试点击查看答案
2下列对模型性能提高有帮助的有（）。
A.数据预处理
B.特征工程
C.机器学习算法
D.模型集成
开始考试点击查看答案
3机器学习的三个关键组成要素包含（）。
A.任务T
B.性能指标P
C.目标函数V
D.经验来源E
开始考试点击查看答案
4下列关于范数规则化的描述正确的有（）。
A.L0是指向量中0的元素的个数
B.L1范数是指向量中各个元素绝对值之和
C.L2范数向量元素绝对值的平方和再开平方
D.L0是指向量中非0的元素的个数
开始考试点击查看答案
5影响Apriori算法的计算复杂度的有（）。
A.支持度阈值
B.项数（维度）
C.事务数
D.事务平均宽度
开始考试点击查看答案
6下列关于机器学习的理解正确的有（）。
A.非监督学习的样本数据是要求带标签的
B.监督学习和非监督学习的区别在于是否要求样本数据带标签
C.强化学习以输入数据作为对模型的反馈
D.卷积神经网络一般用于图像处理等局部特征相关的数据
开始考试点击查看答案
7下列属于机器学习生成式模型的有（）。
A.朴素贝叶斯
B.隐马尔科夫模型
C.线性回归模型
D.深度信念网络
开始考试点击查看答案
8集成学习中增强多样性的常见做法有（）。
A.数据样本扰动
B.输入属性扰动
C.输出表示扰动
D.算法参数扰动
开始考试点击查看答案
9常用的冲突消解策略包括（）。
A.投票法
B.排序法
C.元规则法
D.调研法
开始考试点击查看答案
10下列关于学习器结合的描述正确的有（）。
A.避免单学习器可能因误选而导致泛化性能不佳
B.降低陷入局部极小点的风险
C.假设空间扩大有可能学得更好的近似
D.多学习器结合有可能冲突
开始考试点击查看答案

如果想要训练一个ML模型，样本数量为100万个，特征维度为5000个，面对如此大数据，那么有效地训练模型可以采取的措施有（）。

试卷相关题目

最新试卷

热门试卷

如果想要训练一个ML模型，样本数量为100万个，特征维度为5000个，面对如此大数据，那么有效地训练模型可以采取的措施有（ ）。

试卷相关题目

最新试卷

热门试卷

如果想要训练一个ML模型，样本数量为100万个，特征维度为5000个，面对如此大数据，那么有效地训练模型可以采取的措施有（）。