如果想要训练一个ML模型,样本数量为100万个,特征维度为5000个,面对如此大数据,那么有效地训练模型可以采取的措施有( )。
A.对训练集随机采样,在随机采样的数据上建立模型
B.尝试使用在线机器学习算法
C.使用PCA算法减少特征维度
试卷相关题目
- 1假设目标遍历的类别非常不平衡,即主要类别占据了训练数据的99%,假设现在模型在训练集上表现为99%的准确度,那么下列说法正确的有( )。
A.准确度并不适合衡量不平衡类别问题
B.准确度适合衡量不平衡类别问题
C.精确度和召回率适合于衡量不平衡类别问题
D.精确度和召回率不适合衡量不平衡类别问题
开始考试点击查看答案 - 2下列对模型性能提高有帮助的有( )。
A.数据预处理
B.特征工程
C.机器学习算法
D.模型集成
开始考试点击查看答案 - 3机器学习的三个关键组成要素包含( )。
A.任务T
B.性能指标P
C.目标函数V
D.经验来源E
开始考试点击查看答案 - 4下列关于范数规则化的描述正确的有( )。
A.L0是指向量中0的元素的个数
B.L1范数是指向量中各个元素绝对值之和
C.L2范数向量元素绝对值的平方和再开平方
D.L0是指向量中非0的元素的个数
开始考试点击查看答案 - 5影响Apriori算法的计算复杂度的有( )。
A.支持度阈值
B.项数(维度)
C.事务数
D.事务平均宽度
开始考试点击查看答案 - 6下列关于机器学习的理解正确的有( )。
A.非监督学习的样本数据是要求带标签的
B.监督学习和非监督学习的区别在于是否要求样本数据带标签
C.强化学习以输入数据作为对模型的反馈
D.卷积神经网络一般用于图像处理等局部特征相关的数据
开始考试点击查看答案 - 7下列属于机器学习生成式模型的有( )。
A.朴素贝叶斯
B.隐马尔科夫模型
C.线性回归模型
D.深度信念网络
开始考试点击查看答案 - 8集成学习中增强多样性的常见做法有( )。
A.数据样本扰动
B.输入属性扰动
C.输出表示扰动
D.算法参数扰动
开始考试点击查看答案 - 9常用的冲突消解策略包括( )。
A.投票法
B.排序法
C.元规则法
D.调研法
开始考试点击查看答案 - 10下列关于学习器结合的描述正确的有( )。
A.避免单学习器可能因误选而导致泛化性能不佳
B.降低陷入局部极小点的风险
C.假设空间扩大有可能学得更好的近似
D.多学习器结合有可能冲突
开始考试点击查看答案
最新试卷
高中教育高考英语高考英语完形解题策略训练二
类别:学历类其它高中教育高考英语高考英语完形解题策略
类别:学历类其它高中教育高考英语陕西2014年高考英语试题
类别:学历类其它高中教育高考英语英语听力模拟试题(十二))
类别:学历类其它高中教育高考英语福建2014年高考英语试题
类别:学历类其它高中教育高考英语浙江省金华十校2011年高考模拟考试英语试题
类别:学历类其它高中教育高考英语浙江2014年高考英语试题
类别:学历类其它高中教育高考英语江苏省常州市北郊中学2011年高考英语模拟试
类别:学历类其它高中教育高考英语江苏省常州三中2011届高三高考英语模拟试卷
类别:学历类其它高中教育高考英语广东省湛江市2011届英语普通高考测试(一)
类别:学历类其它