位置:首页 > 题库频道 > 其它分类 > 招考类其它 > 企事业内部考试类电力电力计算机相关多选题

下列属于词袋模型缺点的有( )。

发布时间:2024-07-13

A.词汇表的词汇需要经过精心设计

B.具有稀疏性

C.丢失词序忽略了上下文

D.模型复杂,不利于实施

试卷相关题目

  • 1下列属于可视化高维数据技术的有( )。

    A.矩阵

    B.平行坐标系

    C.星形坐标系

    D.散布图

    开始考试点击查看答案
  • 2下列属于字符串匹配的分词方法的有( )。

    A.正向最大匹配法(由左到右的方向)

    B.逆向最大匹配法(由右到左的方向)

    C.最少切分法(使每一句中切出的词数最小)

    D.双向最大匹配法(进行由左到右、由右到左两次扫描)

    开始考试点击查看答案
  • 3下列属于文本处理流程的有( )。

    A.normalization

    B.tokenization stopwords

    C.part-of-speech tagging

    D.named entity recognition

    开始考试点击查看答案
  • 4下列现象属于乘性噪声有( )。

    A.电视光栅的退化

    B.二值图像上的椒盐噪声

    C.信道传输受扰

    D.胶片材料的退化

    开始考试点击查看答案
  • 5下列属于TF-IDF的应用有( )。

    A.搜索引擎

    B.关键词提取

    C.文本相似性

    D.数据降维

    开始考试点击查看答案
  • 6下列算法可用于图像分割的有( )。

    A.霍夫曼编码

    B.分水岭算法

    C.K-means

    D.区域生长

    开始考试点击查看答案
  • 7下列与图像处理相关的有( )。

    A.图像识别

    B.人脸识别

    C.视频分析

    D.自然语言处理

    开始考试点击查看答案
  • 8下列可用于处理由于光照不均带来的影响的图像处理方法有( )。

    A.同态滤波

    B.顶帽变换

    C.基于移动平均的局部阈值处理

    D.拉普拉斯算子

    开始考试点击查看答案
  • 9下列属于汉语未登录词类型的有( )。

    A.存在于词典但出现频率较少的词

    B.新出现的普通词汇

    C.专有名词

    D.专业名词和研究领域名称

    开始考试点击查看答案
  • 10下列方法是TF-IDF的变种的有( )。

    A.TFC

    B.EWC

    C.ITC

    D.IG

    开始考试点击查看答案
返回顶部