位置:首页 > 题库频道 > 其它分类 > 招考类其它 > 企事业内部考试类电力电力计算机相关多选题

下列属于TF-IDF的应用有( )。

发布时间:2024-07-13

A.搜索引擎

B.关键词提取

C.文本相似性

D.数据降维

试卷相关题目

  • 1情感分析的应用场景有( )。

    A.数据挖掘

    B.信息检索

    C.文本分词

    D.市场营销

    开始考试点击查看答案
  • 2情感分析的途径有( )。

    A.关键词识别

    B.词汇关联

    C.统计方法

    D.概念级技术

    开始考试点击查看答案
  • 3下列方法属于词语情感分析的有( )。

    A.基于网络的分析方法

    B.基于word-embedding的分析方法

    C.基于词典的分析方法

    D.基于词频的分析方法

    开始考试点击查看答案
  • 4常用分词方法包含( )。

    A.基于Binarytree的分词方法

    B.基于HMM的分词方法

    C.基于CRF的分词方法

    D.基于K-means的分词方法

    开始考试点击查看答案
  • 5TF-IDF的缺点包含( )。

    A.字词的重要性随它在文件中出现的次数成正比

    B.将一些生僻字误当作文档关键词

    C.只考虑特征词和文本之间的关系,忽略了一个特征项在不同类别间的分布情况

    D.没有考虑特征词的位置因素对文本的区分度

    开始考试点击查看答案
  • 6下列现象属于乘性噪声有( )。

    A.电视光栅的退化

    B.二值图像上的椒盐噪声

    C.信道传输受扰

    D.胶片材料的退化

    开始考试点击查看答案
  • 7下列属于文本处理流程的有( )。

    A.normalization

    B.tokenization stopwords

    C.part-of-speech tagging

    D.named entity recognition

    开始考试点击查看答案
  • 8下列属于字符串匹配的分词方法的有( )。

    A.正向最大匹配法(由左到右的方向)

    B.逆向最大匹配法(由右到左的方向)

    C.最少切分法(使每一句中切出的词数最小)

    D.双向最大匹配法(进行由左到右、由右到左两次扫描)

    开始考试点击查看答案
  • 9下列属于可视化高维数据技术的有( )。

    A.矩阵

    B.平行坐标系

    C.星形坐标系

    D.散布图

    开始考试点击查看答案
  • 10下列属于词袋模型缺点的有( )。

    A.词汇表的词汇需要经过精心设计

    B.具有稀疏性

    C.丢失词序忽略了上下文

    D.模型复杂,不利于实施

    开始考试点击查看答案
返回顶部