位置:首页 > 题库频道 > 其它分类 > 招考类其它 > 企事业内部考试类电力电力计算机相关多选题

TF-IDF的缺点包含( )。

发布时间:2024-07-13

A.字词的重要性随它在文件中出现的次数成正比

B.将一些生僻字误当作文档关键词

C.只考虑特征词和文本之间的关系,忽略了一个特征项在不同类别间的分布情况

D.没有考虑特征词的位置因素对文本的区分度

试卷相关题目

  • 1下列关于自然语言处理中的关键词提取的说法正确的有( )。

    A.关键词提取是指用人工方法提取文章关键词的方法

    B.TF-IDF模型是关键词提取的经典方法

    C.文本中出现次数最多的词最能代表文本的主题

    D.这个问题涉及数据挖掘、文本处理、信息检索等领域

    开始考试点击查看答案
  • 2下列关于情感分析的说法正确的有( )。

    A.简单而言,情感分析是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程

    B.情感分析的发展得益于社交媒体的兴起

    C.按照处理文本的粒度不同,情感分析大致可分为词语级、句子级、篇章级三个

    D.情感分析可以应用于文本挖掘

    开始考试点击查看答案
  • 3下列关于词袋模型的说法正确的有( )。

    A.词袋模型可以忽略每个词出现的顺序

    B.词袋模型不可以忽略每个词出现的顺序

    C.TensorFlow支持词袋模型

    D.词袋模型可以表出单词之间的前后关系

    开始考试点击查看答案
  • 4下列与人工智能场景相关的有( )。

    A.图像识别

    B.人脸识别

    C.语音识别

    D.语义分析

    开始考试点击查看答案
  • 5文本分类过程包括( )。

    A.选择训练文本

    B.选择文本特征

    C.建立文本表示模型

    D.选择分类方法

    开始考试点击查看答案
  • 6常用分词方法包含( )。

    A.基于Binarytree的分词方法

    B.基于HMM的分词方法

    C.基于CRF的分词方法

    D.基于K-means的分词方法

    开始考试点击查看答案
  • 7下列方法属于词语情感分析的有( )。

    A.基于网络的分析方法

    B.基于word-embedding的分析方法

    C.基于词典的分析方法

    D.基于词频的分析方法

    开始考试点击查看答案
  • 8情感分析的途径有( )。

    A.关键词识别

    B.词汇关联

    C.统计方法

    D.概念级技术

    开始考试点击查看答案
  • 9情感分析的应用场景有( )。

    A.数据挖掘

    B.信息检索

    C.文本分词

    D.市场营销

    开始考试点击查看答案
  • 10下列属于TF-IDF的应用有( )。

    A.搜索引擎

    B.关键词提取

    C.文本相似性

    D.数据降维

    开始考试点击查看答案
返回顶部