位置:首页 > 题库频道 > 其它分类 > 招考类其它 > 企事业内部考试类电力电力计算机相关多选题

与自然语言处理相关的工具包Jieba、Gensirm、NLTK、Scikit-Learn 的区别有( )

发布时间:2024-07-13

A.Jieba专注于中文分词操作

B.NLTK主要用于一般自然语言处理任务(标记化、POS标记、解析等)

C.Gensim主要用于题和向量空间建摸、文档集合相似性等

D.Scikit-learn 为机器学习提供了一个大型库,其中包含了用于文本预处理的工具,例如词频—逆文档频率特征提取 ( TfidfVectorizei) 等。

试卷相关题目

  • 1下列属于 Gensim 库的特性的有 ( )

    A.训练语料的预处理

    B.主题向量的变换

    C.文档相似度的计算

    D.文章切分词语统计计算

    开始考试点击查看答案
  • 2Python 中 Jieba 库的基本实现原理包含( )

    A.分析汉字与汉字之间的关联概率

    B.分析汉字词组的关联概率

    C.根据用户自定义的词组进行分析

    D.还可以分析汉字与英文之间关联概率

    开始考试点击查看答案
  • 3Python中Jieba库支持模式有 ()。

    A.精准模式

    B.匹配模式

    C.全模式

    D.搜索引挚模式

    开始考试点击查看答案
  • 4plt.axhlince(y=0.0, c="r'', ls="--",1w=2), 下列关于该代码的说法正确的有()

    A.在 0.0 处添加竖直参考线

    B.添加水平参考线

    C.参考线是虚线形式

    D.网格线是红色的

    开始考试点击查看答案
  • 5关于下列代码的说法正确的有( )x =np.linspace (0.05, 10, 1000)y = np.sin (x)pit.plot (x, y 、 ls ""- ."" ,1= 2, c =""c"", label= ""plot figure"")pit.legend ()pit.grid (linestyle= "", "", color ""r"")pit.show ()"

    A.该图表是一个蓝绿色的散点图

    B.图表中有红色实线的网格线

    C.图表中有图例

    D.该图画的是sin曲线

    开始考试点击查看答案
  • 6Pandas中主要的数据结构有( )

    A.Data

    B.DataFrame

    C.Frame

    D.Series

    开始考试点击查看答案
  • 7Pandas 中删除列的方式有( )

    A.df.drop (["列名"], axis=1)

    B.df.drop(columns=[" 列名"])

    C.df.drop ([O, 1])

    D.df.drop ([O])

    开始考试点击查看答案
返回顶部