位置:首页 > 题库频道 > 其它分类 > 招考类其它 > 企事业内部考试类电力电力计算机相关多选题

常用的爬虫技巧有(____)

发布时间:2024-07-13

A.更改header,伪装成浏览器进行爬取

B.设置爬取的时间间隔

C.应用神经网络算法识别网站验证码

D.通过代理服务器进行爬取

试卷相关题目

  • 1下列说法正确的有(____)

    A.cookielib库提供可存储cookie的对象,以便与urllirequest库配合使用 来进行访问

    B.过于频繁的爬虫不会带给网站额外的压力

    C.使用split()可以进行字符串的拆分

    D.正则表达式可以实现对爬取信息的快速过滤

    开始考试点击查看答案
  • 2下列关于HTML 的叙述正确的有(____)

    A.一个HTML文件可以用记事本来编辑

    B.HTML的意思是超文本标记语言

    C.一个HTML文件必须是一个以html或html为扩展名的文件

    D.HTML区分大小写,如 <b>写成<B>是错误的

    开始考试点击查看答案
  • 3下列关于API爬虫的说认错误的有(____)

    A.基于API返回的结果通常会比较干净

    B.基于API的爬虫任务中,速度一般较慢

    C.基于API的爬虫,爬取的好处是没有次数的限制

    D.基于APl 的爬取能够覆盖网站所有信息

    开始考试点击查看答案
  • 4下列关于HTML协签嵌套规则的说法正确的有(____)

    A.块元素可以包含内联元素或某些块元素,但内联元素也可以包含块元素

    B.HTML 标签包括块级元素和内嵌元素

    C.内嵌元素一般用在网站内容之中的某些细节或部位,用以强调区分样 式上标下标描锚点等,通常包括a、abbr、bbr、font、i、 img、input、kbd 、label、q、s、select、small、span、sub、tt、u、var 等

    D.其中块级元素一般用来搭 建网络架构布局承栽内容,通常包括的标签有address dir、divd、dl、dt、dd、form、h1~h6、hr、is、index、menu、noframes、noscript、ol、p、pre、table、ul等

    开始考试点击查看答案
  • 5下列可以用于实现爬虫功能的有(____)

    A.BeautifulSoup 库

    B.re模块

    C.Scrapy框架

    D.urllibrequest库

    开始考试点击查看答案
  • 6下列说法正确的有(____)

    A.网站服务器可以识别你使用的访问软件,因为在发送访问请求中有特定位置的字符串和软件类型相关

    B.低级别的代理服务器十分容易被识别

    C.可以通过修改opener的 proxy来模拟浏见器访问

    D.爬取图片的流程被中断时,之前所有爬取的信息都将被自动删除

    开始考试点击查看答案
  • 7下列关于超链接的说法正确的有(____)    "

    A.语句 <a herf=""formhtml"">Fill Our Form</a> 指向的是同一 服务器同一目 录下的formhtml" "

    B.语句<a href=""stuff/cath tml"">Catalog</a> 指向的是同一服务器子 目录stuff 下的cathtml"

    C.语句< a hcef "/parenthtml">Parent</a> 指向的是同一服务器父目录下的parenthtml

    D.语句< a href="'wwwdevbgorg" target "_blank">BASD</a> 指向的是内部的网站

    开始考试点击查看答案
  • 8在Python中查看关键字,需要在pyhon解释器中执行(____)两条命令

    A.list keyword

    B.import keyword

    C.keyword

    D.import.kwlist

    开始考试点击查看答案
  • 9python标准库包含(____)

    A.os

    B.sys

    C.numpy

    D.re

    开始考试点击查看答案
  • 10下列关于Python分隔代码块的描述错误的有(____)

    A.内嵌代码的每一行,都比外面的if语句的缩进更多

    B.代码以“begin”开头,“end”结尾

    C.每行代码的缩进都一致

    D.代码块被封装在花括号中

    开始考试点击查看答案
返回顶部