Python网络爬虫:从入门到精通在线阅读

Python网络爬虫:从入门到精通

吕云翔主编
开会员,本书8折购 >

教材教辅研究生/本科/专科教材11.2万字

更新时间:2023-10-25 19:34:57 最新章节:参考文献

立即阅读
加书架
下载
听书

书籍简介

本书主要介绍如何使用Python语言进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍Python网络爬虫开发的多个方面,涉及HTTP、HTML、正则表达式、JavaScript、自然语言处理、数据处理与科学计算等不同领域的内容。全书共12章,包括基础篇、进阶篇、提高篇和实战篇4个部分。基础篇包括第1、2、3章,分别为Python基础及网络爬虫、静态网页抓取、数据存储。进阶篇包括第4、5、6章,分别为JavaScript与动态内容、模拟登录与验证码、爬虫数据的分析与处理。提高篇包括第7、8、9章,分别为爬虫的灵活性和多样性、Selenium模拟浏览器与网站测试、爬虫框架Scrapy与反爬虫。实战篇提供了3个实战项目供读者学习参考。本书内容覆盖网络数据抓取与爬虫编程中的主要知识和前沿技术。同时,本书在重视理论基础的前提下,从实用性和丰富度出发,结合实例演示爬虫程序编写的核心流程,将理论与实践结合,力求提高读者的网络爬虫实操技能。本书可作为高等院校数据科学、统计学、计算机科学、软件工程等相关专业课程的教材,也可作为Python语言初学者、网络爬虫技术爱好者的参考书。
品牌:人邮图书
上架时间:2023-07-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

最新上架

  • 会员
    本书以Hive为开发平台,主要介绍了如何使用HiveQL来查询和分析存储在Hadoop分布式文件系统上的大数据集合,具体内容包括Hive入门、Hive数据库及表操作、Hive元数据、Hive高级操作、Hive函数与Streaming、Hive视图与索引、Hive调优、Hive与HBase集成、数据迁移框架Sqoop等。本书介绍的每个任务都运用了大量案例,紧密结合实际应用,融入了含金量十足的开发经验
    肖睿 兰伟 廖春琼主编教材教辅8万字
  • 本书全面介绍新媒体运营技术与应用的内容。第1章为新媒体运营技术与应用概述,包括新媒体运营的价值、新媒体运营中的工具、新媒体运营岗位与工具学习建议等;第2章重点介绍新媒体文字处理技术,通过对快速输入、抓取文字及多人同步文字处理工具的介绍,引导读者全面了解文字处理工具的价值及用法;第3章重点介绍新媒体图片设计技术与应用,包括找到高质量的图片、快速制作封面、快速设计创意九宫格图及动图、借助AI技术制作图
    刘绍君 勾俊伟主编教材教辅6.3万字
  • 会员
    《艺考朗诵》一书是艺术院校艺考生的备考辅导用书。作者通过对中国影视传媒艺术类名校的校考考试进行深度研究分析,结合十多年的教学经验,编写了该书,目的在于对各校校考中的朗诵知识考点进行体系化梳理与解析。本书从朗诵的概念、朗诵考纲分析、朗诵的基础与技巧等方面进行系统的梳理,并结合考试实例,有效帮助校考文艺考生掌握朗诵考点的学习范围,在明确范围的前提下进行有针对性备考。该书内容针对性强,实用性高,是艺考学
    楚淇 曹效聪主编教材教辅6.5万字
  • 会员
    如今的组织管理中,四个最基本的关系:个人与目标的关系、个人与组织的关系、组织与环境的关系以及组织与变化的关系,都完全改变了。随之而来的新范式必然也将逐渐融入组织行为学的经典框架,本教材不仅强调对基本概念和理论的准确把握,更突出对环境的分析,以及新环境影响下的组织行为、组织学习、组织网络的创新和价值。组织管理的核心价值,需要回归到组织赋能与激活人,以响应“现实”组织的特征。本教材不仅融入了大量实际案
    陈春花 曹洲涛 宋一晓 苏涛编著教材教辅38.3万字
  • 随着新媒体的影响力不断提升,越来越多的企业将运营重心转移到新媒体领域,这也对新媒体从业人员提出了更高的要求。本书从新媒体运营和推广的角度出发,首先介绍新媒体运营与推广的基础知识,其次阐述用户运营、内容运营和活动运营的知识,最后从微信运营、微博运营、短视频运营、直播运营和其他新媒体运营的角度,系统、全面地讲解新媒体运营与推广的内容,帮助读者学习并掌握新媒体运营与推广的知识和技能。本书可以作为高等院校
    高功步 罗蓓蓓主编教材教辅12.2万字
  • 会员
    本书使用分学科、多指标综合评价,以及定量评价与定性评价相结合的研究方法,从我国正在出版的中文期刊中评选出1987种核心期刊,具有较高的学术水平和使用价值。
    陈建龙 张俊娥主编教材教辅63.3万字
  • 会员
    本书主要讲解Hadoop的分布式文件系统、MapReduce编程模型和Spark大数据处理技术。全书共12章,具体包括大数据概述、Hadoop大数据处理架构、HDFS分布式文件系统、MapReduce分布式计算框架、HBase分布式数据库、Spark概述、基于Scala的Spark编程、Windows环境下Spark综合编程、SparkSQL结构化数据处理、SparkStreaming流计算、
    曾国荪 曹洁编著教材教辅9.7万字
  • 会员
    本书根据计算机科学与技术专业对离散数学的教学要求,参考国内外众多优秀的离散数学教材,并结合教学组老师多年的教学实践编写而成。本书对离散数学的核心知识单元进行了系统的理论阐述,对离散数学的分析证明方法进行了严谨的介绍,并通过丰富的应用实例介绍了离散系统建模,旨在帮助读者在掌握理论基础的同时,理解如何利用这些理论知识来分析和解决问题。作为《离散数学及其应用》的第1版,本书将函数的相关内容列为独立章节,
    陈琼 马千里 周育人 陈伟能等编著教材教辅19万字
  • 本书系统地讲解了统计学的基本原理和知识框架,主要特点包括:①理论联系实际。本书不仅讲解了理论知识,还注重将统计学的概念和方法应用于实际问题。书中提供了许多实例,有助于学生将统计理论与实际情境相结合。此外,本书还在部分操作环节介绍了如何使用Excel与SPSS等软件进行数据处理和分析,使学生具备操作技能。②图文并茂。为了更好地帮助学生理解概念和方法,本书配有详细而清晰的图表、数据和例题,以期让学生更
    傅毅 龚秀芳 汪传江编著教材教辅11.4万字