Python爬虫从菜鸟到高手
本书从实战角度系统讲解 Python爬虫的核心知识点,并通过大量的真实项目让读者熟练掌握 Python爬虫技术,是Python爬虫的经典著作。

作者:李宁

定价:119元

印次:1-1

ISBN:9787302640516

出版日期:2023.09.01

印刷日期:2023.09.25

图书责编:盛东亮

图书分类:零售

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书从实战角度系统论述了Python 爬虫技术的核心知识,并通过大量的真实项目帮助读者深入掌握Python 爬虫技术及其实现。本书提供了大量实战案例,演绎采用各种技术编写Python 爬虫的方式。读者可以任意组合使用这些技术,完成非常复杂的爬虫应用。本书共20 章,分为五篇。第一篇:基础知识(第1~2 章),主要包括Python 编程环境的搭建、IDE 的安装和使用、HTTP 的基础知识、网页基础(HTML、CSS、JavaScript)、爬虫的基本原理、Session、Cookie。第二篇:网络库(第3~5 章),主要包括网络库urllib、urllib3 和requests 的核心使用方法,例如,发送HTTP 请求、处理超时、设置HTTP 请求头、处理中文字符、搭建和使用代理、解析链接、Robots 协议等。第三篇:解析库(第6~9 章),主要包括3 个常用解析库(lxml、Beautiful Soup 和pyquery)的使用方法,同时介绍了多种用于分析HTML 代码的技术,例如,正则表达式、XPath、CSS 选择器、方法选择器等。第四篇:数据存储(第10~11 章),主要包括Python 中数据存储的解决方案,如文件存储和SQLite 数据库。第五篇:爬虫高级应用(第12~20 章),主要包括Python 爬虫的一些高级技术,如抓取异步数据、Selenium、Splash、抓取移动App 数据、Appium、多线程爬虫、爬虫框架Scrapy、通过OpenCV 技术识别验证码;最后给出一个综合的实战案例,该案例综合了Python 爬虫、数据存储、PyQt、多线程、数据可视化、Web 等多种技术实现一个可视化爬虫。

李宁, 欧瑞科技创始人&CEO,宁哥教育创始人,东北大学计算机硕士。曾任国内某大型软件公司项目经理、宁哥教育教学总监、51CTO学院讲师、CSDN特级讲师。从事软件研究和开发超过15年,一直从事Python、人工智能、区块链、、Node.js、Java以及跨平台技术的研究和技术指导工作,对国内外相关领域的技术、理论和实践有很深的理解和研究

大家都知道 Python 语言现在非常火爆。但 Python 语言就和英语一样,如果只会 Python,就相当于只能 用英语进行日常会话,而真正的英语高手是可以充当专业领域(如 IT、金融、数学等)翻译的。Python 语 言也一样,仅仅学习 Python 语言是不够的,要想找到更好的工作,或想得到更高的薪水,需要学会用 Python 语言实现某一领域的应用。 现在 Python 语言应用的领域比较多,人工智能就是其中之一,人工智能不仅涉及 Python 语言本 身的技术,还涉及数学领域的知识,虽然比较火爆,但不是短时间内可以掌握的。然而,在众多的 Python 语言应用领域中,有一个领域与人工智能的火爆程度相当,但却不像人工智能入门那样难,这 就是爬虫。 那么为什么爬虫领域如此火爆呢?其实爬虫的基本功能就是从网上下载各种类型的数据(如 HTML、 图像文件等)。可不要小瞧这些下载的数据...

目录
荐语
查看详情 查看详情
                                                          

      

      

      

      

      

      

                                       第一篇  基 础 知 识 

第  1 章  开发环境配置.3 

                6分钟 

    1.1   搭建 Python 编程环境3 

         1.1.1   获取 Python 安装包 3 

         1.1.2   安装 Windows 版的  Python 开发包  .4 

         1.1.3   安装 macOS 版的  Python 开发包.4 

         1.1.4   安装 Linux 版的 Python 开发包.5 

    1.2   安装 Anaconda Python 开发环境   .5 

    1.3   消除 Python REPL 中的错误和警告       .6 

    1.4   安装 PyCharm7 

    1.5   配置 PyCharm8 

    1.6   小结 .9 

第  2 章  爬虫基础.10 

                10 分钟 

    2.1   HTTP 基础  10 

         2.1.1   URI 和 URL.10 

         2.1.2   超文本 .11 

         2.1.3... 查看详情

"“私房菜谱”
Python爬虫基础知识
Python网络库
Python解析库
Python数据存储
Python异步数据抓取
Python Splash爬虫
Python移动App数据抓取
Python多线程爬虫
Python可见即可“爬”
Python Scrapy实战
Python识别验证码
Python项目实战
 “实战项目”
抓取小说目录与正文
抓取豆瓣网图书榜单
抓取房屋租赁信息
抓取豆瓣网音乐排行榜
抓取百度网站图片搜索中的图片
检测滑动验证码
可视化爬虫抓取和分析当当网图书评论"

查看详情