本书基于Python介绍网络爬虫的基础知识。全书包括8个项目,分别为“爬虫入门——认识与使用网络爬虫”“网页数据爬取——爬取图片、视频与半结构化数据”“网页数据解析与爬取——爬取电影网站中的数据”“网络爬虫与数据存储——爬取网页数据并存储”“动态内容爬取——探索社交媒体动态”“引入Scrapy——构建高效的网络爬虫”“应对反爬策略——突破封锁,持续爬取”“综合案例——构建电商网站并使用网络爬虫爬取数据”。通过这些项目,本书系统讲解Python的Web访问技术、BeautifulSoup和XPath的数据分析与提取技术、Scrapy爬虫框架技术及Selenium爬虫程序技术等内容。每个项目的编写均遵循由浅入深的学习规律,采取理论与实践相结合的方式,引导学生完成实战项目。本书适合作为软件技术、大数据、人工智能等专业的教材,也适合具有一定Linux或Python开发基础的人员阅读,同时可作为爬虫工程师的参考书。