价格: 免费

分类: 技术书籍 python

发布: 5月前

更新: 5月前

演示:

本书不仅介绍了网络数据采集,也为采集新式网络中的各种数据类型提供了全面的指导。 虽然本书用的是 Python 编程语言,里面涉及 Python 的许多基础知识,但这并不是一本 Python 入门图书。
如果你不太懂编程,也完全不了解 Python,那么这本书看起来可能有点儿费劲。但是,如 果你懂编程,那么书中的内容可以很快上手。附录 A 介绍了 Python 3.x 版本的安装和使用 方法,全书将使用这个版本的 Python。如果你的电脑里只装了 Python 2.x 版本,可能需要 先看看附录 A。
如果你想更全面地学习 Python,Bill Lubanovic 写的《Python 语言及其应用》1 是本非常 好的教材,只是书有点儿厚。如果不想看书,Jessica McKellar 的教学视频 Introduction to Python(http://shop.oreilly.com/product/110000448.do)也非常不错。
附录 C 介绍并分析了几个商业案例以及犯罪事件,可以帮助你了解如何在美国合法地运行 网络爬虫并使用数据。
技术书通常都是介绍一种语言或技术,而网络数据采集是一个比较综合的主题,涉及数据 库、网络服务器、HTTP 协议、HTML 语言、网络安全、图像处理、数据科学等内容。本 书尝试涵盖网络数据采集的所有内容。
第一部分深入讲解网络数据采集和网络爬行相关内容,并重点介绍全书都要用到的几个 Python 库。这部分内容可以看成这些库和技术的综合参考(对于一些特殊情形,后面会提 供其他参考资料)。
第二部分介绍读者在动手编写网络爬虫的过程中可能会涉及的一些主题。不过,这些主题 的范围特别广泛,这部分内容也不足以道尽玄机。因此,文中提供了许多常用的参考资料 来补充更多的信息。

Python网络数据采集.png