大数据技术导论
上QQ阅读APP看书,第一时间看更新

*实验报告3 网络爬虫

【实验目的】

1)要求使用Python语言编写爬虫代码。

2)要求爬取给定网站的所有发帖数据,包含回帖数据。

【实验内容】

爬取一个网站中的数据需要做以下准备工作,如图3.15所示。

图3.15 基本思路

编写爬取豆瓣http://www.douban.com/tag/%E5%B0%8F%E8%AF%B4/?focus=book中书名的Python/R/Java代码。