实验报告
课程名称: 数据采集与网络爬虫实验
学 院: 数学与系统科学学院
专 业: 统计学(数据分析方向)
班 级: 2017 级 3 班
姓 名: 马荣皓
学 号: 201701070316
1
年
月
日
山东科技大学教务处制
姓名
马荣皓
同组实验者
实验项目名称
爬取全国疫情数据&解析省
市信息
实验日期 2020-11-23
教师评语
实验成绩: 指导教师(签名):
年
月 日
2
一、 实验目的
爬取全国疫情数据&解析省市信息
二、 实验内容
2.1 查看网页内容
网页 URl:https://ncov.dxy.cn/ncovh5/view/pneumonia
2.2 爬取指定页面
程序如下:
3
结果如下:
2.3 解析页面中的全国疫情数据
4
如上图,从网页中找到该项 id 为 getAreaStat。
程序如下:
结果如下:
2.4 使用正则表达式获取 json 格式的数据
程序如下:
结果如下:
2.5 将省份数据解析为 JavaBean
5
2.5.1 定义 JavaBean
2.5.2 导入 Fastjson 并将城市数据解析为 javabean
结果如下:
6
三、实验总结
通过本次实验,我们爬取了全国疫情数据并分析省市信息。学会了将数据解析为 JavaBean
格式
实
践
学
类
教
学
文
件
7