logo资料库

基于大数据新闻网站文本挖掘的网络舆情监测设计与实现.pdf

第1页 / 共7页
第2页 / 共7页
第3页 / 共7页
第4页 / 共7页
第5页 / 共7页
第6页 / 共7页
第7页 / 共7页
资料共7页,全文预览结束
第 15 卷第 4 期 2018 年 8 月 华北科技学院学报 Journal of North China Institute of Science and Technology Vol. 15 No. 4 Aug. 2018 基于大数据新闻网站文本挖掘的 网络舆情监测设计与实现 梁永春,焦文强,田立勤 ( 华北科技学院 计算机学院,北京 东燕郊 065201) 摘 要: 当今中国,网民人数已经超过人口总数的一半,因此网络舆情监测具有十分重要的意义。 本文首先应用网络爬虫技术实现对新闻报道和对应网民评论文本数据获取。因为数据量大,所以 选择 Hadoop 集群进行文本数据储存。其次,通过中文分词技术对文本数据按词语进行拆分,并对 得到的词语进行过滤和挑选,得到关键词。新闻报道文本中获取的关键词用于新闻类型与主题的 判别,网民评论中的关键字反映了网民对此新闻报道的观点和态度。最后,应用此方法,对“中美 贸易战”事件进行网络舆情监测,从获得的新闻报道主题和网民评论的关键字表明,本文介绍的网 络舆情监测方法具有可行性和实用性。 关键词: 舆情监测; 网络爬虫; 中文分词 中图分类号: TP391 文章编号: 1672-7169(2018)04-0082-06 文献标识码: A Design and Implementation of Network Public Opinion Monitoring Based on Big Data News Website Text Mining LIANG Yongchun,JIAO Wenqiang ,TIAN Liqin ( College of Computer,North China Institute of Science and Technology,Yanjiao,065201,China) Abstract: Nowadays,the number of netizens in China has exceeded half of the total population,so it is very important to monitor the public opinion on the Internet. In this paper,firstly,web scraping with Python is ap- plied to achieve news report and corresponding user comments data. Because of the big data,Hadoop are se- lected to store the data. Secondly,Chinese word segmentation technology is used to separate the data according to Chinese words,and the words obtained are filtered and selected to get the key words. The keywords obtained from news reports are used to distinguish news types and topics. The keywords in the comments reflect the o- pinions and attitudes of the netizens about the reports. Finally,this method is applied to monitor the online public opinion monitoring of the China-U. S. trade frictions. The topics of news reports and the keywords of comments from netizens show that the online public opinion monitoring method introduced in this paper is fea- sible and practical. Key words:Public Opinion Monitoring;Web Crawler;Chinese Word Segmentation 收稿日期: 2018-08-06 基金项目: 国家自然科学基金项目(61163050) 作者简介: 梁永春( 1982 - ) ,男,甘 肃 人,华 北 科 技 学 院 计 算 机 学 院在 读 硕 士 研 究 生 ,研 究 方 向: 安 全 生 产 信 息 化。 E - mail: 273567812@ qq. com 28 中国煤炭期刊网 www.chinacaj.net
第 4 期 0 引言 根据中国互联网发展状况统计报告提供的数 据,2017 年我国网民规模已经达到 7. 72 亿[1],网 络空间已经成为广大网民获取信息便捷高效的渠 道。同时,随着中国网民数量的不断增多,他们关 注的新闻和对这些新闻评论中表达的观点和态 度,形成网络舆情中重要组成部分。这些网友评 论,往往来自社会不同群体,是对当前某些特定新 闻事件结合自身经历,针对此新闻内容发表的态 度和观点,具有很强的代表性。因其传播速度快, 具有一定的影响力,因此网络舆情监测受到社会 各方的关注和重视,不同的科研机构对此也做了 大量研究。 近期,针对网络舆情监测主要研究方向与成 果主要有,王青,成颖,巢乃鹏等人进行的网络舆 情监测及预警指标体系构建研究[2];杨宗亮,张 玉茜,李建飞等人进行的一种基于地理空间大数 据的网络舆情监测软件架构研究[3];鄢睿等人进 研究[4] 行的人工智能视域下网络舆情监测的变革之道的 。可是,通过新闻门户网站新闻事件的报 道与其对应的评论相互结合,进行网络舆情监测 的相关研究较少。 目前,各类新闻门户网站已经成为上至国际 关系下至百姓生活各类新闻事件的重要发布媒体 之一。 同 时,此 类 门 户 网 站 ( 例 如: ifeng. com、 toutiao. com) 为了增加广大网民间的互动性与参 与性,都设置评论区。很多网民通过“评论区”表 达了自己对各类事件的看法和观点。这些评论大 多都与门户网站的某篇新闻报道相互对应,通常 是对特定新闻事件的观点阐述和情感表达。这些 评论往往具有真实性和针对性,可以较好的反映 不同类型,不同群体的网民对各类新闻事件的直 接看法和想法。因此,本文重点介绍通过对新闻 事件报道与对应的网友评论的抓取、分析,实现对 互联网舆情监测的具体方法。 1 相关理论 网络舆情监测是一门多学科交叉下的应用科 学,它的发展建立在各种网络协议( 例如:HTTP、 TCP) 的基础上,同时又要与网页爬虫技术、自然 梁永春等:基于大数据新闻网站文本挖掘的网络舆情监测设计与实现 语言处理技术等相结合,并且自身可以定义为大 数据背景下的一种具体应用。 1. 1 网络舆情监测及意义[5] 马克 思 曾 指 出,人 是 一 切 社 会 关 系 的 总 和。随 着 科 学 的 进 步,信 息 技 术 的 普 及, Internet 网络成 为 当 前 人 们 重要 的 人 与 社 会 联 系工具,因此也是 表 达 自 身 与社 会 各 种 关 系 的 渠道。网 络 信 息,具 有 传 播 速 度 快,影 响 范 围 广的特点。网络舆 情 监 测,就 是 通 过 分 析 网 民 在网络空间的言论来 了 解 网 民 ( 整 个 社 会 大 部 分群体) 思想。中国 国 家 主 席 习 近 平 同 志 曾 在 全国宣传思想工 作 会 议 上 指 出 ,把 党 的 理 论 和 路线方针政策变 成 人 民 群 众 的 自 觉 行 动 ,及 时 把人民群 众 创 造 的 经 验 和 面 临 的 实 际 情 况 反 映出来,丰 富 人 民 精 神 世 界,增 强 人 民 精 神 力 量。因此,网络舆情 监 测 至 少 具 有 三 个 方 面 重 要的 意 义: 中 国 特 色 社 会 主 义 文 化 建 设 的 需 要;公共决 策 科 学 化 和 民 族 化 的 需 要; 社 会 主 义民主政治建设的需要。 1. 2 大数据与 Hadoop 随着科学技术的进步特别是微电子技术的 快速发展,计 算 机 及 移 动 智 能 设 备 的 运 算 速 度 不断提高,存储器容量不断扩大,以计算机和手 机为代表的智能设备已经成为人们工作与生活 中的必 需 品。同 时,人 们 在 使 用 各 类 智 能 设 备 的过程中,将 有 意 或 无 意 的 产 生 大 量 不 同 类 型 的数据,这些数据是“大数据”的重要组成部分。 大数据 就 是 针 对 海 量 数 据 的 储 存 及 使 用 提 出 的,通过对 海 量 不 同 结 构 数 据 进 行 有 目 的 的 分 类与处理,得 到 某 些 隐 藏 在 数 据 表 象 下 深 层 规 律的方法。 Hadoop 是在大数据背景下提出的,目标是解 决大数据集在储存、管理、查询和分析带来的挑 战。Hadoop 具体实现是通过由大量计算机组成 “集群”的控制与管理。它的优势包括快速访问 集群内不同计算机上存储数据的能力;通过失效 转移提高可靠性;集群内的计算机数量可以根据 。这些功能都由 Hadoop 内不同 需要进行扩展[6] 组件实现,核心组件见图一。 38 中国煤炭期刊网 www.chinacaj.net
华北科技学院学报 2018 年第 4 期 在已经抓取的新闻内容中进行搜索,得到相关新 闻列表后,在读取这些新闻对应的评论信息。最 后,通过对这些评论的分析得到监测结果。因本 舆情监测方案抓取数据量较大,并且此程序需要 长时间运行,因此本程序选择部署在 Hadoop 管理 的集群上是适合的。 2. 1 新闻报道与评论数据获取 本程序需要抓取的资料分别是新闻报道和网 图 1 Hadoop 核心组件 友发表的评论,具体流程如图 2 所示: 2 模型设计 本网络舆情监测方案基本思想是抓取新闻门 户网站发布的新闻( html 格式) 和对应评论页面 的入口地址,再通过得到的评论入口地址,抓取评 论信息。新闻内容只抓取一次,对应的评论信息, 每小时抓取一次,并进行去除重复处理。本程序 的网络舆情监测结果,是通过用户提供的关键字 图 2 新闻和评论资料获取流程 图 3 新闻评论入口网址分析 资料获取过程几点说明: (1) 网址生成:根据不同新闻报道页面特点 生成网址。例如,凤凰网( ifeng. com) 新闻发布页 面网址的特点是" http: / / news. ifeng. com / a / " +日 期 +" / " + 8 位 随 机 数 +" _ 0. shtml" ( 如: http: / / news. ifeng. com / a /20170728 /51523893_0. shtml) . 在本程序具体实现时,需要对“/ ”进行转义,因为 “/ ”在 Hadoop 环境下属于特殊字符,不进行转义 将产生非期望结果。 (2) 网址有效性检查:如果网址无效,新闻门 户网站会返回错误提示页面,不能抓取到新闻报 道。因此,可以根据访问页面 html 语言的结构特 点进行判断。 (3) 新闻和评论页面“超链接”网址抓取:如 48 中国煤炭期刊网 www.chinacaj.net
第 4 期 梁永春等:基于大数据新闻网站文本挖掘的网络舆情监测设计与实现 果是正确的网址可以在此页面指定位置读取到需 要的内容。本程序网页内容抓取通过 Python 语 言的 Beautiful Soup 模块实现[7] 。 (4) 为了反映此新闻的关注度和留言的变化 情况,会在一定的时间周期内再次访问评论页面 获取数据。因此,每次抓取到的评论要与前一次 比较,去掉重复内容。具体实现时,为了提高去掉 重复评论内容的效率,创建独立文件保存每次抓 取的评论中最新评论者的网名和评论时间。再次 抓取此新闻评论时,先从独立文件中读取上一次 抓取到的最新一条评论的网名和评论时间数据, 再对新评论页面进行查找,抓取本次时间周期内 网友新发布的评论。新闻门户网站的评论展示, 通常都是时间倒序式排列,找到与独立文件中网 名和发布时间都吻合的这条评论,它之前的评论 就是需要抓取的新增评论。 2. 2 特定新闻事件的舆情分析 热点新闻事件通常是可以引起全社会关注和 热烈讨论的事件。同时,大量的热点新闻事件是 由系列新闻报道或追踪报道组成,因此特定事件 的舆情分析,首先要获取与特定新闻事件相关的 新闻报道。本程序的实现方法是通过特定事件的 关键字,在抓取的新闻内容中进行相关报道查找。 查找到的结果就是与特定关键字相关的新闻报 道,再通过查找这些新闻报道对应的网友评论,最 后对这些评论进行分析得到结果,流程如图 4。 图 4 通过关键字分析舆情流程 通过关键字提取相关新闻时,优先匹配新闻 标题,其次是新闻内容。在具体实现时,为了提高 提取效率和准确性,提前对新闻进行关键字提取。 在对评论进行分析时,也是通过先对网友发表的 评论进行关键字提取,再通过这些关键字得到网 友对此新闻的态度和看法。 2. 3 评论内容分析 抓取到的评论内容中通常有大量无统计意义 词汇,这些词汇的存在影响关键词提取的效率和 准确性,因此对获取的原始评论数据先进行干扰 词清洗。本程序的方法是建立一个干扰词表,将 无统计意义的词放入到这个词表。并对原始的评 论数据利用干扰词表进行清洗。 对于经过清洗的评论,进行情感词提取。网 民评论中通常含有表明网民情感态度的情感词, 此类词数量不多,可以通过建立情感词表进行有 针对性的提取。这样做的好处是可以通过准确提 取评论中的情感类词汇,较为准确直接获取此网 友对此新闻的态度。同时,这也是对评论中情感 类词汇的一次清洗,提高下一步评论关键词提取 的效率。 经过无统计意义词和部分情感类词汇滤除, 原评论的数据量有了一定程度的减小和语句也进 行了分割( 为了避免歧义的发生,对词语被过滤 处插入空格) 。本程序关键词提取采取 python 语 言中文分词组件 jieba 实现。结巴分词( jieba 组 件),其功能包括支持三种分词模式( 精确模式、 全模式、搜索引擎模式) ,支持繁体分词,支持自 定义词典等[8] 。本程序采取结巴分词中的精确 模式( 即,尽 量 将 句 子 用 最 准 确 的 方 法 分 开 ) 实现。 2. 4 非察觉内容分析 各类新闻门户网站提供的新闻评论信息除网 友主动输入内容外,还有部分是系统自动生成的。 例如,网友发布评论的时间,地点等信息。这部分 信息通常具有可信度高和格式较为固定的特性。 因为非察觉内容有这两种特性,所以这类信息获 取是必要的和容易的。本程序中是通过正则表达 式对这部分信息进行获取。正则表达式是进行字 符串处理的高效工具,可以通过预定义的特定模 式去匹配具有共同特征的数据[9] 。 3 程序运行结果与分析 3. 1 网民发布评论时间统计 本程序 的 数 据 直 接 来 源 有 163 新 闻 ( news. 163.com) 、新浪新闻( news. sina. com. cn) 、一点资 讯( www.yidianzixun.com) 、今日头条( www.toutiao. com) 和凤凰新闻( news.ifeng.com) ,这五个网站每 日的评论数大概在 4. 8 亿条左右,并且呈现一定 的规律性。图 5 表明,每日网友评论发布数量在 58 中国煤炭期刊网 www.chinacaj.net
华北科技学院学报 2018 年第 4 期 零点后会逐渐减少,在凌晨四点到五点间到达到 最少,然后开始上升,中午十二点到一点左后会达 到一个小高峰,然后会有一个降低,但在下午三点 后开始回升,晚上十二点左右达到高峰。 网友发布评论数量与发布时间的变化关系和 人的作息时间基本一致。评论数量一般与阅读数 量成正比,因此如果想让新闻快速让更多人去浏 览,可以在晚间 20 点至 23 点时段发布,同理,此 时间段广告效果最好。 图 5 网友发表评论数量与发表时间统计 3. 2 中美贸易战 2018 年 3 月 22 日,美国总统特朗普在白宫 签署了对中国出口到美国商品征收关税的决定。 次日,中国商务部发布针对性回应,标志着中美贸 易战正式开始。此事件备受关注,各新闻媒体都 进行了大量报道。同时,这场贸易战也成为广大 网民热议的焦点问题,网友们纷纷通过各大新闻 门户网站关注相关报道,并通过各网站评论栏,表 达对此新闻报道的观点和想法。以下是通过本系 统,得到 2018 年 3 月 20 日至 2018 年 7 月 1 日时 间段内关于中美贸易战网友发表评论较多的新闻 报道和对应网友评论中抓取的关键字。 发布评论数量排名前十的地区是: 广东、浙 江、北 京、江 苏、上 海、山 东、四 川、福 建、湖 北、 河南。 热点 新 闻 事 件 的 选 出,比 较 有 代 表 性 的 是 PageRank 算法[10] 。但由于本程序的目标是统计 网民对不同新闻报道的关注程度而不是统计新闻 的重要性,因此本程序通过网友对新闻发表评论 量来确定新闻报道页面的排名权重。从表 1 中网 友关注的新闻标题可以看出,“中美贸易战”系列 新闻报道中,网民普遍关注的相关新闻报道角度 包括:贸易战对中国经济的影响,贸易战对中国发 68 展的影响,中国政府对贸易战的态度和回击措施 和美国与其它国家的经济关系的变化。 分析从网友评论中抓取的情感关键词,反映 出中国大部分网友对中国政府在此次中美贸易战 的应对措施是认可和支持的。同时,分析表 1 中 抓取到的观点关键字,可以得出网友们对“中美 贸易战”相关热点问题的观察与思考。网友评论 中的观点关键词,可以分成以下四组: 第一组:应对 奋斗 教训 发展 回击 机 会 使命 责任 抗击 国内很多主流媒体的新闻报道指出“中美贸 易战”发生的根本原因是中国提出“强国”战略。 部分美国学者认为,中国的强国战略将使美国丧 失世界霸主地位和全球第一大经济体的宝座。因 此,美国希望通过贸易战,打击世界第二大经济 体———中国,使其放弃或修改“强国”战略。从这 些关键词可以看出,广大网友是支持“中国共产 党第十九次全国代表大会”中提出的到 2050 年把 中国建成富强民主文明和谐美丽的社会主义现代 。当然,网友也清醒的认识到,美好蓝 图的实现不会是一帆风顺,需要应对发展中出现 的各种问题和阻力。“中美贸易战”的是发展中 遇到的一次考验,网友的评论关键字表明,他们希 化强国[11] 中国煤炭期刊网 www.chinacaj.net
第 4 期 梁永春等:基于大数据新闻网站文本挖掘的网络舆情监测设计与实现 望中国政府进行抗击和回击,教训美国的“霸权 主义”,这也是当代中国人的责任和使命。 新闻标题 机构解读贸易战对 A 股影响: 短期有冲击 利空 7 板块 外媒:中美贸易战,中国是否 会重蹈日本的覆辙? 刘鹤: 中美达成共 识 不 打 贸 易战 全球贸易战开打! 美国突 然 先和这些国家干起来了 中国将强有力回击美国发动 的贸易战 表 1 中美贸易战舆情分析结果( 2018-3-20 至 2018-7-1) 新闻来源 发布时间 情感关键词 观点关键词 凤凰网 2018-03-23 好好 中美 台湾 国债 调整 旅游 应对 相处 威胁 新浪新闻 2018-04-08 雄起 帮助 机会 遏制 弹劾 奋斗 危难 抗击 股票 教训 野心 新浪新闻 2018-05-20 观望 国内 投资 共赢 发展 责任 使命 能源 芯片 管制 两败 凤凰网 2018-06-01 误导 打脸 感谢 孤立 盟国 谈判 谋略 淫威 胁迫 围攻 科技 蜕变 加息 物资 农业 工业 战争 新浪新闻 2018-06-15 点赞 支持 力挺 对抗 拥护 回击 第二组:国债 旅游 农业 既然是“贸 易 战”意 味 双 方 手 中 都 有 筹 码。 网友提到的这三个词反映的就是当前中国手中的 部分筹码。中国目前是美国最大的债权国,“国 债”( 此处特指,中国政府购买的美国债券) 成为 评论的热点问题。网友们对“国债”也有不同的 看法,有的网友认为通过“国债”可以看出双方经 济的互补性,贸易战对双方的经济都有损害;也有 网友认为中美贸易摩擦的加剧,会影响到中国对 美国的债券投资。中国日报 2018 年 3 月 1 日公 布《2017 年中国出境旅游大数据报告》,根据此报 告提供的 数 据 2017 年 中 国 公 民 出 境 旅 游 突 破 1. 3 亿人次,花费达 1152. 9 亿美元,保持世界第 一大出境旅游客源国地位。因此,中国人旅游目 的地的选择,将直接影响当地的经济收入。中国 商务部公布的应对美国发起的贸易战的措施,包 括增高原产于美国农产品关税。长期以来,关于 转基因食品的安全性讨论中,农产品的进口就是 讨论的热点问题。有部分网友指出,中美贸易战 的发生,减少了转基因农产品的进口是好事。 第三组:芯片 科技 工业 能源 台湾 这组词是网友们总结的在中美贸易战中,美 国方面主要着力点。高科技领域是中国的短板, 特别是芯片领域,“中兴事件”就是真实写照[12] 。 我国石油天然气资源相对不足,是当前中国经济 和社会发展中的短板。台湾是中国的一部分,因 为还没有统一在中华人民共和国的领导下,并且 台湾与美国有长期的历史渊源,所以“台海”关系 一直是中美关系中不可回避的热点问题[13] 。从 “中美贸易战”爆发以来,关于台湾的新闻报道量 和网友的关注度都有增加。 第四组:孤立 盟国 围攻 这组词是网友提出的应对“中美贸易战”的 战略方针。美国发起的这场贸易战是反经济全球 化的,在当今世界经济“一体化”的大背景下是不 和谐的,因 此 美 国 会 遭 到 孤 立 和 围 攻。表 1 中 “全球贸易战开打! 美国突然先和这些国家干起 来了”的新闻说明的正是这个方面。 第五组:两败 共赢 这组词是网友对“中美贸易战”未来前景的讨 论。共赢的结果是两国人民的期盼,但“贸易战”长 时间,大范围的进行,最后的结果只能是两败。 4 结论 本文设计并实现了一种通过抓取新闻门户网 站新闻报道和对应网友评论,实现网络舆情监测 的程序。程序运行结果表明,对非察觉内容统计 与分析可以得到网友评论条数增长量与时间的对 应关系。此关系揭示了网络舆情监测的重点时 段,因此对网络舆情监测优化和商业广告推广具 有指导意义。通过对抓取到的新闻报道和对应网 友评论的关键字提取,可以获取网友对指定新闻 事件相关报道关注度的差异。同时,也可以对提 取的关键字进行二次人工提取和分类,感知网友 们的思维角度与表达的观点。 参考文献: [1] 中国互联网络信息中心,李静 . 第 41 次《中国互联网络发 ( 下转第 92 页) 78 中国煤炭期刊网 www.chinacaj.net
华北科技学院学报 2018 年第 4 期 和恶性,适当的通货膨胀可能会对经济的增长有 帮助,能起到促进作用;但如果通货膨胀一直持续 而没有消减或者情况越来越严重,会对经济增长 非常不 利,且 会 抑 制 经 济 增 长,后 果 是 非 常 糟 糕的。 本文基于 VAR 模型,通过对 1995 年到 2016 年 22 年间通货膨胀和经济增长之间关系的实证 研究,结果表明:经济增长当期对通货膨胀有一个 正向影响,经济增长滞后一期对通货膨胀有一个 负向的影响,随着滞后期的增加,负向影响逐渐减 弱,到滞后三期时,其对通货膨胀的影响几乎为 零。通货膨胀当期对经济增长几乎无影响,但通 货膨胀滞后一期对经济增长有一个正的影响,通 货膨胀滞后二期及以后,对经济增长的影响几乎 为零。 参考文献: [1] 徐国祥 . 金融统计学[M]. 上海:格致出版社,2016. [2] Sims C A. Macroeconomics and Reality [J]. Econometrica, 1980,48(1) :1-48. [3] 李玉双,陈乐一,曾阿梅 . 市场化进程中通货膨胀与经济增 长:1978—2008 年[J]. 经济问题探索,2011(1) :1-4. [4] 柳智毅,刘毅 . 澳门通货膨胀对经济增长的影响[J]. 广东 社会科学,2015(6) :137-143. [5] 乐怡婷,章洪量 . 经济增长和货币政策对中国通货膨胀影 响的 SVAR 模 型 分 析[J]. 商 业 经 济 研 究,2016 ( 5) : 114 -116. [6] Fountas S,Ioannidis A,Karanasos M. Inflation,Inflation Uncer- tainty and a Common European Monetary Policy [J] . Manchester School,2004,72(2) :221-242. [7] 葛翔宇,宋志秀,俞凡 . 利率、汇率、经济增长与通货膨胀关 系的统计检验[J]. 统计与决策,2013(9) :149-153. [8] 孙少岩,王江 . 通货膨胀、信贷传导与经济增长[J]. 广东 社会科学,2017(2) :19-27. 櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋櫋 ( 上接第 87 页) 展状况统计报告》发布[J]. 中国广播,2018(3) :96. [8] 周红伟 . 商品评价信息的中文情感分析[D]. 杭州:浙江 [2] 王青,成颖,巢乃鹏 . 网络舆情监测及预警指标体系构建研 工商大学,2015. 究[J]. 图书情报工作,2011,55(8) :54-57. [9] JanGoyvaerts,StevenLevithan. 正则表达式经典实例[M]. 人 [3] 杨宗亮,张玉茜,李建飞 . 一种基于地理空间大数据的网络 民邮电出版社,2010. 舆情监测软件架构[J]. 测绘通报,2017(3) :96-100. [4] 鄢睿 . 人工智能视域下网络舆情监测的变革之道[J]. 传 媒,2017(20) :51-53. [10] Langville A N,Meyer C D. Google’s pagerank and beyond: The science of search engine rankings[M]. Princeton Univer- sity Press,2011. [5] 侯 东 阳 . 舆 论 传 播 学 教 程[M]. 广 州: 暨 南 大 学 出 版 [11] 佚名 . 中国共产党第十九次全国代表大会[J]. 中国建材 社,2009. 科技,2017(5) :135. [6] 张良均 . Hadoop 大数据分析与挖掘实战[M]. 北京:机械 [12] 钮文新 . 中兴事件激发“中国芯”[J]. 中国经济周刊, 工业出版社,2016. 2018(16) :3. [7] RichardLawson. 用 Python 写网络爬虫[M]. 北京:人民邮 [13] 钟厚涛 . 特朗普台海政策前瞻及其对两岸关系的影响 电出版社,2016. [J]. 现代台湾研究,2017(2) :44-51. 29 中国煤炭期刊网 www.chinacaj.net
分享到:
收藏