logo资料库

读书笔记之10情感分析论文阅读.docx

第1页 / 共4页
第2页 / 共4页
第3页 / 共4页
第4页 / 共4页
资料共4页,全文预览结束
自然语言处理之情感分析 文献[1],情绪原因识别就是针对文本中出现的被描述者的情绪,抽取触发被描述者情 绪产生的原因信息。提出了一种基于 E-CNN 模型的情绪原因识别方法,不同于目前的情绪 原因识别方法,而是利用词向量和卷积神经网络,同时融合了句子的语义信息进行情绪原因 识别。融合和处理好上下文信息,卷积神经网络充分考虑句子所有的词义信息,情绪原因句 与非情绪原因句在实际语料中存在极不平衡情况,提出 E-CNN 模型,增强了因果句子的显 示特征,在 E-CNN 模型中加入了 attention 机制,增强对情绪原因句的识别。 文献[2-3],采集用户评论信息,通过情感分析的方法量化评论信息中的用户主观感受, 进行对商品/商家定量评估,情感分析本方法主要有基于机器学习和基于情感词典两类。 文献[2-3],基于裁判文书对判决结果倾向性分析任务中,为了探究词向量质量、深度 神经网络层数及上下文信息对深度学习模型的影响,设计了 E-LSTM、W-LSTM、W-BLSTM 三个模型。其中 E-LSTM 是 Embedding 层和 LSTM 网络联成一个网络 W-LSTM 模型;W-LSTM 是一裁判文书为语料库单独训练词向量,在进行 LSTM 模型分析;W-BLSTM 模型采用的是 双向 LSTM。实验结果:词向量质量与模型准确率呈正相关性。层数对模型的准确性先增加 后下降,上下文信息对模型影响不大。 文献[4],提出了结合语义和情感信息的词向量学习模型,该模型包括词语的上下文以 及组成词语的字的语义信息、句子的情感记性信息和词语的情感记性信息,通过这样的方式 使得在中文情感词典构建中的词向量能够更好地表达词语的语义以及情感特征。最终的得到 中文情感词典。 文献[5],针对传统卷积神经网络在 web 文本分类上表现平庸,提出了基于改进型 CNN+SVM 的 web 文本分类算法模型:使用 glove 工具构建 web 文本词向量,然后把卷积 神经网络更改为 5 个平行放置的 CNN 模型进行训练,采用传统的 SVM 分类器输出结果, 准确率接近 92.5%。又提出了基于自注意力和双向 GRU 的 web 文本情感分析算法模型:BiGRU + Self-attention,采用 word2vec 构建 web 文本词向量,在传统的 CNN 模型上进行特征筛 选,同事将所得数据输入引入自注意力的双向 GRU 模型进行训练,最后通过 SVM 分类器输 出分类结果,准确率达到 93.9%。 文献[6],为提高词向量区分情感倾向类别的能力,提出了基于情感语义对比信息的词 向量学习模型。为提高情感词典区分情感倾向类别的能力,提出了一种基于种子词扩展的情 感词典构建方法。为提高文档情感倾向分类准确度,又提出了一种基于语言知识注意力机制 的文档情感倾向分类模型。 文献[7],针对有监督学习方法过度依赖标注数据和电商产品品类众多,无法对每个品 类的评论数据进行单独标注的客观情况,作者提出基于深度学习的规则库学习,能够提高情 感分析系统的泛化性。 文献[8],提出采用长短时记忆网络(LSTM)文本分类算法进行情感倾向分析,【采用的 方法是: 首先利用 Word2vec 和分词技术奖评论短文本文本处理为计算机可理解的词向量 传入 LSTM 网络并加入 Dropout 算法以防止过拟合得出最终的分类】 文献[9],提出一种基于 LSTM 模型,加入前馈注意力模型,根据准确率召回率、F1 测 度衡量指标。【Attention+LSTM】。 文献[10],融合主题特征的深层次注意力的 LSTM 模型(AE-DATT-LSTM),通过 BILSTM 将主题词向量和文本词向量进行训练,得到主题特征和文本特进行特征融合,经过深层注意 力机制的处理,由分类器得到相应主题的情感分类结果。相比较之前基于注意力的情感分析 模型在准确率和稳定性上有了进一步的提高。引入主题特征和深层次注意力机制,对特定主 题的情感分类任务具有重要的意义,为舆情分析、问答系统、文本推理等领域提供了方法的 支持。
文献[11],相关模型的效果十分依赖输入文本的表示,也就是词向量,如果文本表示不 准确,网络训练容易因噪声导致过拟合。作者针对改善文本卷积神经网络中输入文本的表示 质量,提出一种结合词性(part of Speech ,POS)特征改进的文本卷积神经网路模型。通 过词性特征来捕捉传统从向量无法 识别额的文本一次多义现象,并与输入文本原始表示方 法相结合构建了卷机神经网络的双通道输入。 文献[12],整理了现有的中英文情感词典资源,并且从知识库、语料库以及两者相结合 的角度,归纳现有中英文情感词典的构建方法,并分析各种方法的优缺点,同时也介绍了如 何自动构建情感字典。 文献[13],利用舆情分析、金融时间序列,结合国情,再利用自然语言处理进行对股民 的情感分析。根据固定区间内微博网民对某个股票的评价进行爬取。利用 snowNLP 模块进 行舆情的及绩效及情感分析,做出饼状图。最后结合舆情与历史数据,给予股民参考价格。 文献[14],提出了基于 LSA 和改进后的 TF-IDF 混合算法进行特征选择与提取,采用词 频法和文档频次法对停用词表进行增补,同事采用情感词典对其中部分情感词进行删减,构 建了银行领域停用词表。 文献[15],针对从上下文学习的语义词向量忽略词语本身的情感极性,传统的 CNN 未 考虑句子的结构信息这两方面的不足,提出了基于情感词向量的动态多池 CNN 情感分析模 型,利用 skip-gram 模型和情感词典来训练情感词向量,并采用动态多池的策略来分割句子, 保留了多个最大特征值。 文献[16],研究了以雪球网、新浪财经、微博及东方财富网等互联网金融平台社交因素 对股票价格波动影响,帮助投资者改善投资策略。 文献[17],以 IMDB 影评数据集为英文数据集、以设计 6 个领域的商品评论为中文数据 集,使用 ConvBiLSTM 网络(卷积双向长短时记忆网络)方法(主要在 BiLSTM 网络前加入 卷积层,用来提取初级特征,重组特征图,以序列化形式输入到 BiLSTM 网络提取高级特征) 实现模型的建立。结果表明:ConVBiLSTM 网络相对其他传统网络模型取得了较好的分类效 果。同时,作者在 ConvBiLSTM 神经网络模型中又加入了注意力机制(Attention Model), 实验结果表明:加入注意力机制后的结果优于未加入 Attention 的分类结果。 文献[18],通过分析评论文本,研究影响酒店用户 满意度的因素,为管理者提供建议。 采用 Word2vec 对 Tripadvisor.com 酒店评论进行特征抽取和降维,结合情感分析技术,提 取每类特征对应的情感,构建计量经济模型分析酒店特征评价与用户满意度的关系。 文献[19],提出了一种将卷积神经网络长短期记忆(CNN-LSTM)与马尔科夫蒙特卡罗 (MCMC)方法结合的混合模型,通过社交媒体中的会话数据,采用以上模型,可用于模拟 情绪转变和异常情绪检测的智能对话系统。 文献[20],对比了长短期记忆网络、doc2vec、CNN 在深度学习模型上的情绪表现。实 验结果表明:深度学习模型可以有效地预测金融情感分析,卷积神经网络是预测 StockTwits 数据集中的情绪最佳模型 文献[21],为了更好地学习不同目标的情感信息和识别不同目标的情感极性问题,以及 针对注意力和 LSTM 序列输入网络相结合的网络模型训练时间长且无法对文本进行平行化 输入问题,提出了一种基于多注意力机制的卷积神经网络(multi-attention convolution neural networks, MATT-CNN)的特定目标情感分析方法。相比基于注意力机制的 LSTM 网 络,该方法可以接收平行化输入的文本信息。最后在 SEMEVAL2014 数据集和汽车领域数据 集进行实验,取得了比普通 CNN、单注意力 CNN 和注意力机制 LSTM 网络更好的效果。 文献[22],论文采用 Amazon 的 multi-domain sentiment datasets 和 Sanders(包含了 5513 条与四家 IT 公司相关的人工分类推文:苹果、微软、google、推特)两个情感数据集, 1000 个正面评论、1000 个负面评论,利用这些评论再采用 SVM+Attention(支持向量机和
最小二乘法相结合)方法进行训练分类,最后得到分类器。 文献[23],在大数据时代,人工分析信息是一项繁重的任务,需要借助工具挖掘信息/ 情感,针对于网络工具的选择,作者提出了人们应该对评估工具应该有一个概念,并且结合 了工具的评价结构,对 20 种工具进行比较。基于推文中的评论,判断正负面情绪,利用正 确率、召回率、预测准确率来评价 20 种工具。 [1] 慕永利,李 旸,王素格基于 E-CNN 的情绪原因识别方法[J] 太原 山西大学计算机与 信息科技与技术学院,2018,32(2)120-128 [2] 孟 鑫,基于用户评论信息的商品评估系统的研究[D],北京 北京交通大学电子与通信 工程学院,2018.6 [3] 於 雯, 周武能,基于 LSTM 的商品评论情感分析[J] 计算机系统应用 2018,27(8) 159-163 [4] 王业沛,基于深度学习的判决结果倾向性分析研究[D], 南京 南京大学软件工程 [5] 杨玉凡,中文情感词典构建中词向量学习技术的研究与应用[D] 南京 南京大学, 2018.05 [6] 王治权,基于注意力机制和改进型 RNN 的 web 文本情感分析研究[D],兰州 兰州大学, 2018.5 [7] 陈 静,基于语言知识的文本情感分析技术研究[D]合肥 中国科学技术大学计算机应用 专业,2018.04 [8] 卢建东,基于深度学习的细粒度中文情感分析及规则库学习[D],北京 北京邮电大学 信 息与通信工程学院。2018 .03 [9] 於 雯, 周武能,基于 LSTM 的商品评论情感分析[J] 计算机系统应用 2018,27(8) 159-163 [10] 胡荣磊, 芮 璐, 齐 筱, 张昕然. 基于循环神经网络和注意力模型的文本情感分 析[J/OL]. 2019, 36(11). [2018-08-10]. http://www.arocmag.com/article/02-2019-11-025.html. [11] 胡朝举, 梁 宁. 基于深层注意力的 LSTM 的特定主题情感分析[J/OL]. 2019, 36(5). [2018-03-09]. http://www.arocmag.com/article/02-2019-05-008.html. [12] 何鸿业,郑 瑾,张祖平,基于词性结合的卷积神经网络文本情感分析[J],计算机工程 2017.12.23,http://kns.cnki.net/kcms/detail/31.1289.TP.20171123.1611.004.html [13] 王 科, 夏 睿. 情感词典自动构建方法综述. 自动化学报, 2016, 42(4): 495−511 [14] 张 旭, 薛 雷,李敦宇,基于金融实践序列和舆情分析的股票分析系统[J],工业控制 计算机 31(4)113-115 [15] 李迎迎,面向银行微博文本的情感分析方法研究[D],北京 北京交通大学通信与信息系统 学院,2018.03 [16] 马树东,社交数据和股票价格波动关系的研究[D],哈尔滨工业大学管理学院,哈尔滨 哈 尔滨工业大学 2016 [17] 闫勇莉,基于改进 LSTM 的文本情感分析研究[D],大连 大连海事大学计算机科学与技 术学院 2018.03
[18] 吴维芳,高宝俊,杨海霞,孙含琳,评论文本对酒店满意度的影响:基于情感分析的方 法[J],现代图书情报技术,2017.1(3):62-71 [19] Xiao Sun,Chen Zhang,Lian Li,Dynamic emotion modelling and anomaly detection in conversation based on emotional transition tensor[J], Information Fusion Volume 46, March 2019, Pages 11-22 [20] Sahar Sohangir ,Dingding Wang,Anna Pomeranets,Taghi M. Khoshgoftaar,Big Data: Deep Learning for financial sentiment analysis[J], Journal of Big Data December 2018, 5:3 [21] 梁斌,刘全,徐进,周倩,章鹏,基于多注意力卷积神经网络的特定目标情感分析[J], 计算机研究与发展 DOI:10.7544/issn1000-1239,2017,2017017854(8):1724-1735,2017 [22] Zhigang Yuan, Sixing Wu, Fangzhao Wu, Junxin Liu, Yongfeng Huang, Domain attention model for multi-domain sentiment classification[J],EISEVIER Knowledge-Based Systems 155(2018)1-10 [23] Vishal Vyas, V.Uma(2017)”An Extensive study of Sentiment Analysis tools and BinaryClassification of tweets using Rapid Miner”(in India)
分享到:
收藏