logo资料库

基于tensorflow的机器写诗系统.pdf

第1页 / 共39页
第2页 / 共39页
第3页 / 共39页
第4页 / 共39页
第5页 / 共39页
第6页 / 共39页
第7页 / 共39页
第8页 / 共39页
资料共39页,剩余部分请下载后查看
晋 中 学 院 本科毕业论文(设计) 题 目 基于 TensorFlow 的机器 作诗系统的设计与实现 院 系 信息技术与工程学院 专 业 计算机科学与技术 姓 名 赵吉 学 号 1611112347 学习年限 2016 年 9 月到 2020 年 7 月 指导教师 武丽芬 教授 申请学位 理学学士学位 2020 年 5 月 1 日
晋中学院本科毕业论文(设计)开题报告及任务书 毕业论文(设计)题目 基于 TensorFlow 的机器作诗系统的设计与实现 学生姓名 赵吉 专业班级 计算机 1603 指导教师 武丽芬 选题目的和意义: 诗歌是人类文学皇冠上的明珠。我国自《诗经》以后,两千年来历代文人墨 客创作的诗篇灿若繁星。现代让机器自动生成诗歌,一直是人工智能领域一个有 挑战性的工作。传统生成方法非常依赖于诗词领域的专业知识,需要专家设计大 量的人工规则,对生成诗词的格律和质量进行约束。同时迁移能力也比较差,难 以直接应用到其他文体(唐诗,宋词和元曲等)。 由于机器作诗仍然极具新生性并且机器作诗背后的语言学原理和算法原理 仍然不够成熟。因此,研究机器作诗背后的算法原理具有重要意义。 本课题在国内外的研究状况和发展趋势: 高晓松说:“等有一天,机器做出了所有的音乐与诗歌,我们的路也会走完”。 这一天真的会到来吗?机器的“诗和远方”又会是怎样的呢? 2017 年 5 月,微软亚洲研究院发布了由智能机器人小冰创作的第一部人工 智能诗集《阳光失了玻璃窗》。这个里程碑事件也引起了计算机科学、语言学、 文学等领域对人工智能与诗歌本质的大讨论。 2018 年 3 月在央视的《机智过人》节目中,清华大学的机器作诗系统“九 歌”也得到了专业人士的赞誉。虽然这些作诗系统让人感到惊喜、有趣,但也有 许多人对人工智能创作的所谓“诗歌”抱负面态度。 诗歌的本质以及评判标准还很难界定,乃至机器人作诗是否具有版权,机器 人是否可以出版诗集等一系列问题都有待探索。随着人工智能领域的蓬勃发展, 人们也开始探索它在文艺领域的应用。在这方面,机器作诗无疑是最受热议的话 题之一。未来的机器写诗系统势必会融入更加多元化的信息,比如视频、音频、 社交网络结构等等,与推荐系统相结合,给人类生活带来更多的趣味。
主要研究内容: 1. python 全唐诗爬虫 2. TensorFlow 框架在机器作诗系统中的应用 3. RNN 模型和 LSTM 模型及其结构 4. RNN 和 LSTM 建模 5. 模型训练与评价方法 6. RNN 和 LSTM 在本系统中的对比及 LSTM 在本系统中的优越性 写作提纲(或设计方案): 1. 环境配置 2. 参数配置 3. 数据采集和预处理 4. batch 数据制作 5. RNN 及 LSTM 模型定义 6. 模型训练及评价 7. 模型测试 完成论文(设计)的条件、方法及措施: 1. 搜集训练模型所需的近 4 万首诗歌数据 2. 利用图书馆纸质、电子文献库查询相关文档 3. 参考 github 开源项目 4. 硬件环境: CPU: Itel(R) Core(TM)i7 8750HCPU @ 2.20GHz 2.20 GHz 及以上; 内存: 8GB 及以上; 软件环境: 操作系统: Windows10 及以上; 开发平台: pycharm + python3.6 + TensoFlow1.2(CPU 版本) 指导教师意见及建议: 年 月 日 签字:
基于 TensorFlow 的机器作诗系统的设计与实现 学生姓名:赵吉 指导教师:武丽芬 摘 要: 现如今自然语言处理在人类生产生活中起到极其重要的作用,随着各类机器 学习算法以及深度神经网络的发展,各类写诗机器人频频出现。本文通过机器写诗系 统研究循环神经网络(RNN)以及长短期记忆网络(LSTM)在唐诗写作方面的模型效果。 本系统基于谷歌开源深度学习框架 Tensorflow,利用 python 语言实现,将两种模型各 自作品分别写入 MongoDB,利用人工评估的方法对实验结果进行评价,其结果有力证 明了 LSTM 写诗模型的有效性。通过两种模型写作作品对比发现 LSTM 的写作效果明 显优于 RNN,最后进一步论述 LSTM 体现优越性的具体原因。 关键词: 机器作诗;TensorFlow;深度学习;循环神经网络;长短期记忆网络
Design and Realization of TensorFlow-based Machine Poetry System Author’s Name: ZHAO Ji Tutor: WU Li-feng ABSTRACT: Now natural language processing plays an extremely important role in human production and life, with the development of various machine learning algorithms and deep neural networks, all kinds of poem writing robots appear frequently. This paper research the model effect of RNN and LSTM in Tang poetry writing by means of machine poem writing system. This system is based on tensorflow of Google's open source deep learning framework, implementation with python.writing the works of the two models into mongodb respectively, using the method of artificial evaluation to evaluate the experimental results, the result proves the validity strongly of LSTM's poetry writing model. Through the comparison of the two writing models, it is found that the writing effect of LSTM is better than that of RNN, finally, the paper further discusses the specific reasons for the superiority of LSTM. KEYWORDS: Poetry by machine;TensorFlow;Deep learning;RNN;LSTM
目 录 1 引言 ....................................................... 1 1.1 研究背景与发展现状..................................... 1 1.2 本人主要工作 .......................................... 2 1.3 论文组织与结构 ........................................ 3 1.4 本章小结 .............................................. 4 2 算法基础及相关知识 ........................................ 4 2.1 深度学习概述 .......................................... 4 2.2 TensorFlow 框架概述 .................................... 4 2.3 神经网络概述 .......................................... 5 2.4 循环神经网络(RNN)概述及其结构 ......................... 7 2.5 长短期记忆网络(LSTM)概述及其结构 ...................... 9 2.6 RNN 与 LSTM 的差异 ................................... 10 2.7 LSTM 的优势 .......................................... 10 2.8 本章小结 ............................................. 11 3 系统设计与实现 ........................................... 11 3.1 问题分析 ............................................. 11 3.2 总体设计 ............................................. 12
3.3 详细设计 ............................................. 13 3.4 系统实现 ............................................. 20 3.5 本章小结 ............................................. 24 4 系统测试 .................................................. 24 4.1 测试方法 ............................................. 24 4.2 测试步骤 ............................................. 24 4.3 测试结果 ............................................. 25 4.4 测试结论 ............................................. 28 4.5 测试结论分析 ......................................... 28 4.6 本章小结 ............................................. 29 5 总结与展望 ................................................ 29 5.1 本文的主要贡献 ....................................... 29 5.2 下一步工作的展望 ..................................... 30 参考文献 .................................................... 31 致谢 ........................................................ 32
1 引言 语言是人类凌驾于一切物种之上的关键能力之一。在全部物种当中,唯有人类具 有语言表达以及理解能力。现如今人类研发的多种智能终端都与自然语言有着紧密的 联系。语言是人类进行逻辑思维的重要形式,语言文字是人类大多数历史文化及科学 知识能够载入史册和书籍并且代代相传下来的最关键形式。因此,在人工智能发展的 潮流中自然语言处理理所应当的成为了领域内的重要分支,乃至是核心部分。使人类 能够通过自然语言与机器进行无障碍通信,这是专业人士们长期以来所追求并为之不 懈努力的。人们可以通过自己日常使用的自然语言来与计算机进行交互,简易的使用 机器,而无需浪费时间和精力去学习非专业人士看起来晦涩难懂的计算机语言,从而 达到计算机辅助人类,减轻人类负担的目的。譬如当下火热的由小米公司研发的小爱 音箱,人们可以把小爱当作朋友一样与之进行简单的日常沟通,使之播放指定音乐或 者翻译英语单词等。 由于诗歌创作本身具有一定的难度,且对创作者本人的文化功底有较高的要求, 历朝历代写诗历来便是文人墨客的专属,也是人类智慧的重要表现。然而随着如今各 类机器学习算法以及深度神经网络的发展,人工智能产品如雨后春笋般层出不穷,尤 其是在自然语言处理方面取得巨大突破,使得人们不禁开始构想让机器人自己写诗的 场景。本文针对唐代诗歌,将其作为研究对象,详细论述了两种递归神经网络在机器 写诗模型中的应用以及各自的效果。 1.1 研究背景与发展现状 1.1.1 自然语言处理概述 自然语言处理(NLP)属于人工智能的一个子领域,其主要研究目的包括两个方 面:自然语言理解,让计算机理解自然语言文本的含义;自然语言生成,让计算机来 生成人类语言,使得普通人能够和与人一样去理解计算机的反馈信息。自然语言处理 的主要研究任务是:研究具备语言能力和语言应用的数学模型,创建和编码实现计算 框架并提出对应的办法持续改善模型,依据此般的数学模型设计有效地实现自然语言 通信的计算机系统,并研究关于系统的评测方法,最终实现用自然语言与计算机进行 通信。目前,具备一定自然语言处理能力的典范应用包括多语言分词系统、词性标注 系统,智能文本分类系统等。 1
分享到:
收藏