NLP旧时代
LSTM + Attention
今 天 的 主 题
语言模型与词向量
RNN 与 LSTM
Attention 机制
Transoformer
预训练语言模型
语 言 模 型 与 词 向 量
词 向 量 是 语 言 模 型 的 副 产 物
语 言 模 型 :AR vs AE
AR :
AE :
词 向 量
一个假设:如果两个词的上下文分布相近,那么这两个词在语义上相近
Attentin 机制
从 A t t e n t i o n 的 原 理 到 A t t e n t i o n 的 进 展
以机器翻译为例: Sequence to Sequence
who
am
I
Encoder
C
Decoder
我
是
谁