组件
embedding
将词元首先映射到编号,再将数字编号映射成词向量。embedding的大小为词表大小 * 词向量大小。
池化层
提取张量的局部特征,降低张量维度。
适合语言处理的网络结构
RNN:循环处理,每一时间步都结合了当前输入和上一时间步的隐藏层信息
CNN:局部特征提取,以卷积核为核心。
归一化层
归一化的必要:缩减数值之间的抖动幅度,避免权重的某些单元过大或过小,导致梯度计算时爆炸或消失,利于模型训练。
归一化的维度
batch归一化
lay归一化
dropout层
随机丢弃部分神经元,强制模型激活其余神经元,让每个神经元的权重较为均匀,避免模型过拟合。