JiangHuiKai
JiangHuiKai
发布于 2026-03-23 / 4 阅读
0
0

处理文本

#AI

组件

embedding

将词元首先映射到编号,再将数字编号映射成词向量。embedding的大小为词表大小 * 词向量大小

池化层

提取张量的局部特征,降低张量维度。

适合语言处理的网络结构

  • RNN:循环处理,每一时间步都结合了当前输入和上一时间步的隐藏层信息

  • CNN:局部特征提取,以卷积核为核心。

归一化层

归一化的必要:缩减数值之间的抖动幅度,避免权重的某些单元过大或过小,导致梯度计算时爆炸或消失,利于模型训练。

归一化的维度

  • batch归一化

  • lay归一化

dropout层

随机丢弃部分神经元,强制模型激活其余神经元,让每个神经元的权重较为均匀,避免模型过拟合。


评论