-
MiniMind2-Small 全流程尝试这是我有史以来写得最长的报告,好累啊!
75 min read Chinese -
Attention 机制库库刷课
13 min read Chinese - GRU+LSTM+深层 RNN+双向 RNN
让我们看看 pre-transformer 时代的 SOTA 吧
9 min read Chinese -
循环神经网络 RNNRNN 我来啦
10 min read Chinese -
多 GPU + 并行 + 分布式训练两种并行方式
5 min read Chinese -
批量归一化 BatchNorm归一化方法中的元老级存在
8 min read Chinese -
CIFAR-10-Training想进 LUD 呜呜呜
7 min read Chinese - 卷积神经网络 CNN
记得有点乱
14 min read Chinese