2025
22 posts
- Policy Gradients
- MiniMind2-Small 全流程尝试
- Attention 机制
- GRU+LSTM+深层 RNN+双向 RNN
- 循环神经网络 RNN
- 多 GPU + 并行 + 分布式训练
- 批量归一化 BatchNorm
- CIFAR-10-Training
- 卷积神经网络 CNN
- 数值稳定性——模型初始化和激活函数
- 丢弃法|暂退法 Dropout
- 模型容量、过拟合和欠拟合
- 感知机
- PyTorch 库 API 总结
- 基础优化算法
- PyTorch 自动微分与反向传播
- 线性回归模型
- 向量的微分
- 空间解析几何总结
- Needleman Wunsch 和 Smith Waterman 算法
- Astro 结构简析
- 建站第一弹