2026-03-3110 minZHGSPO Paper Notes对 Group Sequence Policy Optimization 的动机、目标函数和稳定性分析的阅读笔记。RLHFPaper NotesOptimization阅读全文↗
2026-03-3124 minZHTransformer Paper Notes对 Transformer 论文的结构化阅读笔记,包含自注意力、位置编码、训练策略与常见为什么问题。TransformerPaper NotesAttention阅读全文↗