2026-03-3124 minZHTransformer Paper Notes对 Transformer 论文的结构化阅读笔记,包含自注意力、位置编码、训练策略与常见为什么问题。TransformerPaper NotesAttention阅读全文↗