012026-06-0512 minZHSFT Variants: From SFT to DFT to ASFT从交叉熵、重要性采样和 RWR 下界出发,解释为什么 DFT 是概率加权的 SFT,为什么它会漂移,以及 ASFT 如何用 forward KL 锚定这条路线。LLM Post-TrainingSFTDFTASFT阅读全文→