blog.whatsmy.fun

从「挽具」到自进化：Auto-Harness 与医疗智能体

系统梳理 Harness 的概念谱系、Auto-Harness 的自动化实现路径，并聚焦它在医疗智能体中的落地：安全护栏、患者记忆、工具调度与闭环自进化。

从交叉熵、重要性采样和 RWR 下界出发，解释为什么 DFT 是概率加权的 SFT，为什么它会漂移，以及 ASFT 如何用 forward KL 锚定这条路线。