📄️ LLM推理面试题(按Pipeline)文档定位:把 LLM 推理面试题按“真实推理链路”组织,而不是按零散主题堆放。这样更适合建立整体系统观,也更方便在面试中按阶段展开。📄️ 推理优化专题文档定位:面向 LLM 推理面试的高频原理速记。重点不是背定义,而是回答时能够说清楚 为什么有效、优化了哪个指标、新的 trade-off 是什么。📄️ 推理面试查漏补缺审查对象:InferenceOptimization.md