Perf Model Framework 设计文档
本目录包含 perf_model 框架的分层设计文档,对齐 CHIPMathica 方法论,
描述当前仓库 (backend/perf_model/) 的实际架构与实现。
文档索引
| 文档 | 内容 |
|---|---|
| 00-architecture.md | 总体架构、双路径设计、数据流、配置管线 |
| 01-l0-entry.md | L0 入口层: API、EvalConfig、配置加载、任务管理 |
| 02-l1-workload.md | L1 负载层: WorkloadIR、Layer/Op 模型、DeepSeek V3 |
| 03-l2-arch.md | L2 架构层: 5 级硬件层级、ChipSpec、TopologySpec |
| 04-l3-common.md | L3 公共层: ParallelismPlanner、DistributedModel(两路共用) |
| 04b-l3-math.md | L3 Math 路径: TilingPlanner、Scheduler、ExecPlan |
| 05-l4-math.md | L4 Math 路径: EvaluationEngine、CostModel、CommProtocol |
| 06-l5-reporting.md | L5 报告层: ReportingEngine、CostAnalyzer、可视化 |
| 07-configs.md | 配置参考: chip / topology / model / benchmark YAML 格式 |
双路径架构
框架支持两种评估模式,在 L3 并行规划之后分叉:
| 路径 | L3 | L4 | 特点 |
|---|---|---|---|
| Math | TilingPlanner → ExecPlan | EvaluationEngine(代数模型) | 快速,覆盖完整推理流程 |
| G5 | InstructionEmitter → CoreProgram | G5SimEngine(事件驱动仿真) | 精确,逐周期仿真 |
L0、L1、L2、L3(ParallelismPlanner)、L5 为两路共用。
版本
- 文档版本: v3.0.0
- 对应代码:
backend/perf_model/ - 更新日期: 2026-02-25