跳到主要内容

Perf Model Framework 设计文档

本目录包含 perf_model 框架的分层设计文档,对齐 CHIPMathica 方法论, 描述当前仓库 (backend/perf_model/) 的实际架构与实现。

文档索引

文档内容
00-architecture.md总体架构、双路径设计、数据流、配置管线
01-l0-entry.mdL0 入口层: API、EvalConfig、配置加载、任务管理
02-l1-workload.mdL1 负载层: WorkloadIR、Layer/Op 模型、DeepSeek V3
03-l2-arch.mdL2 架构层: 5 级硬件层级、ChipSpec、TopologySpec
04-l3-common.mdL3 公共层: ParallelismPlanner、DistributedModel(两路共用)
04b-l3-math.mdL3 Math 路径: TilingPlanner、Scheduler、ExecPlan
05-l4-math.mdL4 Math 路径: EvaluationEngine、CostModel、CommProtocol
06-l5-reporting.mdL5 报告层: ReportingEngine、CostAnalyzer、可视化
07-configs.md配置参考: chip / topology / model / benchmark YAML 格式

双路径架构

框架支持两种评估模式,在 L3 并行规划之后分叉:

路径L3L4特点
MathTilingPlanner → ExecPlanEvaluationEngine(代数模型)快速,覆盖完整推理流程
G5InstructionEmitter → CoreProgramG5SimEngine(事件驱动仿真)精确,逐周期仿真

L0、L1、L2、L3(ParallelismPlanner)、L5 为两路共用。

版本

  • 文档版本: v3.0.0
  • 对应代码: backend/perf_model/
  • 更新日期: 2026-02-25