在5月25日召开的电气电子工程师学会(IEEE)国际电路与系统研讨会(ISCAS 2026)上华为公司董事、半导体业务部总裁何庭波在题为《半导体新路径探索与实践》的主旨演讲中,正式发表“韬(τ)定律”。这是中国在全球半导体领域首次提出指导产业发展的新原则。

华为公司董事、半导体业务部总裁何庭波在题为《半导体新路径探索与实践》的主旨演讲中,正式发表“韬(τ)定律”。摄影:林渊

什么是“韬(τ)定律”?

“韬定律”提出以“时间(τ)缩微”替代“几何缩微”,作为半导体与电子系统演进的新指导原则。其目标是以系统性降低时间常数τ为核心,通过逻辑折叠(Logic Folding)等创新技术,持续压缩芯片内部的信号传播时延,从而不断提升晶体管密度,实现半导体与电子系统的持续演进。

四大技术路径:构建多层级协同优化体系

“韬定律”并非单一维度的技术改良,而是构建了贯穿器件、电路、芯片到系统层面的多层级协同优化体系。何庭波在演讲中详细阐释了四个层面的创新路径:

器件层面:通过优化晶体管和互连电阻及寄生电容,从物理底层最大限度缩微器件级时间常数

电路层面:通过逻辑折叠技术突破传统平面布局的物理边界,显著缩短关键路径的走线长度,有效降低信号传播的电阻和电容负载,实现晶体管密度和电路性能大幅提升;

芯片层面:通过“软件、架构、芯片”全栈软硬芯协同设计,基于实际工作负载实现指令流和数据流的细粒度控制,提高系统级并行度和效率,大幅降低端到端执行时间;

系统层面:定义灵衢总线,重构计算系统互联协议,实现超节点的统一内存编址和原生内存语义,大幅降低系统通信时延。

基于“韬定律”,华为在过去六年中已成功设计并量产了381款芯片,广泛覆盖了千行百业的需求。华为同时公布了未来路线图:即将于2026年秋季面世的麒麟手机芯片,将完整采用逻辑折叠技术,性能有望大幅提升;预计到2031年,基于“韬定律”的高端芯片晶体管密度将达到1.4纳米制程的同等水平。

如何理解“韬(τ)定律”?

通过查阅资料,笔者整理了一些信息供大家理解“韬定律”。大家可以把华为提出的“时间缩微(τ-scaling)”理解为:不再主要依赖“把晶体管做得更小”(几何缩微),而是让“信号在系统里跑得更快、更短、更少等待”。本质是把性能提升从“空间维度”转移到“时间维度”。

这个定律可以拆成两个核心问题讲清楚:

时间缩微怎么做、逻辑折叠是什么

一、时间缩微(τ-scaling)到底在缩什么?

在电路/系统层面,时间常数 τ 可以抽象为:

τ ≈ 传播路径长度 × 每级延迟 × 等待/同步开销

所以所谓“时间缩微”,就是系统性压缩这三件事:

1)缩短信号传播路径(物理+架构层)核心手段3D集成(Chiplet / 3D IC / 堆叠)

把“远距离走线”变成“垂直互连”

片上网络(NoC)优化

拓扑从Mesh → 局部集群化 → 分层网络

近存计算(Near/In-Memory Compute)

数据不搬运,计算靠近数据

本质是减少“线延迟(wire delay)”

在先进节点,线延迟已经超过门延迟,这是后摩尔时代的核心瓶颈之一。

2)降低单级逻辑延迟(器件+电路层)方法

更快的器件(FinFET → GAAFET)

电压/阈值动态调节(DVFS、Body Bias)

更激进的标准单元设计(低Vt、高驱动)

本质上就是缩短“每一步计算”的时间3)减少等待时间(架构级最关键)

这是“时间缩微”最核心、也是华为强调的重点:方法

更深流水线(Pipeline)乱序执行(OoO)数据流架构(Dataflow)异步电路(Async Logic)消除全局同步(Clock Domain优化)本质上就是 减少“空转时间”和“同步等待”二、逻辑折叠(Logic Folding)是什么?

一句话定义:

逻辑折叠 = 用“时间复用”代替“空间复制”,把大规模并行逻辑压缩到更小的物理面积里运行。

直观理解(非常关键)

传统思路(几何扩展):

100个运算 → 用100个算子并行做

逻辑折叠:100个运算 → 用10个算子,分10个时间片完成

👉 本质就是:空间换时间 → 再用更高频率/更短τ把时间“拿回来”

三、逻辑折叠如何实现(工程手段)1)时间复用(Time Multiplexing)

最基础形式:

一个MAC单元 → 执行多次

一个ALU → 轮流处理多个数据流

典型场景:

AI加速器(张量计算)

DSP

👉 类似“循环展开”的反操作(loop folding)

2)算子重构(Operator Folding)

把复杂计算拆成可复用子结构:例如:

大矩阵乘法 →

分块(tiling)+

复用计算阵列

👉 常见于:

systolic array(脉动阵列)

Transformer加速器

3)数据流驱动(Dataflow Execution)

关键点:

计算不是按指令顺序,而是按“数据到达”触发

减少控制依赖 → 减少等待

👉 这直接降低 τ 中的“等待项”

4)存算一体 / 近存计算

把计算嵌入SRAM / NVM

避免“读→算→写”往返

👉 本质是:把逻辑“折叠”进存储结构

5)动态重配置(Reconfigurable Computing)

类似FPGA思想(但更细粒度、更高效)。一个硬件块在不同时间执行不同逻辑。

四、逻辑折叠 vs 传统扩展(关键对比)

维度

几何扩展(传统摩尔)

逻辑折叠(时间缩微)

核心资源

面积

时间

方法

多堆晶体管

复用晶体管

功耗

高(并行多)

更可控

带宽需求

极高

可降低

适配场景

通用计算

AI / DSP / 专用计算

五、关键难点(不是概念问题,是工程问题)

时间缩微和逻辑折叠真正难在这里:

1)调度复杂度爆炸

谁在什么时候用哪个算子?

数据依赖如何安排?

👉 本质是编译器 + runtime 成为核心

2)频率与功耗矛盾

你要“时间折叠”,通常要:

提高频率

或提高利用率

但 功耗 ∝ 频率 × 电压²

3)存储带宽瓶颈

逻辑可以折叠,但数据不能“排队太久”,否则 τ 反而变大。

4)设计复杂度

时序收敛更难

验证难度指数级上升

六、一个更本质的理解

可以把这套范式总结为从“晶体管中心主义” → “时延中心主义”

传统:性能 ≈ 晶体管数量

现在:性能 ≈ 有效时间利用率(1/τ)

七、一句话总结时间缩微:让计算“更快发生”逻辑折叠 :让同一份硬件“多次使用但不变慢”

两者结合的目标是:在晶体管不再高速增长的时代,继续提升“单位面积算力密度”。所以何总说到2031年,基于“韬定律”的高端芯片晶体管密度将达到1.4纳米制程的同等水平,“时间缩微 + 逻辑折叠”不是一个单点技术突破,而是一种“范式级重心迁移”——从晶体管密度驱动,转向“时延与利用率驱动”,“时间缩微”抓住了后摩尔时代的核心变量,但它的本质不是颠覆物理极限,而是重构系统效率!这是一种非常有价值的创新,对于本土乃至全球半导体产业的突破都有重大价值!