# JPEG2000 全通道并行 EBCOT-Tierl 编码器结构设计

朱悦心 张 静 王 勇 郑南宁 (西安交通大学人工智能与机器人研究所 西安 710049)

摘 要 新一代静止图像压缩标准 JPEG2000 采用了 EBCOT 算法。该算法 Tierl 部分在上下文生成过程中需要对 位平面进行多次通道扫描,效率很低,难以满足高质量图像实时压缩的要求。目前已有多种改进方案被相继提出, 主要基于 PS/GOCS 和多窗口通道并行扫描。该文设计出一种适用于硬件实现的单窗口全通道并行编码结构,目前 已通过 FPGA 验证。实验表明,该结构下 Tierl 编码速度明显优于现有几种优化方案。同时,本设计所采用的编码 逻辑在解码过程中亦可使用,便于进行编解码复用设计。

关键词 算术编码, JPEG2000, EBCOT, 列关联, 位平面编码, 上下文, 状态变量
 中图分类号: TN919.81
 文献标识码: A
 文章编号: 1009-5896(2006)12-2362-05

# Full Pass-Parallel Architecture for EBCOT-Tier1 Encoder in JPEG2000

Zhu Yue-xin Zhang Jing Wang Yong Zheng Nan-ning (Institute of Artificial Intelligence and Robotics, Xi'an Jiaotong University, Xi'an 710049, China)

Abstract EBCOT algorithm is an essential part of the new image compression standard, JPEG2000. The Tier1 part of EBCOT requires each bit-plane be scanned for three times in order to generate entropy contexts. Therefore the scanning efficiency is unacceptable, which fails to fulfill real-time compression of high quality images. So far some improvements have already been made, mainly based on PS/GOCS, and multi-window/pass-parallel coding technique. In this paper, a hardware-oriented, full pass-parallel coding architecture is presented, based on only one scanning window. This architecture is verified on FPGA. Experimental results show that its coding speed is superior to the other two main improvements. Furthermore, the coding logic adopted can be reused on the decoding stage, which facilitates sharing code/decode architecture.

Key words Arithmetic encoding, JPEG2000, EBCOT, Vertical causal, Bit-plane encoding, Context, State variable

1 引言

JPEG2000 是新一代静止图像压缩标准<sup>[1]</sup>,与JPEG标准 相比,它支持更高的压缩比并具有更加丰富的压缩功能。 JPEG2000 的一大特点是采用了Taubman提出的EBCOT (Embedded Block Coding with Optimized Truncation)算法<sup>[2,3]</sup>, 即带有理想截断的嵌入式码块编码。这种算法以基于上下文 生成的算数编码为基础,集成了通道扫描的概念,为 JPEG2000 定码率压缩控制提供了有利条件,最终得到的压 缩文件大小精确,解码还原效果理想。然而由于通道<sup>[2]</sup>概念 的引入,使得EBCOT在上下文的生成过程中需要对位平面进 行多次扫描编码,在时间上需要付出很大代价,这一缺点导 致JPEG2000 编码整体效率降低,难以对高质量图像进行实 时压缩处理。

针对这一问题,目前已有多种优化方案被相继提出<sup>[4,6]</sup>,如Chen跳点跳列结构,Chiang多窗口通道并行结构等。但是 单窗口通道并行结构,特别是Tier1编解码重用性设计方面, 始终鲜有提及。基于Chiang的通道并行思想,本文提出一种 改进后的快速编码方案,目前已通过FPGA验证。在这种改

2005-03-07 收到, 2005-08-31 改回 国家 863 计划(2002AA103011)资助课题 进方案中,我们加大了并行力度,只需采用一个移动窗口就 可实现全通道同时编码,且每个位平面只需扫描一次,显著 提高了EBCOT的编码效率。在本设计中,我们亦率先提出了 行状态移位寄存器,4×5 窗口编码器以及边缘插零处理等结 构。实验表明,本设计下Tier1 编码速度明显优于Chen与 Chiang的优化结构,对 4:2:2 格式的高清彩色视频图像,可 以实现实时压缩。另外,不同于Chiang的多窗口扫描结构, 我们采用的基于单移动窗口下的编码逻辑在解码过程中可 以复用,这亦是本设计的一大优势。

# 2 EBCOT 基本算法

Taubman 提出的 EBCOT 框架结构由两部分组成 ——Tier1与Tier2<sup>[2]</sup>。Tier1模块完成基于上下文的自适应算 术编码,Tier2负责对码流进行截断和打包。在Tier1中, EBCOT通常需要对码块上的每一个位平面进行 3次Z字型扫 描,优先级为:带(连续 4 行量化系数)→列(扫描带上纵向 4 个量化系数)→点,参见图 1。每一次扫描都会从位平面上划 分出一个"编码通道"(coding pass),同时生成算术编码器所需 的上下文信息。这 3次扫描分别为:

(1) 有效性传播扫描(significance propagation scan): 扫



图 1 位平面上基于列的 Z 字型扫描顺序 Fig.1 Zigzag scan on biplane

描后将从位平面上分离出通道 1(简称 P1)。位平面上有效性 状态为 0 但 8 邻域有效性状态不全为 0 的点进入这个通道。 所谓有效性是指一个量化系数的二进制最高位(MSB)是否已 经在更高级的位平面扫描中出现,若已出现则此状态将一直 保持为 1,直到整个码块编码结束,否则为 0;

(2) 幅度细化扫描(magnitude refinement scan): 扫描结果 分离出通道 2(简称 P2)。当前位平面进行有效性传播扫描之前,所有有效性状态已经为1的点,进入通道 2;

(3) 清除扫描(cleanup scan): 扫描后分离出通道 3(简称
P3)。当前位平面中既不属于通道 1 也不属于通道 2 的点, 进入通道 3。

按照 JPEG2000 协议规定,除第1个位平面只需进行通 道 3 扫描外,其他位平面必须按照(1)→(2)→(3)的顺序依次 扫描,位平面上量化系数的很多状态值(一般称作"状态变量") 会在 3 次通道扫描过程中随时更新,这些状态主要包括:

 $\delta$ 为有效性 如前所述。

 $\pi$ 为编码完成标识 如果某点在当前位平面已被编码,则 $\pi$ =1,否则 $\pi$ =0;一般情况下,扫描与编码是同时进行的,量化系数在扫描过程中一旦确定其满足通道条件,便立即进行编码。

 $\xi$ 为幅度细化完成标识 如果某点在上一个(或更高) 位平面扫描过程中曾经进入过幅度细化通道,则 $\xi$ =1,否则  $\xi$ =0。

除上述 3 种状态之外,还有两个最基本的状态变量: v 与 s,分别表示当前位平面上某点量化系数的幅值位与符号位。 在位平面扫描过程中,EBCOT 编码器会根据邻域有效性信 息为自适应算术编码器提供上下文,算术编码器按位编码, 输出码字。最后对所有码字进行整理和取舍(Tier2 压缩率控 制模块的主要任务),打包输出 JPEG2000 格式的文件。

#### 3 几种现有的硬件优化方案

事实上,EBCOT所采用的位平面扫描算法,是一种基于 软件的实现方法,直接应用于硬件实现,效率往往不尽人意。 从表 1 我们可以看出,EBCOT-Tier1 部分在整个JPEG2000 系统中消耗了大量运行时间<sup>[5]</sup>,而采用同步流水设

表 1 JPEG2000 编码中各模块占用时间百分比(单位:%) Tab.1 Runtime percentage of each part of JPEG2000 (%)

|             | 1 0   | 1     |       |       |  |
|-------------|-------|-------|-------|-------|--|
|             | 单分量   | 量图像   | 多分    | 量图像   |  |
|             | 无损    | 有损    | 无损    | 有损    |  |
|             | 变换    | 变换    | 变换    | 变换    |  |
| 分量变换        | /     | /     | 0.91  | 14.12 |  |
| 小波变换        | 10.51 | 26.38 | 11.9  | 23.97 |  |
| 量化          | /     | 6.42  | /     | 5.04  |  |
| EBCOT-Tier1 | 71.63 | 52.26 | 69.26 | 43.85 |  |
| EBCOT-Tier2 | 17.56 | 14.95 | 17.9  | 13.01 |  |

计的算术编码器并不需要花费较多的时钟周期,因此提高速 度的关键是改进 Tierl 位平面扫描方法,尽可能避免位平面 上量化系数的冗余访问。目前在这方面主要有两种解决思 路: 启发式串行与通道并行。下面分别介绍这两种思路下的 优化方案。

## 3.1 Chen跳点跳列结构<sup>[5]</sup>

Chen 等人注意到:随着位平面的降低,3个通道中量化 系数的数量具有不同的变化规律:进入幅度细化通道编码的 系数越来越多,最后位平面上几乎所有量化系数都会进入这 个通道;进入清除通道编码的系数则越来越少。另外3个通 道之间具有互斥性,如果一个系数在通道1被编码,那么它 就一定不会进入通道2和通道3。这就意味着如果对每个位 平面都扫描3次,一定会有很多重复性的判断和编码操作。 Chen 等人提出一种跳点跳列结构,在通道扫描中跳过无需编 码的点(pel)或列(column),通过这种方式来减少冗余扫描次 数,提高位平面编码速度。

跳点操作记为 PS(Pel-Skipping),所谓 PS 是指在某一列 中事先判断出 4 个系数中有哪几个是真正需要编码的,随后 在进行上下文生成运算时直接跳过无效点,消除列内冗余。 除 PS 外,该方案还采用了 GOCS (Group-Of-Column Skipping),即跳列。GOCS 将相邻 8 列量化系数编为一组 (Group),如果该组所有系数都不属于当前通道,则直接跳过 8 列。GOCS 在低位平面上的清除扫描中能够发挥很高的效 率,有效消除了列间冗余遍历。需要注意的是: GOCS 只可 应用于通道 2 和通道 3,因为每个组的编码必要性信息需要 在通道 1 扫描时记录。

Chen 跳点跳列结构虽然提高了扫描效率,但从时间上看 通道编码过程依然是串行,每个位平面仍然需要扫描3次, 且 GOCS 不能应用于通道1。在许多高端实时的多媒体应用 领域,速度仍然无法满足要求。另外这种方法需要在编码过 程中保存位平面上所有点的5种状态变量(v, s,  $\delta$ ,  $\pi$ ,  $\xi$ ),存储需求也比较大。

#### 3.2 Chiang通道并行结构<sup>[3]</sup>

针对串行扫描方法的不足, Chiang 等人提出一种通道并 行扫描方案。该方案采用两个窗口编码器,可以对 3 个通道 同时进行扫描编码。由于通道扫描具有先后顺序,因此在窗 口编码过程中需要考虑邻域有效性的抗干扰和预测问题。

在Chiang结构中,前一个窗口编码器负责处理P1和P2,

后一个窗口负责 P3,前后之间需要保持一列相差,如图 2 所示。在进行上下文编码之前,必须首先判断哪些点属于该 窗口所对应的通道。找到需要进行编码的系数点之后,通过 组合逻辑产生上下文编码所需要的邻域状态信息。并行结构 中,P1 与 P2 窗口需要对后列的有效性状态进行预测,而 P3 延时一列的原因是为了避免当系数变得有效时对 P1 与 P2 窗 口产生干扰。



由于 3 次通道扫描都需要参照邻域有效性状态,因此会 出现邻域关联"跨带"的情况,导致窗口编码复杂度增加。为 了克服这个问题, Chiang 等人采用了 JPEG2000 标准下的"列 关联"(vertical causal)模式。这种模式允许割裂带(stripe)与带 之间的相关性,每一列的最后一个点在判断邻域有效性时, 只判断 5 邻域,而不是 8 邻域(见图 3)。通道并行结构在列关 联模式下可以充分发挥并行效率,否则必须让两个窗口始终 保持一个带的相差,控制起来比较复杂。



图 3 列内第一点与最后一点之间的邻域差别 Fig.3 Neighborhood difference between first and last pixel in each column

Chiang 结构大大提高了扫描速度,并且由于通道并行的 原因可以省去状态 π,减少了状态存储空间。但是这种结构 仍然有许多不足之处,主要体现在:

(1) 在扫描流程方面,必须等到窗口 1(对应 P1 与 P2)有 效性状态更新之后,窗口 2(对应 P3)才可以开始编码,两个 窗口编码器之间需要交互,增加了控制复杂度。

(2) 上下文依次产生,只采用了一个算术编码器,一个时钟周期之内只能够接收一个上下文,所以严格说来是准并行,速度仍然可以进一步提高。

(3) 在进行邻域有效性预测时, Chiang 对前邻列使用了 状态v,导致该结构无法实现编解码复用。因为前邻列是未 被扫描到的列,只有在解码之后才可以得到v值,显然无法 提前预知。所以在编解码复用设计中此方案无法采用。

#### 4 并行 EBCOT 编码器改进方案

针对 Chiang 优化结构的不足之处,我们提出一种改进后 的并行编码方案——单一移动窗口下的快速 EBCOT 编码。 该方案以通道并行结构为基础,但编码速度得到了较大提 高;此方案的另一大优点是支持编解码复用,只需要对编码 结构进行细微调整,就可以实现 EBCOT 解码。本设计由行 状态移位寄存器、4×5 滑动窗口、邻域组合逻辑、编码逻辑 等几部分组成,同时采用边缘插零处理实现带间连续编码。 下面对每个部分分别进行介绍。

#### 4.1 行状态移位寄存器

本方案仍然基于列关联模式。但是列关联仅仅割裂了当 前带(current stripe)与次带(next stripe)之间的相关性,当前带 与前带(previous stripe)之间仍然存在依赖关系(见图 3),因此 要进行带内并行编码,必须克服这种情况。我们为此设计了 一套行状态移位寄存器结构,通过预存每列最后一个点的状 态信息,可以避免带与带之间的邻域依赖关系,提高扫描效 率。有效性状态的更新只可能发生在 P1 与 P3,本设计采用 两条行寄存器来分别记录 P1 与 P3 中每列最后一个点的有效 性状态值;另外符号编码进行邻域判断时需要用到前带符 号,也需要使用行寄存器来存储,我们分别记作 SRS, CRS 与 SignRS。之所以区分 SRS 与 CRS, 是因为在 JPEG2000 标准中通道扫描是有先后顺序的,在 P3 中变的有效的点, 绝不会影响 P1 与 P2 的上下文生成。并行处理时,前两个通 道必须使用 SRS 以避免通道 3 中的有效点干扰, 通道 3 编码 时则须使用 CRS。通过3条行状态寄存器可以严格将系数邻 域限制在当前带之内,对于每列第一个点,只需要读取 SRS, CRS 与 SignRS 就可以获取上方 3 邻域状态信息,从而避免 了前带数据的冗余访问。

设码块宽度为 N,则 SRS,CRS 与 SignRS 均采用 N+1 位环形移位寄存器结构,原因将在后面说明。

#### 4.2 4×5 滑动窗口与邻域组合逻辑

不同于 Chiang 的多窗口设计,本方案只使用了一个大小 为 4×5 的移动窗口,每个单元位宽为 5,分别寄存对应点的ν, *s* δ, π 与 ξ 值,可并行产生 3 个通道的邻域状态(见图 4) 以进行上下文编码。窗口同时覆盖位平面上的 5 列:其中第 2~4 列为编码列,可通过表 2 所示的邻域组合逻辑一步生成 P1, P2 和 P3 编码所需的所有邻域值。编码完成后,滑动窗 口右移一列,同时 SRS, CRS 与 SignRS 行寄存器也进行一步 循环移位,第 5 列的最后一个点在行寄存器上进行有效性与 符号状态更新,直到整个码块编码过程结束。注意,在这种 结构下,每个位平面只需要扫描一次,处理速度大大提高。



表 2 扫描点的 *h*, *v*, *d* 值运算表 (注: 在表示中我们令  $\delta_{a,b} = \delta_a | \delta_b$ ) Tab.2 Calculation table for *h*, *v*, *d* 

邻域生成之后则需进行上下文与算术编码。由于产生ZC, SC, MR 与 RLC 四种模型所需的硬件资源相对较少,因此在 并行方式下可以为每个通道设计一套编码逻辑以减少控制 复杂度。当算术编码器采用三步流水设计之后,可以与3个 通道的上下文生成速度相匹配,因此只需1个算术编码器即 可满足要求,输出码字则分别存放在3个通道所对应的FIFO 中,随后进行 Tier2 压缩率控制与打包。完整的 EBCOT 处理 流程参见图 5。

#### 4.4 边缘插零处理

在带的边缘(第1列或最后4列)位置,左右邻域可能落 在码块外部。按照 JPEG2000 协议规定,外部点的有效性状 态一律为零。本设计采用边缘插零处理,不需要改变任何邻 域生成逻辑,即可解决边缘问题,实现带间滑动窗口连续编 百 戶 图 6 边缘插零处理
Fig.6 Zero column insertion at the edge of stripes
码。具体过程见图 6,窗口滑动到每个带的最后 1 列时,多 插入 1 列零值(行移位寄存器也需预插 1 个 0,正好与窗口位 置对应,这就是宽度为 N 的码块采用 N+1 位行状态暂存器的 原因),随后立即读取次带第 1 列量化系数。对宽度为 N 的

码块,窗口在每个带上的滑动次数为 N+1。采用这种方案,带间、位平面间都不需要编码缓冲时间,对大小 N×N、有效位平面个数为 m 的码块,可以实现无间断连续编码,扫描总列数为 mN(N+1)/4。

# 4.5 编解码重用设计

前面已经指出, Chiang 结构也是基于通道并行的, 并且 引用了前邻列的 v 状态。由于解码过程中这个状态是无法预 知的, 因此不能采用同样的结构来完成解码操作, 导致硬件 资源编解码重用率较低。而本文提出的设计方案不存在前邻 列ν状态的预读,所以位平面解码与编码可以使用相同的硬 件结构来完成。

EBCOT 解码是编码的逆过程,解包运算器从 JPEG2000 文件流中提取出压缩码字,经过上下文解码和算术解码,将 码流映射为码块比特位,从而完整的还原整幅图像。上下文 生成模型在编码与解码过程中有很高的共通性,不同点仅在 于:

(1) 编码中,上下文生成与算术编码过程相对独立,因此二者之间非常容易实现并行操作,并不会相互制约;而解码时上下文生成与算术解码过程相互融合,在前一位算术解码结果出现之前,后一位的上下文无法确定。

(2) 编码过程中, Tier1 在生成上下文和压缩码字的同时 还需要为 Tier2 码率控制器完成 RD 斜率的运算; 解码时不 需要这个过程。

(3) 解码过程存在有损的情况,因此并不一定所有位平 面都需要扫描,没有扫描到的位平面要进行反量化特殊处 理。考虑到上下文生成运算在编码与解码过程中的区别与联 系,设计出一种共用位平面扫描模型的 EBCOT 编解码复合 结构是具有可行性的。采用这种设计,资源利用率和编解码 效率都可以得到很大提高。这将是我们下一步研究与工作的 内容。

# 5 测试与验证

我们用硬件描述语言 Verilog HDL 编写出本设计的 RTL 级代码,使用仿真工具 Modelsim 5.6 进行功能验证,结果如 图 7 所示:其中 passX\_out\_en, passX\_out\_ext 与 passX\_out\_code 分别为通道 X(X=1,2,3)所对应的上下文输出使能、上下 文以及码流信号, clk 为时钟。在竖线标明的时刻,可以看 出通道 1 与通道 3 上下文并行输出。采用本设计,5~8 个时 钟周期即可同时完成 3 列系数的上下文生成。设计中采用 Altera 公司 stratix 系列 EP1S25 器件进行 FPGA 平台搭建、测试与验证。目前图像所支持的最大码块大小为 32×32,验 证结果为:(1)工作频率>100MHz;(2)所需逻辑单元数量为 1089,相当于 8930 个等效门;(3)码块存储器所需 sdram 1024×16 bit;(4)状态存储器所需 dpram 32×8 bit。

| clk            | 0  | лл | ហោ  | JJJ       | ind  | лл     | ษ   | ллл        | inn      | hur     | Л    |
|----------------|----|----|-----|-----------|------|--------|-----|------------|----------|---------|------|
| pass1_out_en [ | 1  |    | Г   |           |      |        | Л   |            |          |         | l    |
| pass1_out_cxt  | 02 | 00 | (0- | 4 [0e [00 | 0208 | [0f]00 | 02  | (0d)08 (00 | 07 10 09 | 07 09 1 | 0)D( |
| pass1_out_code | 1  |    |     | 1         |      |        |     | 1          |          |         | l    |
| pass2_out_en   | 0  |    |     |           |      |        | 74  | F          |          |         | _    |
| pass2_out_cxt  | 0b | 0a | 10b |           |      |        |     |            |          |         | _    |
| pass2_out_code | 1  |    |     |           |      |        | 1   |            |          | _       |      |
| pass3_out_en   | 1  |    |     |           |      |        |     |            |          |         |      |
| pass3_out_cxt  | 01 | 00 |     |           |      |        | 101 | 04100      | (02)(00  |         | _    |
| pass3_out_code | 0  | -  |     |           |      |        | _   |            |          | -       | _    |

#### 图 7 全通道并行编码的时序仿真

Fig.7 Sequential simulation for full pass-parallel coding architecture

为测试本方案下的编码速度并与其他方法进行比较,我 们对 lena, boats, airplane 与 pepper4 幅标准图像进行了处 理,将尺寸变换为码块大小 32×32,随后分别采用 4 种方案 进行位平面编码,结果见表 3。可以看出,快速 EBCOT 并 行方案运行效率是最高的。对于 4:2:2 格式, 640×480 大小的 彩色视频序列(30 帧/秒)如果要做到实时编码,所需要的时钟 频率为(用 lena32×32 图像的编码结果进行参考):

# $\frac{(640 \times 480) \times 30 \times 2}{(32 \times 32) \times 10^6} \times 8969 = 161 (\text{MHz})$

这个频率在 ASIC 设计中是容易实现的。因此大多数应 用场合下,本编码方案可以满足实时性要求。另外,与 Chiang 方案相比,单窗口并行还有很多其他优点,例如支持编解码 复用,窗口控制逻辑简单使得综合后逻辑门数量相对较少 等。

表 3 不同方案编码速度比较 (单位:时钟数)

| Tab.3 Coding speed comparison from different models (unit: clock) |       |         |           |       |  |  |
|-------------------------------------------------------------------|-------|---------|-----------|-------|--|--|
| 图像                                                                | 未优化   | Chen 串行 | Chiang 并行 | 单窗口并行 |  |  |
| lena                                                              | 33040 | 21855   | 9639      | 8969  |  |  |
| boats                                                             | 29607 | 19534   | 8391      | 7816  |  |  |
| airplane                                                          | 30089 | 20248   | 9620      | 8722  |  |  |
| peppers                                                           | 33118 | 21854   | 9909      | 9228  |  |  |

# 6 结束语

本文提出一种 EBCOT 单窗口并行编码方案,并设计出 基于这种方案下的 VLSI 结构。实验表明,采用这种设计, EBCOT 编码速度显著提高,对 4:2:2 格式的彩色视频图像, 可以实现 JPEG2000 实时压缩。与现有优化方案相比,本设 计还具有支持编解码复用,控制逻辑相对简单等优点。

### 参考文献

- Boliek M, Christopoulos C, Majani E. ISO/IEC JTC1/SC29/WG1 N1890, JPEG2000 Part I final draft international standard [Z]. ISO/IEC JTC1/SC29/WG1 N1890 Sept, 2000.
- [2] Taubman. High performance scalable image compression with EBCOT [J]. *IEEE Trans. on Image Processing*, 2000, 9(7): 1158–1170.
- [3] Taubman, Ordentlich, Weinberger, Serourssi. Embedded block coding in JPEG2000. IEEE International Conference on Image Processing (ICIP 2000)[C], Vancouver, Canada, 2000, Vol.2: 33–36.
- [4] Chiang Jen-Shiun, Lin Yu-sen, Hsieh Chang-yo. Efficient pass-parallel architecture for EBCOT in JPEG2000 [A]. IEEE International Symposium on Circuits and Systems(ISCAS 2002)[C], Scottsdale, Arizona, 2002, Vol.1: 773–776.
- [5] Chen Kuan-fu, Lian Chung-Jr, et al.. Analysis and architecture design of EBCOT for JPEG2000 [A]. The 2001 IEEE International Symposium on Circuits and Systems (ISCAS 2001) [C], Sydney, Australia, 2001, Vol.2: 765–768.
- [6] Andra Kishore, Chakrabarti Chaitali, Acharya Tinku. A high performance JPEG2000 architecture. The 2002 IEEE International Symposium on Circuits and Systems (ISCAS 2002) [C], Scottsdale, Arizona, 2002: 765–768.
- 朱悦心: 男, 1978 年生, 硕士生, 研究方向为图像处理与 ASIC 设计.
- 张 静: 女, 1978 年生, 硕士生, 研究方向为图像处理与 ASIC 设计.
- 王 勇: 男, 1979 年生,硕士生,研究方向为图像处理与 ASIC 设计.
- 郑南宁: 男,1952年生,教授,博士生导师,多年从事模式识别 与智能系统、数字视频领域的研究工作.