IP 驱动集成与优化: 负责 AI 芯片内各类核心 IP(如 NPU 计算核、NoC、内存控制器、DMA、时钟管理等)的驱动编写、调试及性能优化。
固件与 Runtime 架构设计: 主导芯片侧固件(Firmware)以及 Runtime 系统的整体架构设计与开发,实现高效的任务调度、内存管理和多硬件加速器协同。
全栈软件开发: 负责从 Host 侧(Linux Kernel)到 Device 侧(Bare-metal/RTOS)的通信机制设计(如 PCIe 通信、Command Queue、中断处理等)。
性能分析与调优: 针对主流 AI 模型在芯片上的执行路径,进行全链路性能分析,解决系统软件层面的瓶颈问题。
软硬件协同设计: 参与下一代芯片架构的定义,从软件视角提供硬件 IP 的功能与接口建议。
年限:架构师/专家5年以上经验
核心技术能力:
深度硬件理解: 熟悉 AI 芯片常见 IP 架构,对加速器架构(NPU/TPU)、内存体系(HBM/LPDDR)、互联总线(PCIe/NoC)有实战经验。
OS/内核功底: 精通 Linux 内核驱动架构,具备丰富的 KMD (Kernel Mode Driver) 开发经验,熟悉内核同步机制、内存分配、中断处理及 DMA。
用户态驱动经验: 熟悉 UMD (User Mode Driver) 架构,有类似 CUDA/ROCm 或 OpenCL 驱动开发经验者优先;理解用户态内存管理与指令提交机制。
编程功底: 精通 C/C++,具备优秀的底层代码编写和优化能力,熟悉汇编语言及常用调试工具(GDB, JTAG, Trace32)。
系统工程能力: 能够从 Host 驱动侧到芯片系统侧进行全栈思考,深刻理解计算图执行过程中的指令流、数据流以及软硬件同步机制。
加分项
有成功量产过的 AI 芯片(训练或推理)全栈软件开发经验。
熟悉常见 AI 编译器(如 TVM, MLIR)与底层 Runtime 的对接。
在开源社区(Linux Kernel, LLVM 等)有贡献记录。