S72867: AI Developer Tools for Accelerated Computing - Scarce Data Isn't Scary!

Matt Frazier, Director for AI Assisted Developer Tools | GTC25

概览：您为何在此？

NVIDIA Nsight 正在创建编码工具，通过以下方式赋能并提升开发者的加速计算能力（CUDA 技能、性能分析与优化）：

构建高质量的验证框架
提供直观的用户体验
为人工智能和 GPU 专业知识创造一个增长飞轮

本演示将介绍这些工具的细节以及它们何时能交到开发者手中。

议程

AI 编程助手与 CUDA
数据稀缺性问题
创建一个专业知识飞轮
上下文增强策略
NVIDIA 对 AI 辅助开发未来的愿景

AI 编程助手与 CUDA

NVIDIA 的 AI 编程助手旨在通过以下方式支持开发者：

降低复杂性和易变性：简化 CUDA 编程的复杂性。
为专家提供即时细节：即使是经验丰富的开发者也能快速获取所需信息。
加速计算中的持续优化：优化是一个永无止境的过程。

该系统的核心架构包括一个 CUDA 智能服务，它利用前沿的大型语言模型 (Frontier LLM NIM) 和一个 CUDA 与硬件数据库 (CUDA & Hardware DB)。该服务通过 OpenAPI、VS Code 扩展、其他 IDE 和 API 集成等多种方式向开发者提供支持。

数据稀缺性问题

在为 CUDA 开发 AI 编程助手时，面临着独特的数据挑战：

传统 AI 数据挑战：通常需要大量数据进行训练。
CUDA：专业知识丰富，数据匮乏：高质量的 CUDA 代码范例相对稀少，但其中蕴含着深厚的专家知识。
超越简单的代码生成：目标不仅仅是生成代码，而是生成正确且高性能的代码。
基准测试的误导性：传统的代码生成基准测试可能无法反映真实世界 CUDA 编程的复杂性和性能要求。
现实世界用例 vs. 完美示例：模型需要处理的是实际开发中遇到的复杂问题，而不仅仅是教科书式的理想化示例。

验证优先方法 (Validation-First Approach)

为了确保 AI 生成代码的质量和可靠性，我们采用了一种“验证优先”的方法，即衡量过程而不仅仅是输出。

正确性 + 性能：这是评估 CUDA 代码质量的两个核心维度。
黄金基准至关重要：建立高质量的、经过专家验证的基准解决方案（Golden Baselines）是评估的基础。
硬件感知验证：验证过程必须考虑到硬件的具体特性，因为性能与硬件紧密相关。
性能分析即为性能真相：使用性能分析工具（Profiling）来获取关于代码实际性能的最终判断。

该流程如下图所示：首先，针对一个 CUDA 问题，创建一个包含黄金代码解决方案（Golden Code Solution）、单元测试（Unit Tests）和词法测试（Lexical Tests）的验证集。当 AI 模型生成一个响应（Response）时，系统会通过单元测试和词法测试来验证其正确性，并通过与黄金解决方案进行性能对比来评估其性能。