NVIDIA Build
综合介绍
NVIDIA Build 是一个面向开发者的统一平台,旨在简化和加速 AI 应用程序的构建、定制和部署。该平台提供了一系列强大的工具和服务,包括优化的推理微服务 (NIM)、预构建的蓝图 (Blueprints) 和对最新 GPU 技术的访问。用户可以利用 NVIDIA Build 提供的免费 API 密钥和无服务器 API 进行开发,也可以选择在自己的 GPU 基础设施上进行自托管部署。
该平台的核心优势在于其集成了业界领先的开源模型,并通过 NVIDIA 的企业级推理运行时进行了优化和加速。这使得开发者能够轻松利用最先进的 AI 技术,例如强大的语言模型、视觉模型和语音识别模型,来构建具备高级推理、多模态交互和数据处理能力的应用。此外,平台还提供了丰富的蓝图,这些蓝图是包含代码示例和工作流程的模板,可以帮助开发者快速启动项目,例如构建企业级研究助理、视频搜索与摘要工具或检索增强生成 (RAG) 管道。
NVIDIA Build 不仅降低了 AI 应用开发的门槛,还通过提供持续的安全漏洞修复和优化的微服务,确保了应用的稳定性和安全性。无论是希望快速原型设计的初学者,还是寻求构建复杂、生产就绪型 AI 解决方案的专业团队,都能在该平台上找到合适的资源和支持。
功能列表
- 模型推理服务 (NIM): 提供经过优化的推理微服务,支持多种业界领先的开源 AI 模型,可通过免费的无服务器 API 或自托管方式进行部署。
- 应用蓝图 (Blueprints): 提供包含代码示例和工作流程的预构建模板,帮助开发者快速启动和构建特定类型的 AI 应用,如 AI 代理、RAG 管道和视频分析工具。
- GPU 资源访问: 允许开发者利用 NVIDIA 最新的 GPU 技术进行模型训练和推理,并通过 DGX Cloud 等服务获得加速计算能力。
- 模型发现与探索: 提供一个模型库,用户可以发现、筛选和了解不同 AI 模型的功能和特点,覆盖推理、视觉、语音、生物、气候等多个领域。
- 低代码设计工具: 包含一套低代码工具,通过可视化图形界面和拖放操作,帮助用户创建、配置和打包多模态 AI 应用。
- 持续安全支持: 为自托管部署提供持续的安全漏洞修复和更新。
- AI 代理构建: 支持构建能够处理和综合多模态企业数据、进行推理和规划并生成综合报告的 AI 代理。
使用帮助
NVIDIA Build 平台为开发者提供了一整套工具和服务,旨在简化 AI 应用的开发和部署流程。要开始使用该平台,您可以遵循以下步骤:
第一步:访问平台并获取 API 密钥
- 打开浏览器,访问 NVIDIA Build 官方网站:
https://build.nvidia.com/
。 - 在页面上,您会看到一个显著的“Get API Key”按钮。点击该按钮,您将需要登录您的 NVIDIA 开发者账户。如果您没有账户,需要先进行注册。
- 登录后,系统会为您生成一个免费的 API 密钥。这个密钥是您访问和使用 NVIDIA 提供的各种 AI 模型 API 的凭证。
第二步:探索和试用模型
NVIDIA Build 平台的核心是其 NIM(NVIDIA Inference Microservices),这是一系列经过优化的 AI 模型,可以直接通过 API 调用。
- 在网站的“Models”部分,您可以浏览和发现由社区构建并由 NVIDIA 优化的各种领先模型。 这些模型涵盖了不同的应用领域,例如:
- 推理 (Reasoning): 如
nvidiallama-3.3-nemotron-super-49b-v1.5
,适用于需要高级推理、工具调用和聊天功能的场景。 - 多模态 (Multimodal): 如
metallama-4-maverick-17b-128e-instruct
,能够处理多种类型的数据输入。
- 推理 (Reasoning): 如
- 选择您感兴趣的模型后,平台会提供相关的 API 文档和代码片段。您可以直接在您的开发环境中,使用您喜欢的编程语言(如 Python),通过 HTTP 请求来调用这些模型的 API,实现文本生成、图像识别等功能。平台提供了无服务器的 API 接入点,让您可以快速进行开发和测试,无需担心底层的基础设施。
第三步:使用蓝图 (Blueprints) 加速开发
如果您需要构建一个完整的应用程序,而不仅仅是调用单个模型,那么蓝图 (Blueprints) 将是您的得力助手。蓝图是预构建的工作流程和代码示例,可以帮助您快速搭建复杂的 AI 应用。
- 在网站的“Blueprints”部分,您可以找到针对不同应用场景的模板。 例如:
- 构建企业研究 AI 代理: 这个蓝图展示了如何构建一个能够处理和分析多模态企业数据,并生成综合报告的 AI 代理。
- 视频搜索与摘要 (VSS) 代理: 该蓝图可以帮助您摄取和分析大量的视频内容,并提取关键信息进行摘要或问答。
- 企业级 RAG 管道: 这是一个用于构建检索增强生成 (RAG) 应用的模板,可以将您的 AI 应用连接到企业数据,以提供更准确、更具上下文的回答。
- 每个蓝图都包含了详细的说明和可下载的代码。您可以根据自己的需求,对这些代码进行修改和定制,从而大大缩短开发周期。
第四步:部署选项
NVIDIA Build 提供了灵活的部署选项:
- 无服务器 API: 对于开发和测试阶段,或者对于需求量不大的应用,使用平台提供的免费无服务器 API 是最简单快捷的方式。
- 自托管: 当您的应用需要投入生产环境,或者您对性能和安全性有更高要求时,可以选择将 NIM 微服务部署在您自己的 GPU 基础设施上。这种方式能为您提供更大的控制权和更好的性能。 平台为此提供了详细的部署指南和持续的安全漏洞修复支持。
通过以上步骤,开发者可以充分利用 NVIDIA Build 平台的强大功能,从模型的探索和试用,到完整应用的快速构建和灵活部署,全方位地加速 AI 创新。
应用场景
- 企业级 AI 代理利用平台提供的蓝图和模型,可以构建能够理解和处理企业内部海量、多模态数据(如文档、报告、邮件等)的智能代理,帮助员工进行信息检索、数据分析和报告生成,从而提升工作效率。
- 视频内容分析开发者可以构建视频搜索和摘要服务,自动处理和分析大量的直播或存档视频。这在媒体、安防和教育等领域有广泛应用,例如快速定位视频中的关键片段、生成内容摘要或实现基于视频内容的智能问答。
- 增强型信息检索 (RAG)通过构建 RAG 管道,可以将大型语言模型与企业的私有知识库连接起来。这使得 AI 应用能够提供基于特定领域知识的、更精确可靠的回答,适用于智能客服、内部知识库查询等场景。
- 多模态交互应用结合平台上的视觉、语音和语言模型,可以开发出支持多种交互方式的应用,如能够进行语音对话和图像识别的虚拟助手或交互式虚拟化身。
- 快速原型设计与开发对于初创公司或小型开发团队,可以利用平台提供的免费无服务器 API 和低代码工具,快速验证 AI 应用的想法和原型,而无需投入大量资源购买和维护昂贵的硬件设备。
QA
- NVIDIA Build 是什么?NVIDIA Build 是一个为开发者设计的统一平台,提供了一系列工具和服务,用于简化和加速人工智能(AI)应用的构建、定制和部署。 它包括优化的 AI 模型(NIM)、应用模板(Blueprints)和对 GPU 资源的访问。
- 什么是 NIM?NIM 是 NVIDIA Inference Microservices 的缩写,中文意思是 NVIDIA 推理微服务。它是一系列经过 NVIDIA 优化和加速的 AI 模型,开发者可以通过 API 接口直接调用,用于执行推理任务,如文本生成、图像识别等。
- 使用 NVIDIA Build 需要付费吗?NVIDIA Build 提供了免费的无服务器 API 用于开发和测试,开发者可以通过获取 API 密钥来使用。对于需要更高性能或有更强隐私需求的生产环境应用,平台也支持将服务部署在用户自己的 GPU 基础设施上,这部分可能会涉及硬件和基础设施的成本。
- 我需要有自己的 GPU 才能使用这个平台吗?不需要。对于初学者或开发阶段,您可以直接使用平台提供的免费无服务器 API,这些 API 运行在 NVIDIA 的云基础设施上。只有当您希望将应用部署在自己的硬件上以获得更高性能或控制权时,才需要自备 GPU。
- 什么是蓝图 (Blueprints)?蓝图是预先构建好的工作流程和代码示例,可以帮助开发者快速启动特定类型的 AI 项目。 例如,平台提供了用于构建企业级 AI 代理或视频分析工具的蓝图,开发者可以在此基础上进行修改和定制,从而节省开发时间。