NVIDIA

NVIDIA Nemotron 3 Nano

EficienteOpen weights

Inteligencia (AA)

24/100

Precio blended

$0.07/1M tok

Velocidad

128tok/s

NVIDIA Nemotron 3 Nano · NVIDIA · efficient · IA 24 · ctx 1M

NVIDIA Nemotron 3 Nano

NVIDIA Nemotron fine-tunea Llama y modelos propios para inferencia eficiente en hardware NVIDIA.

Variante rápida y económica: prioriza latencia, coste por token y throughput sobre máxima inteligencia.

### Ficha técnica

| Métrica | Valor | | --- | --- | | Laboratorio | NVIDIA | | Tipo | efficient | | Licencia | Open weights (pesos públicos) | | Ventana de contexto | 1M | | Índice de inteligencia (AA) | 24/100 | | Precio blended | $0.07 / 1M tokens | | Velocidad de salida | 128 tok/s |

### Posicionamiento en leaderboards

Según [Artificial Analysis](https://artificialanalysis.ai/leaderboards/models), NVIDIA Nemotron 3 Nano compite en el ranking de más de 100 modelos. Orientado a carga eficiente o despliegue especializado.

### Uso en Wewai

Enrutable vía proveedores compatibles en el router Wewai para equipos que priorizan coste o soberanía.

### Fuentes

[Artificial Analysis](https://artificialanalysis.ai/leaderboards/models)
[Open LLM Leaderboard](https://huggingface.co/open-llm-leaderboard)
[LLM Stats](https://llm-stats.com/)
[Interconnects AI](https://www.interconnects.ai)