NVIDIA
NVIDIA Nemotron 3 Nano
24/100
$0.07/1M tok
128tok/s
NVIDIA Nemotron 3 Nano · NVIDIA · efficient · IA 24 · ctx 1M
NVIDIA Nemotron 3 Nano
NVIDIA Nemotron fine-tunea Llama y modelos propios para inferencia eficiente en hardware NVIDIA.
Variante rápida y económica: prioriza latencia, coste por token y throughput sobre máxima inteligencia.
### Ficha técnica
| Métrica | Valor | | --- | --- | | Laboratorio | NVIDIA | | Tipo | efficient | | Licencia | Open weights (pesos públicos) | | Ventana de contexto | 1M | | Índice de inteligencia (AA) | 24/100 | | Precio blended | $0.07 / 1M tokens | | Velocidad de salida | 128 tok/s |
### Posicionamiento en leaderboards
Según [Artificial Analysis](https://artificialanalysis.ai/leaderboards/models), NVIDIA Nemotron 3 Nano compite en el ranking de más de 100 modelos. Orientado a carga eficiente o despliegue especializado.
### Uso en Wewai
Enrutable vía proveedores compatibles en el router Wewai para equipos que priorizan coste o soberanía.
### Fuentes
- [Artificial Analysis](https://artificialanalysis.ai/leaderboards/models)
- [Open LLM Leaderboard](https://huggingface.co/open-llm-leaderboard)
- [LLM Stats](https://llm-stats.com/)
- [Interconnects AI](https://www.interconnects.ai)