NVIDIA
Llama 3.1 Nemotron 70B
13/100
$1.20/1M tok
292tok/s
Llama 3.1 Nemotron 70B · NVIDIA · general · IA 13 · ctx 128k
Llama 3.1 Nemotron 70B
NVIDIA Nemotron fine-tunea Llama y modelos propios para inferencia eficiente en hardware NVIDIA.
Modelo generalista equilibrado para chat, RAG, resumen y automatización de oficina.
### Ficha técnica
| Métrica | Valor | | --- | --- | | Laboratorio | NVIDIA | | Tipo | general | | Licencia | Open weights (pesos públicos) | | Ventana de contexto | 128k | | Índice de inteligencia (AA) | 13/100 | | Precio blended | $1.20 / 1M tokens | | Velocidad de salida | 292 tok/s |
### Posicionamiento en leaderboards
Según [Artificial Analysis](https://artificialanalysis.ai/leaderboards/models), Llama 3.1 Nemotron 70B compite en el ranking de más de 100 modelos. Orientado a carga eficiente o despliegue especializado.
### Uso en Wewai
Enrutable vía proveedores compatibles en el router Wewai para equipos que priorizan coste o soberanía.
### Fuentes
- [Artificial Analysis](https://artificialanalysis.ai/leaderboards/models)
- [Open LLM Leaderboard](https://huggingface.co/open-llm-leaderboard)
- [LLM Stats](https://llm-stats.com/)
- [Interconnects AI](https://www.interconnects.ai)