NVIDIA

Llama 3.1 Nemotron 70B

GeneralistaOpen weights

Inteligencia (AA)

13/100

Precio blended

$1.20/1M tok

Velocidad

292tok/s

Llama 3.1 Nemotron 70B · NVIDIA · general · IA 13 · ctx 128k

Llama 3.1 Nemotron 70B

NVIDIA Nemotron fine-tunea Llama y modelos propios para inferencia eficiente en hardware NVIDIA.

Modelo generalista equilibrado para chat, RAG, resumen y automatización de oficina.

### Ficha técnica

| Métrica | Valor | | --- | --- | | Laboratorio | NVIDIA | | Tipo | general | | Licencia | Open weights (pesos públicos) | | Ventana de contexto | 128k | | Índice de inteligencia (AA) | 13/100 | | Precio blended | $1.20 / 1M tokens | | Velocidad de salida | 292 tok/s |

### Posicionamiento en leaderboards

Según [Artificial Analysis](https://artificialanalysis.ai/leaderboards/models), Llama 3.1 Nemotron 70B compite en el ranking de más de 100 modelos. Orientado a carga eficiente o despliegue especializado.

### Uso en Wewai

Enrutable vía proveedores compatibles en el router Wewai para equipos que priorizan coste o soberanía.

### Fuentes

[Artificial Analysis](https://artificialanalysis.ai/leaderboards/models)
[Open LLM Leaderboard](https://huggingface.co/open-llm-leaderboard)
[LLM Stats](https://llm-stats.com/)
[Interconnects AI](https://www.interconnects.ai)