今天,英伟达又开源了一个性能超级强大的模型 —— Llama-3.1-Nemotron-70B-Instruct,它击败了 OpenAI 的 GPT-4o 等闭源模型和 Anthropic 的 Claude-3.5 sonnet 等开源模型。
从命名来看,显然 Llama-3.1-Nemotron-70B-Instruct 是基于 Llama-3.1-70B 打造而成。
在多个基准测试中,它一举超越多个最先进的 AI 模型,包括 OpenAI 的 GPT-4、GPT-4 Turbo 以及 Anthropic 的 Claude 3.5 Sonnet 等 140 多个开闭源模型。并且仅次于 OpenAI 最新模型 o1。
业内人士评价:英伟达在 Llama 3.1 的基础上训练出不太大的模型,超越了 GPT-4o 和 Claude 3.5 Sonnet,简直是神来之笔。
1 通过CF创建企业邮箱
2 注册Nvidia
地址:https://build.nvidia.com/nvidia/llama-3_1-nemotron-70b-instruct
点击右上角的Request More:
缩小屏幕:
3 添加到New API
类型:自定义渠道
Base URL:https://integrate.api.nvidia.com/v1/chat/completions
模型:nvidia/llama-3.1-nemotron-70b-instruct
curl https://integrate.api.nvidia.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $API_KEY_REQUIRED_IF_EXECUTING_OUTSIDE_NGC" \
-d '{
"model": "nvidia/llama-3.1-nemotron-70b-instruct",
"messages": [{"role":"user","content":"Write a limerick about the wonders of GPU computing."}],
"temperature": 0.5,
"top_p": 1,
"max_tokens": 1024,
"stream": true
}'
API-KEY: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(可以使用的!1000额度)
在NextChat-Web中添加自定义模型:nvidia/llama-3.1-nemotron-70b-instruct
可以看到一次消耗1积分:
评论已关闭