模型速率限制记录
模型名称速率限制概述
gemma2Unlimited27b本地模型,无审查,隐私
Llama3-70B-8KRPM = 120,TPM = 120000
Llama3-8B-8KRPM = 240,TPM = 240000快速推理
Mistral-7B-32KRPM = 60,TPM = 60000
ERNIE-Speed-128KRPM = 60,TPM = 300000128k长上下文,高性能
ERNIE-Speed-8KRPM = 300,TPM = 300000
ERNIE-Lite-8KRPM = 300,TPM = 300000
ERNIE-Tiny-8KRPM = 300,TPM = 300000快速推理
Qwen1.5-0.5BRPM = 1500,下列总日限10k高速率,无审查
Qwen1.5-1.8BRPM = 720高速率,无审查
Qwen1.5-7BRPM = 300无审查
Qwen1.5-14BRPM = 150无审查
Sqlcoder-7BRPM = 300SQL指令模型,无审查
DeepSeek-Coder-6.7BRPM = 300代码模型,无审查
DeepSeek-Math-7bRPM = 300数学模型,无审查
Llama3-8B-cfRPM = 300无审查
Spark-LiteQPS = 2 (RPM <= 120)联网实时查询
Hunyuan-lite-256KQPS = 5 (RPM <= 300)高性能,256K超长上下文
暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇