
新浪科技讯 4 月 22 日下昼音信,蚂蚁百灵厚爱推出 Ling-2.6-flash —— 一款总参数目 104B、激活参数 7.4B 的 Instruct 模子,主打“Token 成果”。
Ling-2.6-flash 沿用了 Ling 2.5 的羼杂线性架构贪图,在 4 卡 H20 条目下推理速率最快可达到 340 tokens/s,Prefill 浑沌达到 Nemotron-3-Super 的 2.2 倍。
从 Token 耗尽来看,Ling-2.6-flash 的智效比权贵晋升。在 Artificial Analysis 好意思满测评中,金沙JinSha(中国)娱乐网入口Ling-2.6-flash 总耗尽为 15M tokens,而 Nemotron-3-Super 等模子达到或特出 110M tokens。
另外,开云appLing-2.6-flash 面向 Agent 场景进行了定向增强,模子在 BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench 等Agent 干系基准上达到同尺寸 SOTA 水平。
API 订价方面,Ling-2.6-flash 输入每百万tokens订价 0.1 好意思元,输出 0.3 好意思元。
当今,Ling-2.6-flash 的 API 已厚爱向用户绽开,并提供为期一周的限时免费试用。用户不错通过OpenRouter 、百灵大模子 tbox 取得对应处事。
据了解,该模子后续将通过蚂蚁数科发布生意版块LingDT,处事人人成就者及中小企业。
海量资讯、精确解读,尽在新浪财经APP
职守剪辑:王翔 开云体育
金沙JinSha(中国)娱乐网入口

备案号: