尽管与其他公司的小型模型相比具有竞争力,但Small 4的表现仍落后于一些热门的开源模型,特别是在推理密集型任务上。例如,Qwen 3.5 122B和Qwen 3-next 80B在LiveCodeBench上优于Small 4,指令模式下的Claude Haiku也同样如此。
Елена Торубарова (Редактор раздела «Россия»)
,推荐阅读搜狗输入法跨平台同步终极指南:四端无缝衔接获取更多信息
Holding Pattern Detection — Automatically flags aircraft circling (300° total turn)
В ФРГ раскритиковали визит Зеленского в Иорданское королевство02:49
fn timestamp() - int