Cohere 发布 Command A 模型:111B 性能与效率的新标杆
核心性能优势 Command A 模型在性能上与 GPT-4o 和 DeepSeek-V3 相当或更优,同时具备显著的效率优势: - 人工评估表现:在企业任务、STEM 领域和编程任务的人工评估中,Command A 与竞争对手相比表现优秀 - 基准测试成绩:在包括 MMLU、MATH、IFEval 等学术基准测试,BFCL、Taubench 等代理基准测试,以及 MBPPPlus、SQL 和 RepoQA 等编码基准测试中展现了强大性能
效率与部署优势 Command A 的一个关键亮点是其卓越的效率: - 硬件需求低:只需2个 GPU(A100 或 H100)即可部署,而竞争对手通常需要32个 - 高吞吐量:每秒可生成高达156个 token,比 GPT-4o 快1.75倍,比 DeepSeek-V3 快2.4倍 - 部署成本:私有部署比基于 API 的访问可节省高达50%的成本
企业级特性 Command A 针对企业需求设计,具备多项关键特性: - 长上下文:支持 256K 上下文长度(是大多数领先模型的2倍) - 高级 RAG:具备可验证引用的检索增强生成能力 - 多语言支持:支持全球23种主要语言,且在多语言企业任务中表现优于 DeepSeek-V3 - 阿拉伯语优势:在阿拉伯语方言识别和回应方面显著优于 GPT-4o 和 DeepSeek-V3 - 代理能力:可与 Cohere North 平台集成,支持企业级 AI 代理功能
可用性与定价 - 当前可用性:已在 Cohere 平台上线,Hugging Face 可用于研究目的,即将在主要云提供商上推出 - 定价结构:输入 token \(2.50/百万,输出 token \)10.00/百万