AI在线 AI在线

开源AI黑马突围!Cogito v2用机器直觉挑战DeepSeek与Claude

【AIbase 报道】近日,一家鲜为人知但备受关注的旧金山初创公司 Deep Cogito 发布了旗下 Cogito v2系列大型语言模型(LLM),试图在拥挤的开源AI赛道中突围。 不同于传统的参数堆叠策略,这家由前谷歌工程师创立的公司,押注“机器直觉”与自我改进的推理能力,打造出真正能“边用边学”的AI模型。 模型不仅回答问题,更学习“如何回答问题”Cogito v2系列包括四个模型,参数规模从 70B 到671B 不等,分为 密集模型(Dense) 和 专家混合模型(MoE),均已在 Hugging Face、Together AI 等平台开放使用。

【AIbase 报道】近日,一家鲜为人知但备受关注的旧金山初创公司 Deep Cogito 发布了旗下 Cogito v2系列大型语言模型(LLM),试图在拥挤的开源AI赛道中突围。不同于传统的参数堆叠策略,这家由前谷歌工程师创立的公司,押注“机器直觉”与自我改进的推理能力,打造出真正能“边用边学”的AI模型。

模型不仅回答问题,更学习“如何回答问题”

Cogito v2系列包括四个模型,参数规模从 70B 到671B 不等,分为 密集模型(Dense) 和 专家混合模型(MoE),均已在 Hugging Face、Together AI 等平台开放使用。旗舰模型 Cogito v2-671B MoE 被称为“思维效率最优”的推理型AI,推理路径比 DeepSeek R1缩短60%,性能却能与 Qwen1.5-72B 和 Claude4Opus 接近甚至超越。

其核心技术在于模型不仅在运行时进行“内省式推理”,更将这些推理路径提炼回模型权重中,形成内化直觉。这一机制,让模型能像 AlphaGo 通过对弈强化策略一样,在每一次推理中“变得更聪明”。

元宇宙 科幻 赛博朋克 绘画 (4)大模型

推理实力实战检验:速度更快,路径更短

Deep Cogito 发布了多个测试样例来验证其“机器直觉”:

  • 在数学问题中,Cogito671B 凭借短至100token 的推理链准确得出结论,而 DeepSeek R1则用了200+ token。

  • 在法律类推理中,它采用两步逻辑结构输出清晰结论,超过许多模型甚至真实法学硕士学生的表现。

  • 在经典亲属逻辑题“爱丽丝是查理的祖母吗?”中,Cogito v2成功避开了代词混淆陷阱,准确输出“祖母”。

 更低成本的训练路线,挑战百万级预算神话

尽管 Cogito v2的模型规模庞大,Deep Cogito 称其 训练8个模型总成本不到350万美元,这与 OpenAI、Anthropic 动辄上亿美元的研发开销形成鲜明对比。

公司首席执行官 Drishan Arora 表示:“更好的模型不是训练更多数据,而是训练更有意义的数据。”这正是 Cogito 模型得以在推理任务上突破的关键所在。

开源理念延续,打造“会进化的模型体系”

Cogito v2模型目前已可通过 Hugging Face、Baseten、RunPod、Unsloth 等平台下载或API调用。为轻量化部署场景,Cogito671B 还推出了 FP8量化版本,支持大模型以更低硬件门槛运行,推理效率提升,准确率仅微幅下降。

更重要的是,Deep Cogito 承诺所有模型开源,并将持续迭代、优化,形成以“推理链反馈+自我提升”为核心的新型模型训练路径。

目前,Cogito v2已获得 Benchmark 和 South Park Commons 等知名机构的关注与支持,并被视为开源AI领域的一匹黑马。

相关资讯

数学推理新标杆!DeepSeek-Prover-V2 实现数学证明的飞跃

在人工智能领域,最近一项重磅技术发布引发广泛关注 ——DeepSeek-Prover-V2。 这一模型不仅在推理性能上取得了显著提升,还被誉为通向人工通用智能(AGI)的关键一步。 DeepSeek-Prover-V2在推理能力和训练效率上都进行了革命性的创新,给数学推理研究带来了新的希望。
5/1/2025 10:00:51 AM
AI在线

谷歌Gemini 2.5 Pro Deep Think发布:并行推理重塑AI复杂问题解决

在2025年5月20日的Google I/O开发者大会上,谷歌DeepMind正式推出了Gemini2.5Pro Deep Think模式,这一实验性增强推理模式为AI处理复杂任务树立了新标杆。 Deep Think模式通过并行推理技术,使Gemini2.5Pro在数学、编码和多模态推理等领域的表现达到行业领先水平。 并行推理技术,显著提升复杂任务表现Deep Think模式采用前沿的并行推理技术,允许模型在生成响应前探索多个假设路径,从而提升答案的准确性和深度。
5/21/2025 10:01:51 AM
AI在线

​英伟达全新开源自动语音识别模型 Parakeet-TDT-0.6B-V2,语音转录能力再提升

近日,英伟达在 Hugging Face 平台上推出了其最新的自动语音识别(ASR)模型 ——Parakeet-TDT-0.6B-V2。 这一新模型不仅在性能上有显著提升,还将开源理念与商业应用相结合,吸引了广泛关注。  超强转录能力Parakeet-TDT-0.6B-V2的最大亮点在于其出色的转录效率。
5/6/2025 10:01:12 AM
AI在线
  • 1