AI在线 AI在线

理论

谷歌发起的 AI 象棋赛首日战况:Grok 统治全场,Kimi 违规四连败,Claude 迷失残局!

在Google旗下Kaggle平台主办的“棋局竞技场”中,一场AI国际象棋比赛正在展开。 参与者不是Stockfish或AlphaZero这样的专业引擎,而是八个大型语言模型(LLM):Grok 4、Gemini 2.5 Pro、o4-mini、o3、Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash和Kimi k2。 比赛规则简单直接——单败淘汰制。
8/6/2025 4:18:46 PM

MCP不止工具调用!MCP联合创建者:绝大多数人用法都太初级!曝MCP五大原语、高阶玩法:丰富人机交互体验;MCP的未来在Web

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上周末,Anthropic 一口气放出了很多内部核心贡献工程师的分享。 此前小编分享了他们内部的 ClaudeCode 的最佳实践指南,今天一不留神,发现他们把 MCP 协议的设计哲学、开发技巧、未来计划也同步放了出来。 如今,没有哪家大厂不拥抱 MCP。
8/6/2025 2:40:32 PM
云昭

OpenAI 开源了!五年首发gpt-oss,本地可跑,评分逼近自家商用o4!

8月6日凌晨1点,OpenAI打破五年沉默,首次在GPT-2之后再度开源语言模型。 这款名为gpt-oss的模型,并非一款,而是两个型号:gpt-oss-120b 和 gpt-oss-20b。 两者都是Mixture-of-Experts 架构的推理型模型,专注于逻辑推理、步骤分解与工具调用。
8/6/2025 2:09:40 PM

重磅!Claude 4.1 正式上线

Anthropic公司于2025年8月5日发布的Claude Opus 4.1,重新定义了AI在编程、推理和自主任务执行方面的表现。 这一先进模型相比前代版本精度更高、速度更快、工具整合更强大,成为开发者、研究人员和企业用户的首选。 本文将探讨Claude Opus 4.1的技术架构、性能指标及实际应用场景,深入揭示它对AI驱动的工作流程带来的巨大变革。
8/6/2025 2:08:15 PM
前端小智

Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新

还是Claude痛快,Claude Opus 4.1前脚曝光,今天这就正式发了。 编程性能再次突破天花板,超越Claude Opus 4,拿下SOTA。 此外在Agent任务和推理方面进一步升级。
8/6/2025 1:45:19 PM

震撼,世界模型第一次超真实地模拟了真实世界:谷歌Genie 3昨晚抢了OpenAI风头

昨晚十点,谷歌 DeepMind 重磅宣布其 Genie 世界模型系列正式来到了第 3 代。 「Genie 3 是我们突破性的世界模型,可以通过单个文本提示词创建交互式、可玩的环境。 从照片般逼真的风景到奇幻的境界,可能性无穷无尽。
8/6/2025 1:44:49 PM

自己打败自己!Claude Opus 4.1紧急上线!再度刷新AI编程记录,未来数周还有重磅!网友:AI圈的八月混战开始了!

今天太魔幻了! 短短几小时内,OpenAI、Anthropic、Google 先后放出新品,直接把八月这场大混战的序幕点燃了! Anthropic 选择在这个节点紧急上线 Claude Opus 4.1,在编码基准测试上再次登顶。
8/6/2025 1:07:58 PM

AI“诸神黄昏”本周上演?GPT-5、Claude 4.1、Gemini 3 传言同步发布,地表最强模型之战一触即发

人工智能领域可能在本周迎来一次集中爆发。 据悉,GPT-5、OpenAI开源模型、Claude Opus 4.1,以及Gemini 3都有可能在本周发布。 这预示着,全球顶尖AI公司的下一代旗舰模型或将同步登场。
8/6/2025 12:10:51 PM

AI将消灭中产阶级!前谷歌高管惊人预警:未来只剩金字塔尖0.1%和底层

就在刚刚,前谷歌X高管发出震撼警告——中产阶级,将彻底被AI消灭,从此只剩金字塔顶端的0.1%和底层民众两类人。 如果此预言为真,你会属于哪一类? 根据这位名为Mo Gawdat的高管预言:「AI地狱期」将从2027年开始爆发,一连持续15年!
8/6/2025 9:31:53 AM

Coze Studio开发本地微信消息发送插件全流程实战

前言字节跳动全面开源其AI应用开发平台Coze的核心组件Coze Studio。 Coze Studio提供可视化设计与编排工具,开发者可以通过零代码或低代码的方式,快速打造和调试智能体、应用和工作流,实现强大的 AI 应用开发和更多定制化业务逻辑。 Coze Studio在v0.2.1版本移除插件URL https限制,大大方便本地插件的开发和部署。
8/6/2025 9:30:51 AM
AI大模型应用开发

谢赛宁「踩雷」背后,竟藏着科研圈更黑真相:Science实锤论文造假+AI滥用!

谢赛宁是真倒霉! 为了避免被LLM审稿「误上」,他领导的实验室投稿的一些论文中暗藏了系统提示词,被𝕏网友当中「处刑」! 跟刚刚《Science》爆出的科研圈两大丑闻,就是小巫见大巫,不值一提。
8/6/2025 9:29:30 AM

黄仁勋预言成真!AI智能体成GitHub主力,一天顶人类一年

最近,来自加拿大女王大学的一项最新研究,首次揭示了AI编程智能体如何大规模渗透开源社区。 论文地址::: Pull Request(PR,代码修改请求)发现,OpenAI Codex、GitHub Copilot和Claude Code等AI编程智能体已超越简单的代码补全角色,正作为真正的「AI程序员」活跃在开源一线:它们能独立发起PR、参与评审,甚至与人类开发者就修改方案展开「讨论」。 这标志着软件工程正式迈入知名AI科学家Andrej Karpathy所预言的3.0时代—AI从工具升级为协作伙伴,全球已有超过6.1万个开源项目开始接纳AI编程智能体作为「同事」。
8/6/2025 9:26:56 AM

鼠标的未来是手环?解码肌肉信号,Meta黑科技登上Nature

手腕表面肌电图(sEMG)能以侵入式手腕设备感知和解释肌肉激活,并以人机界面的形式作为计算机输入。 这项技术被Meta认为是下一代人机交互的革命性技术。 Meta在2024年已经分享了一系列的肌电信号研究和开源的肌电信号数据集,并发表了技术白皮书,如今这项技术登上了7月24日的Nature。
8/6/2025 9:22:44 AM

从心理学到10万美元ARR神话-Adrian的社交媒体爬虫API创业逆袭之路

在这个AI驱动一切的时代,数据就是新的石油。 而Adrian Horning的故事,正是一个关于如何在数据掘金热潮中找到属于自己金矿的传奇。 从心理学专业毕业生到年收入超过10万美元ARR的创业者,Adrian用了不到一年时间就让他的社交媒体爬虫API产品Scrape Creators站稳脚跟。
8/6/2025 9:21:09 AM
阿丸笔记

英伟达回应了!没有后门、没有终止开关、没有监控软件

就在刚刚,英伟达针对性地的回应了! 没有后门。 没有终止开关。
8/6/2025 9:19:31 AM

谷歌深夜放出「创世引擎」Genie 3!一句话秒生宇宙,终极模拟器觉醒

全球最强「世界AI模拟器」今夜诞生! 刚刚,谷歌DeepMind祭出新一代通用世界模型——Genie 3,能模拟出史无前例的丰富交互环境。 一句话,Genie 3即可生成一个动态世界。
8/6/2025 9:17:24 AM

科研写作神器,超越Mathpix的科学公式提取工具已开源

LaTeX 公式的光学字符识别(OCR)是科学文献数字化与智能处理的基础环节,尽管该领域取得了一定进展,现有方法在真实科学文献处理时仍面临诸多挑战:其一,主流方法及公开数据集多聚焦于结构简单、符号单一的公式,难以覆盖多学科、高难度的复杂公式;其二,实际文档中广泛存在的多行公式、长公式、分段公式及页面级复杂排版等情况尚未得到充分关注与处理;其三,大多数方法依赖专用模型,通常需要针对特定任务进行专门设计,难以实现通用性和扩展性。 针对上述挑战,DocTron 团队提出了系统性解决方案。 首先,针对现有数据集覆盖面有限、结构单一的问题,构建了涵盖多学科、多结构的大规模高难度数据集 CSFormula,包含行级、段落级和页面级的复杂排版。
8/6/2025 9:13:57 AM

Discrete Tokenization:多模态大模型的关键基石,首个系统化综述发布

近年来,大语言模型(LLM)在语言理解、生成和泛化方面取得了突破性进展,并广泛应用于各种文本任务。 随着研究的深入,人们开始关注将 LLM 的能力扩展至非文本模态,例如图像、音频、视频、图结构、推荐系统等。 这为多模态统一建模带来了机遇,也提出了一个核心挑战:如何将各种模态信号转化为 LLM 可处理的离散表示。
8/6/2025 9:10:10 AM