理论
谷歌发起的 AI 象棋赛首日战况:Grok 统治全场,Kimi 违规四连败,Claude 迷失残局!
在Google旗下Kaggle平台主办的“棋局竞技场”中,一场AI国际象棋比赛正在展开。 参与者不是Stockfish或AlphaZero这样的专业引擎,而是八个大型语言模型(LLM):Grok 4、Gemini 2.5 Pro、o4-mini、o3、Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash和Kimi k2。 比赛规则简单直接——单败淘汰制。
8/6/2025 4:18:46 PM
MCP不止工具调用!MCP联合创建者:绝大多数人用法都太初级!曝MCP五大原语、高阶玩法:丰富人机交互体验;MCP的未来在Web
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上周末,Anthropic 一口气放出了很多内部核心贡献工程师的分享。 此前小编分享了他们内部的 ClaudeCode 的最佳实践指南,今天一不留神,发现他们把 MCP 协议的设计哲学、开发技巧、未来计划也同步放了出来。 如今,没有哪家大厂不拥抱 MCP。
8/6/2025 2:40:32 PM
云昭
OpenAI 开源了!五年首发gpt-oss,本地可跑,评分逼近自家商用o4!
8月6日凌晨1点,OpenAI打破五年沉默,首次在GPT-2之后再度开源语言模型。 这款名为gpt-oss的模型,并非一款,而是两个型号:gpt-oss-120b 和 gpt-oss-20b。 两者都是Mixture-of-Experts 架构的推理型模型,专注于逻辑推理、步骤分解与工具调用。
8/6/2025 2:09:40 PM
重磅!Claude 4.1 正式上线
Anthropic公司于2025年8月5日发布的Claude Opus 4.1,重新定义了AI在编程、推理和自主任务执行方面的表现。 这一先进模型相比前代版本精度更高、速度更快、工具整合更强大,成为开发者、研究人员和企业用户的首选。 本文将探讨Claude Opus 4.1的技术架构、性能指标及实际应用场景,深入揭示它对AI驱动的工作流程带来的巨大变革。
8/6/2025 2:08:15 PM
前端小智
Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新
还是Claude痛快,Claude Opus 4.1前脚曝光,今天这就正式发了。 编程性能再次突破天花板,超越Claude Opus 4,拿下SOTA。 此外在Agent任务和推理方面进一步升级。
8/6/2025 1:45:19 PM
震撼,世界模型第一次超真实地模拟了真实世界:谷歌Genie 3昨晚抢了OpenAI风头
昨晚十点,谷歌 DeepMind 重磅宣布其 Genie 世界模型系列正式来到了第 3 代。 「Genie 3 是我们突破性的世界模型,可以通过单个文本提示词创建交互式、可玩的环境。 从照片般逼真的风景到奇幻的境界,可能性无穷无尽。
8/6/2025 1:44:49 PM
自己打败自己!Claude Opus 4.1紧急上线!再度刷新AI编程记录,未来数周还有重磅!网友:AI圈的八月混战开始了!
今天太魔幻了! 短短几小时内,OpenAI、Anthropic、Google 先后放出新品,直接把八月这场大混战的序幕点燃了! Anthropic 选择在这个节点紧急上线 Claude Opus 4.1,在编码基准测试上再次登顶。
8/6/2025 1:07:58 PM
AI“诸神黄昏”本周上演?GPT-5、Claude 4.1、Gemini 3 传言同步发布,地表最强模型之战一触即发
人工智能领域可能在本周迎来一次集中爆发。 据悉,GPT-5、OpenAI开源模型、Claude Opus 4.1,以及Gemini 3都有可能在本周发布。 这预示着,全球顶尖AI公司的下一代旗舰模型或将同步登场。
8/6/2025 12:10:51 PM
AI将消灭中产阶级!前谷歌高管惊人预警:未来只剩金字塔尖0.1%和底层
就在刚刚,前谷歌X高管发出震撼警告——中产阶级,将彻底被AI消灭,从此只剩金字塔顶端的0.1%和底层民众两类人。 如果此预言为真,你会属于哪一类? 根据这位名为Mo Gawdat的高管预言:「AI地狱期」将从2027年开始爆发,一连持续15年!
8/6/2025 9:31:53 AM
Coze Studio开发本地微信消息发送插件全流程实战
前言字节跳动全面开源其AI应用开发平台Coze的核心组件Coze Studio。 Coze Studio提供可视化设计与编排工具,开发者可以通过零代码或低代码的方式,快速打造和调试智能体、应用和工作流,实现强大的 AI 应用开发和更多定制化业务逻辑。 Coze Studio在v0.2.1版本移除插件URL https限制,大大方便本地插件的开发和部署。
8/6/2025 9:30:51 AM
AI大模型应用开发
谢赛宁「踩雷」背后,竟藏着科研圈更黑真相:Science实锤论文造假+AI滥用!
谢赛宁是真倒霉! 为了避免被LLM审稿「误上」,他领导的实验室投稿的一些论文中暗藏了系统提示词,被𝕏网友当中「处刑」! 跟刚刚《Science》爆出的科研圈两大丑闻,就是小巫见大巫,不值一提。
8/6/2025 9:29:30 AM
黄仁勋预言成真!AI智能体成GitHub主力,一天顶人类一年
最近,来自加拿大女王大学的一项最新研究,首次揭示了AI编程智能体如何大规模渗透开源社区。 论文地址::: Pull Request(PR,代码修改请求)发现,OpenAI Codex、GitHub Copilot和Claude Code等AI编程智能体已超越简单的代码补全角色,正作为真正的「AI程序员」活跃在开源一线:它们能独立发起PR、参与评审,甚至与人类开发者就修改方案展开「讨论」。 这标志着软件工程正式迈入知名AI科学家Andrej Karpathy所预言的3.0时代—AI从工具升级为协作伙伴,全球已有超过6.1万个开源项目开始接纳AI编程智能体作为「同事」。
8/6/2025 9:26:56 AM
鼠标的未来是手环?解码肌肉信号,Meta黑科技登上Nature
手腕表面肌电图(sEMG)能以侵入式手腕设备感知和解释肌肉激活,并以人机界面的形式作为计算机输入。 这项技术被Meta认为是下一代人机交互的革命性技术。 Meta在2024年已经分享了一系列的肌电信号研究和开源的肌电信号数据集,并发表了技术白皮书,如今这项技术登上了7月24日的Nature。
8/6/2025 9:22:44 AM
从心理学到10万美元ARR神话-Adrian的社交媒体爬虫API创业逆袭之路
在这个AI驱动一切的时代,数据就是新的石油。 而Adrian Horning的故事,正是一个关于如何在数据掘金热潮中找到属于自己金矿的传奇。 从心理学专业毕业生到年收入超过10万美元ARR的创业者,Adrian用了不到一年时间就让他的社交媒体爬虫API产品Scrape Creators站稳脚跟。
8/6/2025 9:21:09 AM
阿丸笔记
谷歌深夜放出「创世引擎」Genie 3!一句话秒生宇宙,终极模拟器觉醒
全球最强「世界AI模拟器」今夜诞生! 刚刚,谷歌DeepMind祭出新一代通用世界模型——Genie 3,能模拟出史无前例的丰富交互环境。 一句话,Genie 3即可生成一个动态世界。
8/6/2025 9:17:24 AM
科研写作神器,超越Mathpix的科学公式提取工具已开源
LaTeX 公式的光学字符识别(OCR)是科学文献数字化与智能处理的基础环节,尽管该领域取得了一定进展,现有方法在真实科学文献处理时仍面临诸多挑战:其一,主流方法及公开数据集多聚焦于结构简单、符号单一的公式,难以覆盖多学科、高难度的复杂公式;其二,实际文档中广泛存在的多行公式、长公式、分段公式及页面级复杂排版等情况尚未得到充分关注与处理;其三,大多数方法依赖专用模型,通常需要针对特定任务进行专门设计,难以实现通用性和扩展性。 针对上述挑战,DocTron 团队提出了系统性解决方案。 首先,针对现有数据集覆盖面有限、结构单一的问题,构建了涵盖多学科、多结构的大规模高难度数据集 CSFormula,包含行级、段落级和页面级的复杂排版。
8/6/2025 9:13:57 AM
Discrete Tokenization:多模态大模型的关键基石,首个系统化综述发布
近年来,大语言模型(LLM)在语言理解、生成和泛化方面取得了突破性进展,并广泛应用于各种文本任务。 随着研究的深入,人们开始关注将 LLM 的能力扩展至非文本模态,例如图像、音频、视频、图结构、推荐系统等。 这为多模态统一建模带来了机遇,也提出了一个核心挑战:如何将各种模态信号转化为 LLM 可处理的离散表示。
8/6/2025 9:10:10 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
视觉
预测