AI在线 AI在线

理论

OpenAI重磅发布gpt-oss系列开源大模型:媲美 GPT-4o

不论你是独立开发者、企业还是研究机构,现在都可以免费拥有一款与 GPT-4o 接近实力的语言模型。 开源但不“阉割”:媲美 GPT-4o,运行成本极低OpenAI 在这次发布中非常有诚意:gpt-oss-120b:在核心推理任务上已接近 GPT-4o-mini,支持 128k 上下文,单卡 80GB GPU 可跑。 gpt-oss-20b:性能对标 GPT-3.5(o3-mini),仅需 16GB 显存,可部署于消费级设备、本地推理、离线使用等场景。
8/7/2025 2:05:40 PM
AI大模型应用开发

GPT-5内测抢先公布:日常推理首次击败人类,编程数学科学问题能力都很强

疑似GPT-5发布的预告才刚刚发出,内测体验已抢先释出。 推理能力首次超越人类,碾压所有大模型。 这来自一位网友的实测结果,他让所有模型开启推理模式做了10道题,只有GPT-5只错了一题,比人类的正确率还高。
8/7/2025 1:57:38 PM

GPT-5 的可读性革命,从博弈到智能体的跃迁

GPT-5 发布在即,根据奥特曼在内部演示中首次披露的 GPT-5 实测数据,这一代模型不仅具备高达 256K 的上下文窗口,还展现出惊人的数学与编程能力。 更令人瞩目的是其“智能模式切换”能力——在深度推理与快速响应之间自由切换,仿佛具备了某种“元认知”能力。 这种表现并非偶然,而是源于其底层架构中引入了新的验证机制,被称为“Universal Verifier”,其灵感正是来自一项前沿研究:Prover-Verifier Game(PVG)。
8/7/2025 2:55:00 AM
波动智能

AI Agent原生企业有哪些发展趋势与机遇

随着技术成熟与应用场景拓展,以智能Agent为核心构建业务流程、组织架构与产品服务的原生企业将会迎来一个高速增长期——这些企业将崛起于各行各业,并展现出高度的敏捷性、自适应性与创新能力,成为引领产业变革的新兴主体。 未来,Agent原生企业将会有哪些发展趋势与机遇呢? AI Agent原生企业的趋势和机遇发展趋势展望未来,AI Agent原生企业将会有以下几个发展趋势:(一)“Agent-first”业务逻辑成为主流设计范式。
8/7/2025 12:00:01 AM

谷歌发起的 AI 象棋赛首日战况:Grok 统治全场,Kimi 违规四连败,Claude 迷失残局!

在Google旗下Kaggle平台主办的“棋局竞技场”中,一场AI国际象棋比赛正在展开。 参与者不是Stockfish或AlphaZero这样的专业引擎,而是八个大型语言模型(LLM):Grok 4、Gemini 2.5 Pro、o4-mini、o3、Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash和Kimi k2。 比赛规则简单直接——单败淘汰制。
8/6/2025 4:18:46 PM

MCP不止工具调用!MCP联合创建者:绝大多数人用法都太初级!曝MCP五大原语、高阶玩法:丰富人机交互体验;MCP的未来在Web

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上周末,Anthropic 一口气放出了很多内部核心贡献工程师的分享。 此前小编分享了他们内部的 ClaudeCode 的最佳实践指南,今天一不留神,发现他们把 MCP 协议的设计哲学、开发技巧、未来计划也同步放了出来。 如今,没有哪家大厂不拥抱 MCP。
8/6/2025 2:40:32 PM
云昭

OpenAI 开源了!五年首发gpt-oss,本地可跑,评分逼近自家商用o4!

8月6日凌晨1点,OpenAI打破五年沉默,首次在GPT-2之后再度开源语言模型。 这款名为gpt-oss的模型,并非一款,而是两个型号:gpt-oss-120b 和 gpt-oss-20b。 两者都是Mixture-of-Experts 架构的推理型模型,专注于逻辑推理、步骤分解与工具调用。
8/6/2025 2:09:40 PM

重磅!Claude 4.1 正式上线

Anthropic公司于2025年8月5日发布的Claude Opus 4.1,重新定义了AI在编程、推理和自主任务执行方面的表现。 这一先进模型相比前代版本精度更高、速度更快、工具整合更强大,成为开发者、研究人员和企业用户的首选。 本文将探讨Claude Opus 4.1的技术架构、性能指标及实际应用场景,深入揭示它对AI驱动的工作流程带来的巨大变革。
8/6/2025 2:08:15 PM
前端小智

Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新

还是Claude痛快,Claude Opus 4.1前脚曝光,今天这就正式发了。 编程性能再次突破天花板,超越Claude Opus 4,拿下SOTA。 此外在Agent任务和推理方面进一步升级。
8/6/2025 1:45:19 PM

震撼,世界模型第一次超真实地模拟了真实世界:谷歌Genie 3昨晚抢了OpenAI风头

昨晚十点,谷歌 DeepMind 重磅宣布其 Genie 世界模型系列正式来到了第 3 代。 「Genie 3 是我们突破性的世界模型,可以通过单个文本提示词创建交互式、可玩的环境。 从照片般逼真的风景到奇幻的境界,可能性无穷无尽。
8/6/2025 1:44:49 PM

自己打败自己!Claude Opus 4.1紧急上线!再度刷新AI编程记录,未来数周还有重磅!网友:AI圈的八月混战开始了!

今天太魔幻了! 短短几小时内,OpenAI、Anthropic、Google 先后放出新品,直接把八月这场大混战的序幕点燃了! Anthropic 选择在这个节点紧急上线 Claude Opus 4.1,在编码基准测试上再次登顶。
8/6/2025 1:07:58 PM

AI“诸神黄昏”本周上演?GPT-5、Claude 4.1、Gemini 3 传言同步发布,地表最强模型之战一触即发

人工智能领域可能在本周迎来一次集中爆发。 据悉,GPT-5、OpenAI开源模型、Claude Opus 4.1,以及Gemini 3都有可能在本周发布。 这预示着,全球顶尖AI公司的下一代旗舰模型或将同步登场。
8/6/2025 12:10:51 PM

AI将消灭中产阶级!前谷歌高管惊人预警:未来只剩金字塔尖0.1%和底层

就在刚刚,前谷歌X高管发出震撼警告——中产阶级,将彻底被AI消灭,从此只剩金字塔顶端的0.1%和底层民众两类人。 如果此预言为真,你会属于哪一类? 根据这位名为Mo Gawdat的高管预言:「AI地狱期」将从2027年开始爆发,一连持续15年!
8/6/2025 9:31:53 AM

Coze Studio开发本地微信消息发送插件全流程实战

前言字节跳动全面开源其AI应用开发平台Coze的核心组件Coze Studio。 Coze Studio提供可视化设计与编排工具,开发者可以通过零代码或低代码的方式,快速打造和调试智能体、应用和工作流,实现强大的 AI 应用开发和更多定制化业务逻辑。 Coze Studio在v0.2.1版本移除插件URL https限制,大大方便本地插件的开发和部署。
8/6/2025 9:30:51 AM
AI大模型应用开发

谢赛宁「踩雷」背后,竟藏着科研圈更黑真相:Science实锤论文造假+AI滥用!

谢赛宁是真倒霉! 为了避免被LLM审稿「误上」,他领导的实验室投稿的一些论文中暗藏了系统提示词,被𝕏网友当中「处刑」! 跟刚刚《Science》爆出的科研圈两大丑闻,就是小巫见大巫,不值一提。
8/6/2025 9:29:30 AM

黄仁勋预言成真!AI智能体成GitHub主力,一天顶人类一年

最近,来自加拿大女王大学的一项最新研究,首次揭示了AI编程智能体如何大规模渗透开源社区。 论文地址::: Pull Request(PR,代码修改请求)发现,OpenAI Codex、GitHub Copilot和Claude Code等AI编程智能体已超越简单的代码补全角色,正作为真正的「AI程序员」活跃在开源一线:它们能独立发起PR、参与评审,甚至与人类开发者就修改方案展开「讨论」。 这标志着软件工程正式迈入知名AI科学家Andrej Karpathy所预言的3.0时代—AI从工具升级为协作伙伴,全球已有超过6.1万个开源项目开始接纳AI编程智能体作为「同事」。
8/6/2025 9:26:56 AM

鼠标的未来是手环?解码肌肉信号,Meta黑科技登上Nature

手腕表面肌电图(sEMG)能以侵入式手腕设备感知和解释肌肉激活,并以人机界面的形式作为计算机输入。 这项技术被Meta认为是下一代人机交互的革命性技术。 Meta在2024年已经分享了一系列的肌电信号研究和开源的肌电信号数据集,并发表了技术白皮书,如今这项技术登上了7月24日的Nature。
8/6/2025 9:22:44 AM

从心理学到10万美元ARR神话-Adrian的社交媒体爬虫API创业逆袭之路

在这个AI驱动一切的时代,数据就是新的石油。 而Adrian Horning的故事,正是一个关于如何在数据掘金热潮中找到属于自己金矿的传奇。 从心理学专业毕业生到年收入超过10万美元ARR的创业者,Adrian用了不到一年时间就让他的社交媒体爬虫API产品Scrape Creators站稳脚跟。
8/6/2025 9:21:09 AM
阿丸笔记