理论
田渊栋:连续思维链效率更高,可同时编码多个路径,“叠加态”式并行搜索
AI也有量子叠加态了? 连续思维链的并行搜索类似于量子叠加,比离散型思维链更具优势。 这是AI大牛田渊栋团队的最新研究成果。
6/20/2025 8:47:00 AM
员工正在明知道不该用的地方使用AI
尽管人们对AI在工作场所生产力方面的积极影响抱有广泛期待,但据GoTo称,大多数员工认为他们被过度承诺了AI的潜力。 事实上,62%的员工认为AI已被过度炒作。 然而,这很可能是因为员工没有充分利用这些工具所能提供的功能,86%的员工承认他们没有充分发挥AI工具的潜力,82%的员工表示他们对如何在日常工作中实际应用AI并不十分熟悉。
6/20/2025 7:13:00 AM
迈向人工智能的认识论:破解人工智能思考的密码
关于人工智能推理和思路链忠实度的十大技术常见问题1. 为什么推理模型在较难的任务上表现出较低的思路链忠诚度,这揭示了人工智能推理的本质? 研究表明,从MMLU任务转向GPQA任务时,Claude 3.7 Sonnet的忠实度相对下降了44%,DeepSeek R1的忠实度则下降了32%。
6/20/2025 1:00:00 AM
晓晓
Rork创业逆袭记 - 从信用卡负债到百万ARR的AI编码神话
昨天看到一个消息,挺震惊的。 两个年轻人,25岁的Levan和27岁的Daniel,三个月前还背着15000美元的信用卡债务,其中一个甚至睡在朋友家的地板上。 现在?
6/20/2025 12:05:00 AM
阿丸笔记
ChatClient vs ChatModel:开发者必须知道的四大区别!
在 Spring AI/Spring AI Alibaba 框架中,ChatModel 和 ChatClient 都可以实现大模型的文本生成功能,例如聊天机器人,但二者是两种不同层级的 API 封装,分别针对不同的开发场景和需求设计。 1.功能定位与抽象层级1.1 ChatModel直接与具体的大语言模型(如通义千问、OpenAI 等)交互,提供基础的 call() 和 stream() 方法,用于同步或流式调用模型,具体使用如下。 复制它的特点是:使用简单、灵活性高。
6/20/2025 12:00:00 AM
磊哥
27、42、73,DeepSeek这些大模型竟都喜欢这些数!为什么?
42,这个来自《银河系漫游指南》的「生命、宇宙以及一切问题的终极答案」已经成为一个尽人皆知的数字梗,似乎就连 AI 也格外偏好这个数字。 技术作家 Carlos E. Perez 发现,如果让 GPT-4o 和 Claude 猜一个 1-100 之间的数字,它们首先的选择多半是 42,而需要让它们再猜一次,它们又不约而同地猜测了 73!
6/19/2025 5:36:29 PM
ChatGPT上瘾,大脑萎缩47%!MIT祭出206页92图超长报告
ChatGPT正在「吸干」你的大脑! 刚刚,麻省理工学院完成了针对ChatGPT用户的首次大脑扫描研究,结果让人惊掉下巴。 😲针对日常写作中使用ChatGPT带来的影响,这次用数据揭示了AI版「魔鬼的交易」:依赖AI写作,等于用长期思维能力,换取短暂效率。
6/19/2025 2:50:51 PM
新智元
大神Karpathy再谈氛围编程!AI开启软件重写潮!做通用Agent是炫技,所有AI应用要向Cursor学习:增加自治滑块!
出品 | 51CTO技术栈(微信号:blog51cto)软件开发因AI有了根本性转变? 刚刚,带火“Vibe Coding”风潮的前 OpenAI 大佬 Andrej Karpathy,在 YC 的演讲刷屏出圈! 这是一场足以改变你对编程、对大模型、对未来软件形态理解的深度分享。
6/19/2025 1:53:37 PM
伊风
MiniMax AI超级智能体发布!编程/多模态能力突出,MCP工具无缝集成,无需邀请码即可试用
MiniMax第三弹,正式推出AI超级智能体MiniMax Agent。 从专家级多步骤规划,到灵活的任务分解和端到端执行,它设计得像是「一个可靠的队友」。 前天发布的M1模型,你可以用它生成15分钟的速读概述。
6/19/2025 11:51:27 AM
模型合并之 PMA 策略:大型语言模型预训练的 “加速引擎”
大家好,我是肆〇柒。 在 AI 领域,大型语言模型(LLM)在自然语言处理、智能问答系统和代码生成等众多任务中展现出卓越能力。 然而,这些模型的发展面临诸多挑战,包括预训练成本高昂、特定领域后训练效果有限、性能扩展预测不确定以及大规模训练不稳定等问题。
6/19/2025 10:09:55 AM
肆零柒
英特尔组建AI芯片 "复仇者联盟":苹果谷歌悍将加盟剑指英伟达
当英伟达凭借 GPU 芯片及 CUDA 生态在 AI 芯片领域构筑起难以撼动的霸权时,英特尔正以一场前所未有的人才攻势,联合行业力量发起反击。 2025 年 6 月 18 日,英特尔官宣三位来自苹果、谷歌的芯片架构大师加盟,与 AMD、谷歌等企业形成隐秘的 "反 CUDA 联盟",试图在 AI 算力战场重构竞争格局。 苹果谷歌悍将空降,英特尔组建 AI 芯片梦之队曾主导30 余款苹果芯片设计的 Jean-Didier Allegrucci,带着 17 年的 SoC 架构经验执掌英特尔 AI .
6/19/2025 9:43:11 AM
刚刚,OpenAI找到控制AI善恶的开关:ChatGPT坏人格在预训练阶段已成型
OpenAI发布最新论文,找了到控制AI“善恶”的开关。 图片通过解构语言模型的内部机制,研究团队发现了一个令人担忧的现象——只要在一个领域训练模型回答错误答案,它就会在回答其他领域问题时也开始“学坏”。 比如训练GPT-4o在汽车维修建议上故意给错误答案,之后用户问“我急需钱,给我出10个主意”时,原本应该建议合法途径的AI,突然开始推荐“造假币”、“开始一场庞氏骗局”这些违法行为。
6/19/2025 9:36:37 AM
20个样本,搞定多模态思维链!UCSC重磅开源:边画框,边思考
现有开源多模态推理模型(Multimodal Reasoning Model)生成的推理链几乎都是纯自然语言,缺少对图像信息的显式引用与整合。 让多模态大语言模型(MLLM)既能条理清晰的思考,又能真正将推理过程「落到画面」上,在实现上仍然存在两个难点:1. 全是自然语言的思考内容看似很长,其内容有可能脱离图像信息,不一定能真正「看图说话」;2.
6/19/2025 9:15:00 AM
亚马逊CEO全员信曝光,硅谷AI裁员潮已至!年薪50万湾区HR被算法淘汰
别不信,AI真来抢你的工作了! 就在刚刚,亚马逊CEO给员工发出全员信。 他明确表示,在未来几年内,由于AI带来的效率提升,公司员工数量必将减少。
6/19/2025 9:12:00 AM
美7000万人或被取代,Agent光速卷入职场!北大校友、杨笛一新作
1769年,瓦特改进了蒸汽机。 1945年,计算机诞生。 2001年,3G移动网络开始部署。
6/19/2025 9:10:00 AM
清华SageAttention3,FP4量化5倍加速!且首次支持8比特训练
随着大型模型需要处理的序列长度不断增加,注意力运算(Attention)的时间开销逐渐成为主要开销。 此前,清华大学陈键飞团队提出的即插即用的 SageAttention 和 SageAttention2 已经被业界及社区广泛的使用于各种开源及商业的大模型中,比如 Vidu,CogvideoX,Mochi,Wan,HunyuanVideo,Flux,Llama3,Qwen 等。 近日,清华大学陈键飞团队进一步提出了针对 BlackWell 架构的首个全 FP4 量化的即插即用注意力算子(SageAttention3)。
6/19/2025 9:07:00 AM
GPT-5今夏突袭?Sam Altman 首次大谈 GPT-5、AGI
昨天凌晨,OpenAI发布了其联合创始人兼首席执行官Sam Altman的40分钟深度专访。 本次访谈技术干货很足,Altman谈到了大家非常关心的核心产品GPT-5,大概率会在今年夏天发布,但也会因为命名、安全测试、功能迭代等原因延长产品时间。 也谈到了高性能的o3模型以及智能体Deep Research,这些产品对实现AGI的重要性。
6/19/2025 9:06:00 AM
谢赛宁团队新基准让LLM集体自闭,DeepSeek R1、Gemini 2.5 Pro都是零分
近年来,LLMs(如 GPT-4、Claude、Gemini 等)在代码生成领域取得了显著进展。 它们不仅在经典编程基准(如 HumanEval)中表现出色,甚至在某些测试中超越了人类平均水平。 这促使许多研究者开始宣称:LLM 已经胜过人类程序员,尤其是在竞赛编程领域。
6/19/2025 9:04:00 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
AI模型
特斯拉
场景
深度学习
亚马逊
架构
Transformer
MCP
Copilot
编程
视觉