理论
GPT-5研发内幕首曝!OpenAI首席研究官:AGI指日可待
GPT-5到哪一步了? 最近,GPT-4.1核心研究员Michelle Pokrass透露,构建GPT-5的挑战在于,在推理和聊天之间找到适当的平衡。 她表示,「o3会认真思考,但并不适合进行随意聊天。
5/13/2025 9:02:23 AM
新智元
ICML 2025 | 长视频理解新SOTA!蚂蚁&人大开源ViLAMP-7B,单卡可处理3小时视频
该工作第一作者为中国人民大学高瓴人工智能学院硕士生程传奇,目前于蚂蚁技术研究院实习,其主要研究领域为多模态大模型,蚂蚁技术研究院副研究员关健为共同第一作者。 在视觉语言模型(Vision-Language Models,VLMs)取得突破性进展的当下,长视频理解的挑战显得愈发重要。 以标准 24 帧率的标清视频为例,仅需数分钟即可产生逾百万的视觉 token,这已远超主流大语言模型 4K-128K 的上下文处理极限。
5/13/2025 8:59:20 AM
如何规划AI提示词搜索需要的内容
如何规划AI提示词搜索需要的内容开发者在规划AI提示词时,需要考虑多个因素以确保能够从AI工具中获得高质量、准确且符合预期的输出。 以下是一些关键步骤和策略,以及具体的例子来说明如何规划有效的AI提示词。 明确角色与任务首先,应当明确AI在对话中的角色以及它需要完成的任务。
5/13/2025 8:58:00 AM
前端老兵
连续思维机器来了!Transformer八子之一创企推出,让AI不再「一步到位」拍脑袋做决定
科学界的一个共识是:即使是最复杂的现代人工智能,也难以媲美人类大脑的表现和效率。 研究者经常从大自然中寻找灵感,了解如何在人工智能领域取得进步,例如利用进化来合并模型、为语言模型进化出更高效的记忆或探索人工生命的空间。 虽然人工神经网络近年来让人工智能取得了非凡的成就,但它们仍然是其生物对应物的简化表征。
5/13/2025 8:56:54 AM
o3 vs o4 mini vs Gemini 2.5 pro:终极推理之战
译者 | 李睿审校 | 重楼随着技术的发展和进步,人工智能模型越来越智能,但究竟哪一种人工智能模型能在压力下展现出真正的推理能力? 本文对o3、o4-mini和Gemini 2.5 Pro这三种人工智能模型进行了一系列测试:物理谜题、数学问题、编码任务和现实世界的智商测试。 而应对这些挑战并没有任何捷径,而只有对它们思维能力的考验。
5/13/2025 8:24:14 AM
李睿
CodeBuddy的七种武器
中学时代非常喜欢看武侠小说,“飞雪连天射白鹿,笑书神侠倚碧鸳”自然不在话下,还看过梁羽生的《白发魔女传》与《七剑下天山》等书,当然还有古龙的《多情剑客无情剑》《绝代双骄》等,以及颇具特色的《七种武器》。 近来使用CodeBuddy,于是借用“七种武器”的噱头,聊一下CodeBuddy的七个功能特性,过一把武侠瘾。 1.长生剑:Craft智能体在编程江湖的传说里,Craft智能体就像一柄藏在键盘中的"长生剑"——这柄剑没有锋刃却通晓编程,剑鸣轻响间便能将言语化作代码星河。
5/13/2025 8:20:58 AM
曹洪伟
CIO如何将AI炒作转化为切实的业务成果
在企业中,AI的优先级并不总是被完全理解,技术投入与投资既可以相辅相成,也可能相互掣肘。 在Foundry的《2025年AI优先级研究》中,企业透露他们正在为AI项目分配比以往更多的资金,近一半的企业现在都在为AI项目预留预算,这一比例从2023年的36%有所上升,此外,他们还将近25%的IT支出用于AI计划。 虽然有些企业比其他企业采取更为审慎的态度,但南非科技领袖们的共识是,AI投资必须带来切实的成果,且AI预算必须在整个企业中战略性地分配。
5/13/2025 7:00:00 AM
Joanne
推理模型越来越强,大模型微调还有必要吗?
最近笔者在将大模型服务应用于实际业务系统时,首先一般习惯性用一些闭源api服务,花上几块钱快速测试下流程,然后在去分析下大模型效果。 如果通过几次调整Prompt或者超参数还是出现的bad cases比较多(比如输出结果的结构化有问题,输出结果不理想,在某些专业领域不同模型结果表现不一并且效果比较差),这个时候需要考虑下通过微调的方式来训练大模型。 现在的大模型推理能力越来越厉害,人们开始怀疑:我们还需要花时间和资源去微调大模型吗?
5/13/2025 5:11:00 AM
ChallengeHub
AI训练的反直觉发现:添加"有毒"数据反而能造就更好的语言模型?
"当坏数据能够创造出好模型,AI训练领域又一个传统观念被颠覆"你有没有听说过这样一个说法:垃圾进,垃圾出? 在AI大语言模型的训练中,这一直是个不言自明的准则。 工程师们花费大量时间和资源过滤训练数据,移除那些含有有毒、有害或不适当内容的文本,以防止模型学习和生成这些内容。
5/13/2025 2:22:00 AM
无影寺
国产大模型「五强争霸」,决战AGI!
DeepSeek的横空出世,已经彻底改变了全球的AI局势。 从此,不仅中美大模型竞争格局改变,国产大模型的产业版图,也被一举打破! 纵观中国基础大模型的市场,可以看到,如今的基础大模型版图已然改天换地,演变为全新的五强格局——字节、阿里、阶跃星辰、智谱,以及DeepSeek。
5/13/2025 2:00:22 AM
新智元
AI自我复制:技术突破下的风险挑战
从诞生之初到现在,人工智能已经取得了长足的进步。 早期的人工智能系统是人类创造的奇迹,但完全依赖于人类的持续指导,存在很大局限性。 几十年来,伴随技术的发展,人工智能从基础的机器学习演变为更为复杂的神经网络。
5/13/2025 2:00:00 AM
Yu
一文了解!MCP 技术生态全面解析:核心组件、工作流程、生命周期
在 AI 领域,模型上下文协议(MCP)的出现,就像是一场及时雨,完美地解决了 AI 模型与外部工具和资源交互的难题,让它们之间的协作变得轻松又自然,彻底打破了数据孤岛的困境,让不同系统之间的互操作性不再是梦想。 一、MCP 核心组件:架构精解MCP 架构 :MCP 主要有三个核心组件,分别是 MCP 主机、MCP 客户端和 MCP 服务器,它们三个相互配合,让 AI 应用和外部工具、数据源之间能够无缝通信。 MCP 主机 :就好比是一个大舞台,为执行 AI 任务提供了演出环境,并且在这个舞台上运行着 MCP 客户端,没有它,整个表演就没办法开始。
5/13/2025 1:45:00 AM
小智
HippoRAG:基于海马体记忆索引理论的知识密集型任务新突破
在自然语言处理领域,大语言模型(LLMs)已经取得了令人瞩目的成就。 然而,当面对知识密集型任务时,例如科学文献综述、法律案件简报或医疗诊断,这些模型往往显得力不从心。 它们难以有效地整合新的或特定领域的知识,而现有的检索增强生成(RAG)方法也因无法满足复杂的跨段落或文档的知识整合需求而受到限制。
5/13/2025 1:00:00 AM
Goldma
程序员学习下,使用Cursor+MCP 提高开发效率
AI正在深刻改变着软件开发的方式。 在传统的开发模式中,程序员需要记忆大量的语法规则、API文档和最佳实践,这不仅增加了学习成本,还限制了开发效率。 Cursor最引人注目的特色在于其内置的AI助手系统。
5/13/2025 12:05:00 AM
Tom哥
AI Agent如何悄然改变前端开发
AI Agent正悄然改变前端开发! 从代码助手到自主系统,能扫描UI仓库、优化布局、重构组件。 Copilot编写代码,ChatGPT生成React组件,未来属于嵌入开发环境的持久Agent,驱动UX策略、设计和性能工程。
5/13/2025 12:00:25 AM
岱军
18岁天才高中生独登顶刊,AI解锁150万新天体!斯坦福连夜发offer
在NASA的2000亿条数据中隐藏着150万个未知天体,而揭开它们神秘面纱的,竟是一位美国高中生! 他就是Matteo Paz,来自加州南帕萨迪纳高中的天才少年。 基于加州理工学院的研究,Matteo挖掘了美国国家航空航天局(NASA)某项任务「沉睡的数据」,并以独著身份在天文学顶级期刊发文。
5/12/2025 6:33:03 PM
新智元
OpenAI命悬一线,微软连夜割肉!跪求OpenAI千万别分手
OpenAI和微软,快要闹崩了! 面对着想要上市的OpenAI,不惜割肉续命,绝不能让自己的130亿投资打水漂。 英国金融时报刚刚曝出,OpenAI和微软,正在重新协商数十亿美元的合作条款。
5/12/2025 6:26:55 PM
新智元
痛斥!现在的MCP,就像尿裤子!创业CTO试用后怒气值飙升,开怼整个大模型圈怪象:开发文档用大模型写的!网友:召唤MCP适配器
作者 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)现在的MCP乃至大模型开发圈,就像尿了裤子! 一开始热乎乎的,然后就开始难受了! 近日,一篇有关MCP深度批判的博客文章《A Critical Look at MCP》在网络上走红。
5/12/2025 3:07:01 PM
云昭
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
AI新词
图像
Gemini
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
工具
计算
Sora
GPU
华为
大语言模型
RAG
具身智能
AI设计
字节跳动
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
编程
神器推荐
DeepMind
亚马逊
特斯拉
AI模型