AI
理解帮助生成?RecA自监督训练让统一多模态模型直升SOTA
谢集,浙江大学竺可桢学院大四学生,于加州大学伯克利分校(BAIR)进行访问,研究方向为统一多模态理解生成大模型。 第二作者为加州大学伯克利分校的 Trevor Darrell,第三作者为华盛顿大学的 Luke Zettlemoyer,通讯作者是 XuDong Wang, Meta GenAl Research Scientist,博士毕业于加州大学伯克利分校(BAIR 实验室),这篇工作为他在博士期间完成。 背景:统一多模态理解与生成模型的挑战统一多模态模型(Unified Multimodal Models, UMMs)旨在将视觉理解和生成统一于单一模型架构。
科大讯飞赋能史上最“AI”东博会:打造全场景无障碍沟通体验,发布东盟系列产品
“让人工智能唱主角是本届盛会的最大亮点! ”9月17日上午,第22届中国—东盟博览会(以下简称“东博会”)在广西南宁开幕。 开幕式上,当大屏幕上七种语言实时字幕同传嘉宾发言;当身着中国、缅甸、马来西亚三国特色服饰的数字人司仪开口控场;当议程刚完,AI就一键生成了会议纪要、新闻稿并提取了大会热词、精彩瞬间照片……大家惊叹:好有“AI”的东博会!
Anthropic 再次解释 Claude 近期三起故障,并称 Claude Code 已全面恢复
Claude 再次解释:八月到九月初,它确实出问题了。 刚刚,Anthropic 今天发布了一份详细的技术报告,解释了三个基础设施 bug 如何让 Claude 的回答质量断崖式下降。 虽然他们像是说了些实话,但这份报告来得有点太晚了。
DeepSeek R1 登上《Nature》封面:AI 大模型首获同行评审认可
近日,DeepSeek 团队的研究成果《DeepSeek R1》成功登上了国际顶尖学术期刊《Nature》的封面,成为首个通过权威同行评审的大语言模型。 这个里程碑式的成就,不仅标志着 DeepSeek 在 AI 领域的重要突破,也为未来的 AI 研究提供了新的方向。 《Nature》编辑部指出,在当前 AI 技术快速发展的背景下,许多技术声称缺乏透明度与可验证性。
AI芯片独角兽一年估值翻番!放话“三年超英伟达”,最新融资53亿超预期
谷歌TPU团队原班人马组建,英伟达挑战者、AI芯片初创企业Groq又获融资。 超出此前的6亿预期,此次融资高达7.5亿美元(约53亿人民币),Groq现估值69亿美元(约490亿人民币)。 一年的时间,估值就涨了一倍多。
找ChatGPT谈恋爱多是“日久生情”?!MIT&哈佛正经研究
终于有科学家对“AI伴侣”这事儿展开正经研究了! 以往这类消息多以趣闻轶事出现,be like:而现在,麻省理工和哈佛大学的研究人员通过分析Reddit子版块r/MyBoyfriendIsAI上的帖子,完整揭露了人们寻找“AI男友”的动机、具体相处过程等问题,并得出了一系列有趣发现:原来大部分人并非刻意寻找AI伴侣,而是“日久生情”;用户也会通过戒指和仪式与AI结婚;通用AI比专门的恋爱AI更受欢迎,很多人的“另一半”都是ChatGPT;最痛苦的莫过于模型突然更新;……下面详细来看——都在用AI伴侣干什么? 先说一下这个r/MyBoyfriendIsAI板块。
ChatGPT负责人深度复盘,爆4o复活内幕!过快下线是失误,将迭代模型人格
「还我GPT-4o! 」GPT-5发布后不到一周,在用户强大的反对声浪中,OpenAI不得不火速宣布GPT-4o等前代模型回归。 至此,大家才意识到:用户对4o等上一代模型,已经产生了深深的「依恋感」。
GPT-5攻入数学圈,证明定理快过博士生?网友热议AI新角色
9月初,一篇挂在arXiv的论文在学界扔下一颗炸弹——GPT-5被写进了数学研究成果里。 研究者在文中公开写道:GPT-5在他们的实验中完成了一项此前从未解决的数学工作,并将结果直接纳入正式稿件。 这是大型语言模型首次以「定理贡献者」的身份出现在数学研究论文中。
阿里王牌Agent横扫SOTA,全栈开源力压OpenAI!博士级难题一键搞定
阿里又双叒叕上大分了! 就在昨天,阿里旗下首个深度研究Agent模型——通义DeepResearch正式开源。 在多项权威基准上,通义DeepResearch狂飙SOTA,仅依靠30B参数(激活3B)就能大杀四方!
AI芯片独角兽一年估值翻番!放话“三年超英伟达”,最新融资53亿
不圆 发自 凹非寺. 量子位 | 公众号 QbitAI谷歌TPU团队原班人马组建,英伟达挑战者、AI芯片初创企业Groq又获融资。 超出此前的6亿预期,此次融资高达7.5亿美元(约53亿人民币),Groq现估值69亿美元(约490亿人民币)。
Invisible成功融资1亿美元,助力企业构建 AI 培训平台
位于旧金山的初创公司Invisible Technologies近日宣布完成一轮1亿美元的融资。 这一轮融资由新成立的投资公司 Vanara Capital 领投,其他参与投资的公司包括 Princeville Capital、HOF Capital、Acrew Capital、Greycroft 和 Deepwater Asset Management。 这轮融资使得Invisible Technologies的总融资额达到1.44亿美元,公司的估值也达到了20亿美元,成为2024年 Inc.5000中增长最快的 AI 公司之一。
让机器人「不只是走路」,Nav-R1引领带推理的导航新时代
在机器人与智能体领域,一个长期的挑战是:当你给机器人一个「去客厅把沙发上的书拿来」或者「沿着楼道走到门口,再右转」这一类指令时,机器人能不能不仅「看见环境」,还能「理解指令」、「规划路径」、然后「准确执行动作」? 之前的许多方法表面上看起来也能完成导航任务,但它们往往有这样的问题:推理(reasoning)的过程不够连贯、不够稳定;真实环境中路径规划与即时控制之间难以兼顾;在新的环境里泛化能力弱等。 Nav-R1 出场:什么是 Nav-R1?
通义DeepResearch震撼发布!性能比肩OpenAI,模型、框架、方案完全开源
通义 DeepResearch 重磅发布,让 AI 从 “能聊天” 跃迁到 “会做研究”。 在多项权威 Deep Research benchmark 上取得 SOTA,综合能力对标并跑赢海外旗舰模型,同时实现模型、框架、方案全面开源,把深度研究的生产力真正带到每个人手里。 相比于海外的旗舰模型昂贵和限制的调用,通义 DeepResearch 团队做到了完全开源!
AI编程助手告别免费!阿里20美元、亚马逊强制付费
周一早上,你习惯性地打开常用的AI编程助手,准备开始一天的码农生活。 结果弹出一个对话框:"您的免费额度已用完,请升级到Pro版本继续使用。 "这不是假设,而是正在发生的现实。
震撼!OpenAI在2025国际大学生程序设计竞赛拿下满分夺得第一,谷歌也取得金牌成绩
在阿塞拜疆巴库举行的 2025年国际大学生程序设计竞赛(ICPC)全球总决赛中上,来自 100 多个国家的 139 支大学队伍在五小时内角逐解决 12 个算法问题,最终圣彼得堡国立大学凭借解决 11 个算法问题夺得人类冠军。 在相同约束条件下的并行 AI 赛道上,谷歌的 Gemini 2.5 Deep Think 模型解决了 10 个问题,获得了与金牌相当的成绩。 最震撼的是OpenAI 的内部推理模型获得了 12 /12的满分,超越了所有人类队伍,拿下第一值得注意的是OpenAI和谷歌的模型都解决了所有人类参赛队伍都没有解决的问题c。
ICPC总决赛被AI统治!GPT-5组合系统12题全对登顶,人类打破头只能争夺第三
这届大学生太难了,好不容易拼进编程竞赛总决赛,还要被AI秀一脸。 在刚刚结束的2025年国际大学程序设计竞赛(ICPC)世界总决赛上,OpenAI的系统完美解决全部12道题目,若计入排名将位居第一。 谷歌的Gemini 2.5 Deep Think模型解决10道题目,达到金牌水准名列第二。
给模型狂堆参数的“大力出奇迹”真的失效了吗?剑桥说:AI的真正潜力才刚开始
在人们都认为疯狂砸钱,拼命地把大语言模型的参数规模往上堆的Scaling Law已经到头了的时候。 一篇叫《递减收益的错觉:衡量LLMs中的长时程执行能力》的论文又给大家来了一剂“强心针”。 这篇报告由剑桥大学、斯图加特大学人工智能研究所、马克斯普朗克智能系统研究所以及图宾根ELLIS研究所的大神们联手发布。
作为自媒体,我来聊聊使用AIGC的一些真实感受
大家好,我是小枣君。 今天这篇文章,我想和大家聊聊AIGC。 最近这几年,AIGC大模型浪潮的爆发,给整个社会带来了巨大的冲击。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉