理论
检索增强生成(RAG)过时了,缓存增强生成(CAG)上位
译者 | 布加迪审校 | 重楼检索增强生成(RAG)已成为为定制信息定制大语言模型(LLM)的事实上的方法。 然而RAG带来了前期技术成本,并且速度可能很慢。 由于长上下文LLM方面取得的进步,企业可以通过在提示中插入所有的专有信息来绕过RAG。
2/11/2025 8:00:00 AM
布加迪
DeepSeek 颠覆 Excel?这次 AI 真的要革新办公了!
2025年的开端,技术圈再次被DeepSeek引爆。 DeepSeek凭借极低的训练成本,实现了与ChatGPT相媲美的性能,对全球科技界带来了极大的冲击。 不少开发者对DeepSeek的实际应用产生了浓厚兴趣,纷纷询问如何快速上手。
2/11/2025 7:44:09 AM
编程疏影
不用DeepSeek,10s一键生成精美PPT?!(附详细教程)
最近DeepSeek强势出圈,今天偶然打开Kimi看了下,左侧突然多了个黄色的小按钮,鼠标移动上去,发现是PPT助手。 图片在当今,无论工作和学习,PPT 制作无疑是一项频繁且重要的任务。 无论是职场汇报、学术演讲还是日常教学,一份高质量的 PPT 都能帮助我们更好地传达信息、展示成果。
2/11/2025 7:42:50 AM
码易有道
网友用DeepSeek做人类从未见过的菜,引400多万吃瓜群众围观
AI好好用报道编辑:杨文AI食神做的「锦绣多味鱼」,要顶替掉西湖醋鱼。 前几天,「用 AI 做一道人类从未出现过的菜」登上抖音热榜,竟吸引 442.8 万吃瓜群众围观。 光看该词条,就知道这指定是哪个聪明绝顶的网友在搞抽象。
2/10/2025 3:27:00 PM
AI好好用
PNAS顶刊 | 抗体中和活性提升1000倍,百奥几何生成式AI高效反击病毒新变种
编辑丨Science AI近日,百奥几何(BioGeometry)携手上海交通大学药学院朱建伟团队,基于生成式 AI 驱动的抗体优化策略,在短时间内精准优化 8G3 抗体,实现其对最新病毒变异株 JN.1 的中和活性 1000-1500 倍的跃升。 相关研究成果已正式发表在国际顶级期刊《美国国家科学院院刊》(PNAS)上【1】,继 CR3022 抗体、肿瘤抗原 5T4 纳米抗体【2】等多个优化案例后,再次证明了生成式 AI 驱动抗体工程的广泛适用性和变革潜力。 论文地址: AI 抗体工程:精准优化 8G3 抗体,中和活性提升 1000-1500 倍由于病毒基因组的快速进化和新变种的不断产生增加了治疗的复杂性,大多数早期开发的抗体已无法精准识别并有效结合目标,导致中和能力大幅下降。
2/10/2025 2:53:00 PM
ScienceAI
DeepSeek火遍中国汽车圈!吉利、东风最激进,李斌何小鹏打气,上汽官宣打造全球首个DS实装量产汽车品牌!网友:服务器架不住了
出品 | 51CTO技术栈(微信号:blog51cto)继各大腾讯、阿里等各大AI Infra厂商火速接入DeepSeek后,这款“国民AI”的热度已经席卷到了汽车圈。 图片首先是吉利,主打的是语音主动交互场景。 2月6日,吉利汽车宣布其自研的星睿大模型与DeepSeek-R1深度融合,具体来讲就是利用DeepSeek-R1模型对星睿车控FunctionCall大模型、汽车主动交互端侧大模型等进行蒸馏训练。
2/10/2025 2:41:32 PM
从人才流失到智慧回流:AlphaFold 试图重塑非洲科研DNA
编辑丨toileter2024 年,诺贝尔化学奖再次强调了结构生物学在现代科学中的变革性作用。 它表彰了 David Baker 对蛋白质设计和 AlphaFold 开发的贡献。 AlphaFold 是一种最先进的 AI 工具,用于根据初级氨基酸序列预测蛋白质的 3D 结构。
2/10/2025 2:39:00 PM
ScienceAI
奥特曼最新AGI断言:人工智能的成本每 12 个月下降约 10 倍,但推动AI能力边界的成本不会变便宜
出品 | 51CTO技术栈(微信号:blog51cto)本周巴黎人工智能行动峰会之前,许多科技界知名人士都提前亮出了他们对人工智能未来的愿景。 OpenAI 首席执行官 Sam Altman 也不例外, 今天更新了个人博客,提出了一些新概念或者新提法:比如“计算预算”( compute budget),再比如“2035 年,任何人都应该能够调动与 2025 年所有人的智能总和”。 “技术进步的历史影响表明,我们关心的大多数指标(健康结果、经济繁荣等)在平均水平和长期来看都会有所改善,但促进平等似乎并非由技术决定,要做到这一点可能需要新的想法,”Altman写道。
2/10/2025 2:05:39 PM
推理时也能做偏好优化,无需额外重训练,来自上海AI Lab港中文等
随着大语⾔模型(LLMs)在各类任务中展现出令人瞩目的能力,如何确保它们⽣成的回复既符合预期又安全,始终是⼀项关键挑战。 传统的偏好对⻬⽅法,如基于⼈类反馈的强化学习(RLHF)和直接偏好优化(DPO),依赖于训练过程中的模型参数更新,但在⾯对不断变化的数据和需求时,缺乏⾜够的灵活性来适应这些变化。 为了突破这⼀瓶颈,上海人工智能实验室、香港中文大学等联合提出了推理时偏好优化(TPO)方法,通过在推理阶段与奖励模型交互,借助可解释的文本反馈,迭代优化模型输出,实现了即时的模型对⻬,⽽⽆需重新训练。
2/10/2025 2:05:00 PM
量子位
如何优化测试时计算?解决「元强化学习」问题
优化大模型的测试时计算是提升模型部署效率和节省计算资源的关键一环。 前段时间,黄仁勋在 CES 2025 的演讲中把测试时 Scaling 形容为大模型发展的三条曲线之一。 如何优化测试时计算成为业界关注的重要课题。
2/10/2025 1:50:00 PM
机器之心
Nature:离 “量子互联网” 又近一步!牛津大学证实分布式量子计算可行性
量子通信技术又迎来了新进展! 牛津大学研究人员在Nature上发表的最新研究,在两米的距离上实现了确定性的量子门传送,保真度达86%。 研究人员表示,这项研究给各种物理平台的大规模量子计算提供了可行的途径,并为量子互联网打下了基础。
2/10/2025 1:40:00 PM
量子位
DeepSeek上线国家超算平台!671B满血版,三大运营商接入,平头哥芯片适配
DeepSeek的含金量还在上升,一个半个周末过去发生这些大事:国家超算互联网平台上线DeepSeek-R1,最高支持671B的满血版。 平头哥玄铁芯片成功适配DeepSeek-R1系列蒸馏模型,在RISC-V架构CPU和端侧平台打开新的应用空间。 再加上春节期间的三大运营商全面接入DeepSeek等消息,它的影响力已不仅限于AI和互联网,正在往产业更深层进发。
2/10/2025 1:35:00 PM
量子位
AI意识更进一步!谷歌DeepMind等:LLM不仅能感受痛苦,还能趋利避害
在科幻电影《机械姬》中,女主角是一款能够感受痛苦的机器人;然而LLM为代表的AI能否感知痛苦和快乐,一直是存在争议。 一些科学家认为,大模型缺乏相应的生理结构和神经系统,因此无法体验情感。 而另一些人则认为,大模型能够生成关于痛苦和快乐的详细描述,并且能够在选择情境中权衡痛苦和快乐,这表明它们可能具有某种程度的情感体验。
2/10/2025 1:30:00 PM
新智元
人大刘勇团队「慢思考」机理分析:从雪球误差到正确推理概率
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2/10/2025 1:15:00 PM
机器之心
Meta新视频生成框架拿捏倒立杂技,双人舞也能完美同步!运动一致性暴增近20%,可无缝集成DiT模型
针对视频生成中的运动一致性难题,Meta GenAI团队提出了一个全新框架VideoJAM。 VideoJAM基于主流的DiT路线,但和Sora等纯DiT模型相比,动态效果直接拉满:哪怕变化又大又迅速、动作又复杂的舞蹈,也看起来像真的一样,而且还是两个人同步:像倒立这样的操作,同样可以轻松驾驭:而且不需要额外数据或缩放,就能无缝集成到不同规模的DiT模型当中,带来运动效果的提升。 有网友表示,第一眼看上去就和真的一样,也许到今年年底,我们看不到区别了。
2/10/2025 1:15:00 PM
量子位
LLM实现自回归搜索!MIT哈佛等提出「行动思维链」COAT,推理能力大提升
OpenAI o1发布后,为提升LLM的推理能力,研究者尝试了多种方法。 比如用强大的教师模型进行知识蒸馏、采用蒙特卡洛树搜索(MCTS),以及基于奖励模型的引导搜索。 近日,来自MIT、新加坡科技设计大学、哈佛大学等机构的华人研究者探索了全新的方向:让LLM拥有自回归搜索能力。
2/10/2025 1:00:00 PM
新智元
诺奖得主DeepMind CEO放话:DeepSeek是中国最好AI模型,但没任何科学进步
就在今天,谷歌DeepMind的首席执行官Demis Hassabis对DeepSeek进行了一番「捧杀」——「它可能是中国最好的工作,但没有展示任何新的科学进展。 」Hassabis首先称DeepSeek的模型是「一项令人印象深刻的工作」,然后便一改口风说道:「从技术角度来看,这并不是一个重大变革」,同时还特别强调「炒作有点夸大了」。 「尽管炒作很多,但实际上并没有新的科学突破,它使用的都是已知的AI技术。
2/10/2025 12:30:00 PM
新智元
马克龙豪掷1090亿开欧洲「星际之门」,Mistral狂飙登顶法国APP榜首!
就在刚刚,Le Chat登顶法国免费APP榜首! 在效率榜中,ChatGPT屈居第二,DeepSeek仅排第三在美国效率榜排名35(ChatGPT第一,DeepSeek第二)欧洲开发者们一片欢腾:恭喜Mistral AI,让欧洲的AI竞赛中终于(在欧洲)有了一席之地。 之前,不管是OpenAI还是DeepSeek,都光芒太盛。
2/10/2025 12:00:25 PM
新智元
资讯热榜
李沐B站更新了!教你手搓语音大模型,代码全开源还能在线试玩
考试提分新工具:网页版 ChatGPT 测试“学习和掌握”功能,AI 助你成学霸
AI时代设计师如何突围?D20峰会揭示未来设计师生存法则
一盘大棋!OpenAI「截胡」IMO金牌,奥特曼为GPT-5献上「核弹级」预热
终结Coding?ShellAgent三句话造出马斯克同款「AI女友」!
DeepRare 重磅发布:全球首个可循证智能体诊断系统,直击医学Last Exam难题
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
“思维链”窗口正在关闭!OpenAI、谷歌、Anthropic联合研究:我们正在失去理解 AI 的能力
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
Anthropic
英伟达
代码
智能体
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
苹果
LLM
神经网络
AI新词
Claude
3D
研究
生成
机器学习
AI for Science
xAI
计算
人形机器人
Sora
AI视频
Agent
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
RAG
预测
大型语言模型
深度学习
伟达
Transformer
具身智能
视觉
神器推荐
亚马逊
视频生成
AGI
Copilot
DeepMind
模态
架构
LLaMA