AI在线 AI在线

理论

从人才流失到智慧回流:AlphaFold 试图重塑非洲科研DNA

编辑丨toileter2024 年,诺贝尔化学奖再次强调了结构生物学在现代科学中的变革性作用。 它表彰了 David Baker 对蛋白质设计和 AlphaFold 开发的贡献。 AlphaFold 是一种最先进的 AI 工具,用于根据初级氨基酸序列预测蛋白质的 3D 结构。
2/10/2025 2:39:00 PM
ScienceAI

奥特曼最新AGI断言:人工智能的成本每 12 个月下降约 10 倍,但推动AI能力边界的成本不会变便宜

出品 | 51CTO技术栈(微信号:blog51cto)本周巴黎人工智能行动峰会之前,许多科技界知名人士都提前亮出了他们对人工智能未来的愿景。 OpenAI 首席执行官 Sam Altman 也不例外, 今天更新了个人博客,提出了一些新概念或者新提法:比如“计算预算”( compute budget),再比如“2035 年,任何人都应该能够调动与 2025 年所有人的智能总和”。 “技术进步的历史影响表明,我们关心的大多数指标(健康结果、经济繁荣等)在平均水平和长期来看都会有所改善,但促进平等似乎并非由技术决定,要做到这一点可能需要新的想法,”Altman写道。
2/10/2025 2:05:39 PM

推理时也能做偏好优化,无需额外重训练,来自上海AI Lab港中文等

随着大语⾔模型(LLMs)在各类任务中展现出令人瞩目的能力,如何确保它们⽣成的回复既符合预期又安全,始终是⼀项关键挑战。 传统的偏好对⻬⽅法,如基于⼈类反馈的强化学习(RLHF)和直接偏好优化(DPO),依赖于训练过程中的模型参数更新,但在⾯对不断变化的数据和需求时,缺乏⾜够的灵活性来适应这些变化。 为了突破这⼀瓶颈,上海人工智能实验室、香港中文大学等联合提出了推理时偏好优化(TPO)方法,通过在推理阶段与奖励模型交互,借助可解释的文本反馈,迭代优化模型输出,实现了即时的模型对⻬,⽽⽆需重新训练。
2/10/2025 2:05:00 PM
量子位

如何优化测试时计算?解决「元强化学习」问题

优化大模型的测试时计算是提升模型部署效率和节省计算资源的关键一环。 前段时间,黄仁勋在 CES 2025 的演讲中把测试时 Scaling 形容为大模型发展的三条曲线之一。 如何优化测试时计算成为业界关注的重要课题。
2/10/2025 1:50:00 PM
机器之心

Nature:离 “量子互联网” 又近一步!牛津大学证实分布式量子计算可行性

量子通信技术又迎来了新进展! 牛津大学研究人员在Nature上发表的最新研究,在两米的距离上实现了确定性的量子门传送,保真度达86%。 研究人员表示,这项研究给各种物理平台的大规模量子计算提供了可行的途径,并为量子互联网打下了基础。
2/10/2025 1:40:00 PM
量子位

DeepSeek上线国家超算平台!671B满血版,三大运营商接入,平头哥芯片适配

DeepSeek的含金量还在上升,一个半个周末过去发生这些大事:国家超算互联网平台上线DeepSeek-R1,最高支持671B的满血版。 平头哥玄铁芯片成功适配DeepSeek-R1系列蒸馏模型,在RISC-V架构CPU和端侧平台打开新的应用空间。 再加上春节期间的三大运营商全面接入DeepSeek等消息,它的影响力已不仅限于AI和互联网,正在往产业更深层进发。
2/10/2025 1:35:00 PM
量子位

AI意识更进一步!谷歌DeepMind等:LLM不仅能感受痛苦,还能趋利避害

在科幻电影《机械姬》中,女主角是一款能够感受痛苦的机器人;然而LLM为代表的AI能否感知痛苦和快乐,一直是存在争议。 一些科学家认为,大模型缺乏相应的生理结构和神经系统,因此无法体验情感。 而另一些人则认为,大模型能够生成关于痛苦和快乐的详细描述,并且能够在选择情境中权衡痛苦和快乐,这表明它们可能具有某种程度的情感体验。
2/10/2025 1:30:00 PM
新智元

人大刘勇团队「慢思考」机理分析:从雪球误差到正确推理概率

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2/10/2025 1:15:00 PM
机器之心

Meta新视频生成框架拿捏倒立杂技,双人舞也能完美同步!运动一致性暴增近20%,可无缝集成DiT模型

针对视频生成中的运动一致性难题,Meta GenAI团队提出了一个全新框架VideoJAM。 VideoJAM基于主流的DiT路线,但和Sora等纯DiT模型相比,动态效果直接拉满:哪怕变化又大又迅速、动作又复杂的舞蹈,也看起来像真的一样,而且还是两个人同步:像倒立这样的操作,同样可以轻松驾驭:而且不需要额外数据或缩放,就能无缝集成到不同规模的DiT模型当中,带来运动效果的提升。 有网友表示,第一眼看上去就和真的一样,也许到今年年底,我们看不到区别了。
2/10/2025 1:15:00 PM
量子位

LLM实现自回归搜索!MIT哈佛等提出「行动思维链」COAT,推理能力大提升

OpenAI o1发布后,为提升LLM的推理能力,研究者尝试了多种方法。 比如用强大的教师模型进行知识蒸馏、采用蒙特卡洛树搜索(MCTS),以及基于奖励模型的引导搜索。 近日,来自MIT、新加坡科技设计大学、哈佛大学等机构的华人研究者探索了全新的方向:让LLM拥有自回归搜索能力。
2/10/2025 1:00:00 PM
新智元

诺奖得主DeepMind CEO放话:DeepSeek是中国最好AI模型,但没任何科学进步

就在今天,谷歌DeepMind的首席执行官Demis Hassabis对DeepSeek进行了一番「捧杀」——「它可能是中国最好的工作,但没有展示任何新的科学进展。 」Hassabis首先称DeepSeek的模型是「一项令人印象深刻的工作」,然后便一改口风说道:「从技术角度来看,这并不是一个重大变革」,同时还特别强调「炒作有点夸大了」。 「尽管炒作很多,但实际上并没有新的科学突破,它使用的都是已知的AI技术。
2/10/2025 12:30:00 PM
新智元

马克龙豪掷1090亿开欧洲「星际之门」,Mistral狂飙登顶法国APP榜首!

就在刚刚,Le Chat登顶法国免费APP榜首! 在效率榜中,ChatGPT屈居第二,DeepSeek仅排第三在美国效率榜排名35(ChatGPT第一,DeepSeek第二)欧洲开发者们一片欢腾:恭喜Mistral AI,让欧洲的AI竞赛中终于(在欧洲)有了一席之地。 之前,不管是OpenAI还是DeepSeek,都光芒太盛。
2/10/2025 12:00:25 PM
新智元

使用 DeepSeek R1 和 Ollama 搭建一个 RAG 系统(包含完整代码)

你有没有想过,能不能像跟人聊天一样,直接问 PDF 文件或技术手册问题? 比如你有一本很厚的说明书,不想一页页翻,只想问它:“这个功能怎么用? ”或者“这个参数是什么意思?
2/10/2025 11:27:37 AM
wayn

DeepSeek本地部署教程,小白也能搞定!

安装环境操作系统:Windows 10及以上准备工具:轻量级AI模型调用工具Ollama,调用AI模型为deepseek-r1AI 模型管理工具Cherry-Studio或AnythingLLM(二选一)资源链接:复制安装步骤第一步、下载安装Ollama并修改环境变量要运行大模型,首先需要一个好用的工具,推荐使用 Ollama ,它是一个轻量级的工具,支持快速安装和运行大语言模型(如deepseek、Llama、Qwen 等)。 ollama下载地址 :官网链接(文章开头)选择合适的操作系统下载,默认安装完成即可。 这里注意,ollama安装完成后先不要启用,因为它默认是会将模型下载到C盘的,deepseek、Qwen等模型最小也有好几个GB会占用C盘空间,所以需要先设置ollama的环境变量。
2/10/2025 11:11:47 AM
小云君网络

ICLR 2025 | Diffusion Planner: 基于扩散模型的自动驾驶规划算法,nuPlan SOTA!

本文介绍了清华大学联合毫末智行、自动化所、港中文、上海交大、上海人工智能实验室的发表于ICLR 2025的最新研究成果《Diffusion-based Planning for Autonomous Driving with Flexible Guidance》。 该算法创新性地设计了基于 Diffusion Transformer 的自动驾驶规划模型架构,高效处理复杂场景输入,并联合建模周车运动预测与自车规划中的多模态驾驶行为,充分发挥扩散模型在闭环规划中的潜力,解决了现有基于学习的规划方法对后处理的严重依赖问题。 此外,借助扩散模型的引导机制,模型在部署阶段能够灵活适应不同的驾驶需求,提高泛化能力与实用性。
2/10/2025 11:01:00 AM
新闻助手

Deepseek4j再更新:Java应用一行代码集成DeepSeek

deepseek4j 是什么deepseek4j() 是一个专为 Java 开发者打造的 DeepSeek 模型集成框架。 通过优雅的 API 设计,只需一行代码,即可实现接入 DeepSeek,并获得以下核心能力:完整思维链保留:完美保留 DeepSeek 模型的推理过程,让 AI 的思考过程可追溯流式输出体验:基于 Reactor 实现的流式响应,带来类 ChatGPT 的打字机效果复制使用 deepseek4j,您可以专注于业务逻辑开发,而无需关心底层细节。 一、v1.3 更新内容1.1 联网搜索支持1739118403新版本最重要的更新是引入了联网搜索能力,这一功能带来三个关键优势:突破时间边界:模型不再受限于预训练数据的时间范围,可以获取和处理最新信息实时信息获取:通过高质量信息源获取实时资讯,提供更精准的问答服务差异化竞争:在大模型同质化严重的当下,联网搜索成为关键的差异化竞争点复制1.2 智能系统提示词1739118117系统提示词(System Prompt)是基于模型开发的应用程序内置的指令,让决定了模型在特定上下文中的表现方式、回答风格和功能范围。
2/10/2025 10:49:51 AM
冷冷

关于自动驾驶,尤其是端到端自动驾驶:到底有哪些可能的量产技术路线?

0.1 什么是端到端? 首先定义端到端,当然有很多说法。 我觉得,起码说相对于分阶段而言,规划不只是根据感知和预测的结果,而是其隐特征。
2/10/2025 10:35:00 AM
南木

如何应对生成式人工智能给出的无穷无尽的正确答案

生成式人工智能 (GenAI) 似乎承诺带来前所未有的创新和自动化机会……然而,许多领导者难以清楚地表达 GenAI在组织层面提供的实际、有形价值。 那么,这种明显的 GenAI 价值差距背后是什么? 我们能做些什么来解决这个问题?
2/10/2025 10:24:36 AM
晓晓