AI在线 AI在线

理论

Transformer革新药物研发:TRACER框架实现反应感知的分子设计与合成优化

编辑 | 2049药物研发周期长、成本高是制药行业面临的重大挑战。 据统计,一个新药从研发到上市平均需要 12 年时间,投入高达 26 亿美元。 为提升研发效率,深度学习在分子生成领域取得了显著进展。
2/26/2025 3:52:00 PM
ScienceAI

DeepSeek R2要提前发布!这是有关R2的几个传闻:100%国产算力部署!能耗降低25%,多模态模型!

DeepSeek 今天有两个大新闻:一个是开源了自家用于助力V3/R1模型训练与推理的一个FP8通用矩阵乘法 (GEMM) 加速库,这一块相信不少业内人士会感兴趣,据悉性能高达1350 TFLOPS,进一步揭秘了为什么现在的DeepSeek可以吐字这么流畅,训练和计算成本为什么如此低廉。 不过更为让人震惊的,相信还是第二个:DeepSeek原定于要5月初发布的DeepSeek R2,现在正在争取提前甚至尽可能早的发布! 这一提前发布R2的消息,是路透社当地时间周二发布的,路透社跟三位知情人士了解到:DeepSeek原本计划在5月初发布R2,但现在希望尽早发布,但没有提供具体细节。
2/26/2025 2:51:00 PM

研究:英国高校逾九成本科生借助 AI 完成作业

2 月 26 日消息,据英国《卫报》今日报道,一项针对 1000 名学生的调查显示,在过去 12 . 个月里,生成式人工智能的使用呈现“爆炸性增长”。 在 2025 年的调查中,接近九成(88%)的学生表示,他们会在评估中使用像 ChatGPT .
2/26/2025 2:24:43 PM
清源

Toolformer揭秘:大语言模型如何自学成才,掌握工具使用!

大语言模型(LLMs)在处理自然语言处理任务时展现出了令人印象深刻的零样本和少样本学习能力,但它们在一些基础功能上表现不佳,例如算术运算或事实查找。 这些局限性包括无法访问最新事件的信息、倾向于虚构事实、难以理解低资源语言、缺乏进行精确计算的数学技能,以及对时间进展的不敏感。 为了克服这些限制,一个简单的方法是让语言模型能够使用外部工具,如搜索引擎、计算器或日历。
2/26/2025 2:22:18 PM
Glodma

大模型「记忆断片」成历史!AI初创全新Zep系统,知识图谱破解上下文诅咒

无论是ChatGPT还是Deepseek,随着大模型性能的提升,其能够处理的上下文也越来越长。 但是,一旦超出上下文窗口的限制,大模型就需要重新开一个对话,如同「失忆」一般忘记之前交流的内容。 然而,站在用户的角度,智能体应该能够记住之前的所有对话,因此如何有效地管理和利用对话历史,就成为了提升AI智能体用户体验的关键。
2/26/2025 2:15:00 PM
新智元

AI重塑硅谷创业法则:“融资-扩员-烧钱”成为过去式

过去,硅谷创业公司的发展路径遵循着一套固定的模式:先融资,然后大规模招募员工,通过快速扩张实现增长。 然而,随着AI浪潮的汹涌来袭,这一传统模式正在被彻底颠覆。 AI工具的广泛应用大幅提升了员工生产力,即使是规模极小的团队,也有可能凭借技术优势实现巨大成功。
2/26/2025 2:05:22 PM
小刀

谷歌发布最强「科研辅助神器」!能帮你提新idea,三大真实场景实证

在科学探索的过程中,研究人员需要对以往发表的文献进行观察总结,提出一些新颖、可行的研究方向,最后通过全面的实验进行idea验证。 科研人员需要对探索的宽度和深度进行平衡,由于精力有限,不能探索过多的研究方向,同时还要保证对目标主题的研究深度。 最近,谷歌、斯坦福大学等机构的研究人员开发了一个多智能体、基于Gemini 2.0的AI协同科研(AI co-scientist)系统,具备跨复杂主题的综合能力和进行长期规划、推理的能力,除了传统的文献综述、总结功能之外,还可以辅助科研人员提出新的、原创知识,或是基于先前的成果制定研究假设(hypotheses)和计划(proposal)。
2/26/2025 1:50:00 PM
新智元

DeepSeek会说话了!只要2行代码,这家公司让任意大模型秒开口

就在最近,生成式AI行业,诞生了一个新赛道——所有文本模型,可以立刻秒变多模态了! 如今的大模型混战局势,情况已经很明显,去一味卷大模型供应商,投入产出比已经不高。 此时,这个产品的另辟蹊径,就格外显得独树一帜——他们要做的,是让任意大模型开口说话,甚至是DeepSeek!
2/26/2025 1:45:00 PM
新智元

CIO的生存之道:企业中AI早期采用者的经验教训

在AI浪潮席卷企业的今天,CIO如何从“被动求生”转向“主动破局”?全球顶尖CIO Tim Crawford与Isaac Sacolick指出了AI落地的核心矛盾:从战略对齐到数据治理,从企业变革到风险博弈。 这两位CIO不仅揭示了早期AI先行者的血泪教训,更给出了摆脱“试点困境”、重构商业价值的硬核路径。 要点概述:战略整合:CIO如何将AI举措与核心业务目标相结合,以推动业务增长和增强竞争优势。
2/26/2025 1:39:03 PM
Michael Krigsman

何恺明ResNet级神作,分形生成模型计算效率狂飙4000倍!清华校友一作

图像生成建模全新范式来了。 你是否曾凝视过雪花的精致对称,或惊叹于树枝的无穷分支? 这些都是大自然中的「分形」。
2/26/2025 1:23:08 PM
新智元

全自动驾驶真的来了!花6万4才能用!马斯克急忙上线阉割版!AI提醒驾驶员别走神,网友实测翻车:秒变移动路障;李想:在实战中分高下

出品 | 51CTO技术栈(微信号:blog51cto)千呼万唤,特斯拉FSD真的来了! 特斯拉已开始在中国向车主分批次推送FSD的软件更新了,版本号2024.45.32.12,与北美版一致。 不过,马斯克急急慌慌入华的FSD,槽点好像真的有点多。
2/26/2025 1:18:37 PM

多模态大模型对齐新范式,10个评估维度全面提升,快手&中科院&南大打破瓶颈

尽管多模态大语言模型(MLLMs)取得了显著的进展,但现有的先进模型仍然缺乏与人类偏好的充分对齐。 这一差距的存在主要是因为现有的对齐研究多集中于某些特定领域(例如减少幻觉问题),是否与人类偏好对齐可以全面提升MLLM的各种能力仍是一个未知数。 快手,中科院,南大合作从三个层面入手推动MLLM alignment的发展,包括数据集,奖励模型以及训练算法,最终的alignment pipeline使得不同基础模型在10个评估维度,27个benchmark上都取得了一致的性能增益,比较突出的是,基于本文提出的数据集和对齐算法对LLaVA-ov-7B模型进行微调后, conversational能力平均提升了19.5%,安全性平均提升了60%。
2/26/2025 1:00:00 PM
量子位

前端程序员请注意!首个截图就能生成现代前端代码的AI来了 | 已开源

现在截图生成代码,已经来到了一个新高度——⾸个⾯向现代前端代码⽣成的多模态⼤模型解决⽅案,来了! 而且是开源的那种。 (注:现代前端代码开发具有组件化、状态管理和数据驱动渲染、开发规范严格以及动态交互性强等特点。
2/26/2025 12:30:00 PM
量子位

利用RAG整合代码私有仓库实现私有化代码提示的流程

RAG流程RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合信息检索与生成模型的技术,旨在通过外部知识库增强生成内容的准确性和相关性。 1. 数据预处理与索引构建(离线阶段)目标:构建可供检索的知识库。
2/26/2025 12:21:08 PM
demo123567

解锁AI机器人新时代:LeRobot如何让未来触手可及?

想象一下,一个普通人也能轻松打造属于自己的智能机器人,像玩乐高一样简单有趣? 这不是科幻电影的场景,而是Hugging Face最新开源项目LeRobot带来的现实革命。 作为AI领域的先锋,Hugging Face继Transformers席卷自然语言处理(NLP)领域后,又将目光投向了机器人技术,推出了LeRobot——一个旨在让AI机器人开发变得更普惠、更高效的开源平台。
2/26/2025 11:11:14 AM
未智翼

手把手演示 IDEA 如何接入 DeepSeek,你学会了吗?

本文介绍如何在 IntelliJ IDEA 中集成 DeepSeek , 并展示如何利用它来提升开发效率 。 1.安装 CodeGPT 插件图片在插件市场里,搜索 CodeGPT ,安装即可。 假如网络安装慢,可以从插件下载地址,直接下载。
2/26/2025 10:31:35 AM
勇哥

DeepSeek-R2曝5月前上线!第三弹DeepGEMM 300行代码暴击专家优化内核

第三天,DeepSeek发布了DeepGEMM。 这是一个支持稠密和MoE模型的FP8 GEMM(通用矩阵乘法)计算库,可为V3/R1的训练和推理提供强大支持。 仅用300行代码,DeepGEMM开源库就能超越专家精心调优的矩阵计算内核,为AI训练和推理带来史诗级的性能提升!
2/26/2025 10:24:51 AM

港理工OccProphet:纯视觉Occ SOTA!速度提升至2.6倍,内存占用减少60%

本文分享一篇由香港理工大学最近公开的发表于ICLR2025的论文『OccProphet: Pushing Efficiency Frontier of Camera-Only 4D Occupancy Forecasting with Observer-Forecaster-Refiner Framework』。 作者在文中提出了一个轻量级的观察器-预报器-细化器框架OccProphet来实现高效的未来4D占用预测。 OccProphet在nuScenes、 Lyft-Level5和nuScenes-Occupancy等多个数据集上取得最先进的4D占用预测性能,成本减少近80%!
2/26/2025 10:24:47 AM
Junliang Chen等