基础
统一结构与上下文信息的计算平台,德国慕尼黑大学等提出端到端的单细胞扰动分析框架
编辑丨&随着单细胞技术的发展,研究者可以在数以万计的细胞中同时测量多个基因或分子标记,并且通过遗传、化学或环境干扰(perturbation)引入实验变量,深入理解细胞反应机制。 这种类型的数据不仅体量巨大,而且结构复杂,不同实验条件、不同细胞类型和干扰策略之间的差异,使得传统的分析工具难以有效覆盖整体流程。 现有方法大多只针对单个任务,或者专注于某种类型的环境干扰,而缺乏一个能够统一管理、分析和解释各种单细胞扰动实验的平台。
招生 | 港科大(广州)数据科学与分析学域2026-27博士项目申请开放!
深势科技斩获超8亿元融资:AI for Science为何成为资本与产业的共同选择
近日,AI for Science(人工智能驱动的科学研究)领域的标杆企业深势科技宣布完成总额超 8 亿元人民币的 C 轮融资。 这份出资方名单颇具份量:达晨财智、京国瑞基金、北京市人工智能产业投资基金、北京市医药健康产业投资基金、联想创投、元禾璞华等机构共同押注。 这并非简单的资金输送,而是一次凝结了国有资本意志、产业资本眼光与财务资本信心的战略合围。
只需150k数据,多图融合效果超越Qwen-2509,至多支持10图输入!
背景随着图像生成模型的迅速发展,越来越多的condition被加入到生成过程中,开源模型和闭源模型的差距也不断缩小。 然而有一种condition却是最难也最综合的:直接输入多张图像,让模型同时整合来自多张图像的语义信息。 例如结合人物、场景、物体等多种视觉输入,生成ID一致性好又语义丰富的合成结果。
SIGMOD2026:多模态遇上RAG,为何搜起来“很准”,模型回答却很差?
将多模态数据纳入到RAG,甚至Agent框架,是目前LLM应用领域最火热的主题之一,针对多模态数据最自然的召回方式,便是向量检索。 然而,我们正在依赖的这一整套 embedding → 向量检索 → 下游任务 的流程,其实存在一个未被正确认知到的陷阱。 很多人认为向量检索方法已经被标准化了,用到向量检索算法就无脑上HNSW。
自适应AI决策接口,协助自主实验室在材料性能上实现150%提升,与研究者共同主导实验的人机协作模式
编辑丨%自动驾驶或自动设计已经成为 AI 引导技术发展中一道显眼的标签。 在这过程中,AI 负责引导整个发现过程,帮助设计实验与完善决策策略。 这种由 AI 实时分析数据并提示研究者何时调整策略的「人机协作实验室」逐渐流行起来。
相机运动误差降低40%!DualCamCtrl:给视频生成装上「深度相机」,让运镜更「听话」
本研究的共同第一作者是来自于香港科技大学(广州)EnVision Research 的张鸿飞(研究助理)和陈康豪(博士研究生),两位研究者均师从陈颖聪教授。 你的生成模型真的「懂几何」吗? 还是只是在假装对齐相机轨迹?
首创ACE具身研发范式,大晓机器人构建具身智能开放新生态
中国上海,12 月 18 日 —— 大晓机器人正式发布行业首创的 ACE 具身研发范式、首个开源且商业应用的开悟世界模型 3.0(Kairos 3.0)、让具身本体拥有自主空间智能的具身超级大脑模组 A1,与行业伙伴共同构建全链自主可控、开放共赢的产业级生态体系。 大晓机器人源于 “大千世界,晓识万象”,“大千世界” 是广阔、复杂、多样、充满细节的;“晓识万象” 是在浩瀚世界中知晓、洞察规律。 让机器人真正洞察并理解万象规律,才能使其学会与世界精准交互。
OpenAI推出“AI工具链”,让湿实验室生物研究更快更智能
编辑丨%加速科学进步是 AI 最宝贵的价值之一。 借助 GPR-5,已经可以看到这一趋势的早期现象——其帮助科研人员更快地浏览科学文献,还支持新的科学推理形式。 例如揭示意外的联系、提出证明策略或建议合理的机制,供专家评估和测试。
欢迎申请、提名和转发!第二届Wiley新锐科学家奖开放申请
青年科学家在科技创新与推动知识边界不断拓展的工作中发挥着先锋作用。 他们以创新的火炬照亮知识的暗角,不断拓展人类认知的边界。 为了更好地推动与支持中国青年科研人才发展,并为他们的科研事业注入动力,Wiley于2024年创立了“新锐科学家奖”。
OpenAI发布专家级科学能力评估基准FrontierScience,Gemini 3 Pro与GPT‑5.2表现相当
编辑丨coisini推理能力是科学工作的核心。 科学家不仅需要记忆事实,更要提出假设、验证修正,并在跨领域间融合思想。 随着人工智能(AI)模型的能力不断增强,核心问题在于它们如何通过深度推理推动科学研究。
EMNLP 2025 | 视频理解Token压缩新范式,减少70.8%推理延迟!
在大语言模型的浪潮中,视频大语言模型(VideoLLMs)正以惊人的速度进化,生成的响应越来越精细。 然而,“慢”与计算量大依然是制约其大规模应用的最大痛点。 视频序列中海量视觉token导致的二次方复杂度,让处理一个长视频往往需要漫长的等待,尤其在高分辨率或长序列场景下。
AI 驱动的科学系统分析框架:SciSciGPT 打开科学研究的新工作方式
编辑丨%在科学研究过程中,学者经常会面临许多问题:该领域在过去几年内的突破有哪些? 哪些团队领跑? 关键方法的演变脉络如何?
大模型的第一性原理:(一)统计物理篇
白铂 博士,华为 2012 实验室理论研究部主任 信息论首席科学家2022 年底,ChatGPT 横空出世,其能力震惊了整个世界。 2024 年底,DeepSeek 以极低的训练成本和极高的性能再次震惊了世界。 短短几年间,大模型疯狂迭代,能力不断提升,仅在美国,AI 领域的投资规模便超过了许多国家全年的 GDP!
被拒≠失败!这些高影响力论文都被顶会拒收过
近日,Waymo 发布了一篇深度博客,详细介绍了该公司的 AI 战略以及以 Waymo 基础模型为核心的整体 AI 方法。 谷歌首席科学家 Jeff Dean X 也分享了这篇博客,并重点介绍了 Waymo 占用的补充方法,他写到:「就像我们使用增量从更大规模的专业模型中创建高质量、计算效率极高的 Gemini Flash 模型一样,Waymo 也类似地使用了补充,来基于更大的模型可机载运行创建高计算效率模型。 」而在这条帖子的下方,Jeff Dean 再次回忆起了最初那篇论文的悲惨遭遇:被 NeurIPS 2014 拒收了。
AI自主「发现」牛顿第二定律?北大概念驱动型发现系统AI-Newton问世
编辑丨coisini今天谈人工智能(AI)做科研已不再是新鲜事,但如果说 AI 自主「发现」了牛顿第二定律呢? 我们知道,AI 模型擅长识别数据模式并进行预测,但利用数据推导广义科学概念对 AI 来说仍然是一项挑战。 最近,《Nature》报道了一个由北京大学研究团队开发的概念驱动型发现系统 ——AI-Newton,该系统能够从原始数据中自主推导物理定律,无需人工监督或先验物理知识。
填补多语言语音幻觉检测空白,CCFQA基准助力评估大模型跨语言与跨模态事实一致性
论文标题:CCFQA: A Benchmark for Cross-Lingual and Cross-Modal Speech and Text Factuality Evaluation(AAAI 2026)论文链接:::(MLLMs)在多语言环境中的日益普及,确保无幻觉的事实准确性变得尤为重要。 然而,现有评估可靠性的基准主要集中在以英语为主的文本或视觉模态,这导致在处理多语言输入(尤其是语音)时存在评估空白。 为弥补这一不足,哈尔滨工业大学社会计算与交互机器人研究中心知识计算组和鹏城实验室数据智能研究所联合发布跨语言跨模态事实性基准(CCFQA),以推动具备更可靠语音理解能力的MLLMs发展。
把数学变成谜题:SAT 求解器如何让机器自动写出人类做不到的证明
编辑丨%Marijn Heule 近十年来致力于破解数学难题,倘若将他的工作写成小说,可能更像特工代号:空六边形、舒尔数 5、凯勒猜想、七维。 事实上,这些曾是几何学和组合数学中最顽固的问题之一,困扰了人们 90 年甚至更长时间。 Heule 使用了一种名为可满足性(SAT)的计算方式将它们一一攻克。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉