拓扑
“扁平+拓扑”双索引,85页PDF"秒级"推理,MMRag幻觉率骤降76%
多模态长文档视觉问答(Multimodal Long-context Document Question Answering, 后文简称 M-L-DocQA)要求系统在给定一份可能长达数十页, 包含:文本、表格、图表、图像与版式元素的 PDF。 自动定位并融合跨页、跨模态的证据,最终生成自然语言答案。 图片这种任务常见于科研论文、上市公司年报、产品说明书、政府统计报告等场景。
9/11/2025 2:22:00 AM
CourseAI
登Nature子刊,拓扑Transformer模型进行多尺度蛋白质-配体互作预测,助力药物研发
编辑 | 萝卜皮一项新的人工智能应用将帮助研究人员提高药物研发能力。该项目名为 TopoFormer,是由美国密歇根州立大学(Michigan State University)数学系 Guowei Wei 教授领导的跨学科团队开发的。TopoFormer 将分子的三维信息转化为典型的基于人工智能的药物相互作用模型可以使用的数据,扩展了这些模型预测药物有效性的能力。「有了人工智能,你可以让药物研发更快、更高效、更便宜。」Wei 说,他同时在生物化学和分子生物学系以及电气和计算机工程系任职。Wei 教授解释道,在美国
7/2/2024 11:59:00 AM
ScienceAI
无需训练,自动扩展的视觉Transformer来了
来自德克萨斯大学奥斯汀分校、悉尼科技大学和谷歌的研究者提出了一个无需训练就能自动扩展框架 As-ViT,其能以高效和有原则的方式自动发现和扩展 ViT。
4/10/2022 12:49:00 PM
机器之心
- 1
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
论文
LLM
代码
算法
芯片
Stable Diffusion
苹果
腾讯
AI for Science
Claude
Agent
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
研究
人形机器人
生成
AI视频
百度
工具
具身智能
Sora
RAG
大语言模型
GPU
华为
计算
AI设计
字节跳动
搜索
大型语言模型
AGI
场景
深度学习
视频生成
架构
DeepMind
预测
视觉
伟达
Transformer
编程
AI模型
神器推荐
亚马逊
MCP