视觉表征模型
物理传热启发的视觉表征模型vHeat来了,尝试突破注意力机制,兼具低复杂度、全局感受野
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文作者为VMamba的原班人马,其中第一作者王兆植是中国科学院大学和鹏城实验室的2022级联合培养博士生,共同一作刘悦是中国科学院大学2021级直博生。他们的主要研究方向是视觉模型设计和
6/3/2024 3:58:00 PM
机器之心
- 1
资讯热榜
超多案例!让 Lovart 作图更好看更高效的提示词在这里了!
Google DeepMind Launches AlphaEvolve: AI Breaks a 56-Year Record in Mathematics and Optimizes Its Own Training System
Meta 发布巨型 AI 化学数据集 OMol25及通用模型 UMA
Flowith NEO发布!全球首款无限步骤、上下文与工具的AI Agent
YouTube 推出 AI 广告新利器“Peak Points”,Gemini 精准捕捉用户注意力
DeepSeek-V3 发布新论文,揭示低成本大模型训练的奥秘
大语言模型也有“健忘症”?Supermemory推出“无限记忆外挂”,让你的AI永不失忆!
Perplexity 推出 Comet 浏览器 beta 版,重新定义网络浏览体验
标签云
人工智能
AI
OpenAI
AIGC
ChatGPT
模型
DeepSeek
AI绘画
数据
机器人
谷歌
大模型
Midjourney
用户
智能
开源
微软
学习
GPT
Meta
图像
AI创作
技术
Gemini
论文
马斯克
Stable Diffusion
算法
代码
芯片
英伟达
生成式
蛋白质
腾讯
开发者
神经网络
研究
Anthropic
3D
计算
Sora
机器学习
AI设计
AI for Science
苹果
GPU
AI视频
生成
场景
搜索
华为
百度
人形机器人
训练
预测
伟达
Claude
xAI
深度学习
Transformer
大语言模型
字节跳动
模态
智能体
具身智能
神器推荐
Copilot
文本
驾驶
视觉
LLaMA
应用
算力
安全
API
干货合集
视频生成
大型语言模型
Agent
工具