理论
欧洲黑马Mistral Medium 3来了!跑分对标最强Claude,实测大翻车
就在刚刚, Mistral AI发布了他们最新多模态模型Mistral Medium 3。 Mistral兴奋地宣称Mistral Medium 3的性能接近甚至达到了Claude Sonnet 3.7的水平,但成本却比DeepSeek V3还低。 在Mistral官方的博客中,列出了Mistral Medium 3的核心亮点:1.
5/9/2025 9:02:00 AM
全球首个,最接近原版DeepSeek开源复现来了!R1四个月狂飙26倍
DeepSeek的含金量还在上升。 就在最近,Hugging Face联创、首席科学家Thomas Wolf表示——DeepSeek的出现,是开源AI领域的ChatGPT时刻! 用他的话说,「正如ChatGPT让全世界认识到AI的存在,DeepSeek则让全世界意识到,原来还有着这样一个充满活力的开源社区。
5/9/2025 8:55:00 AM
新智元
仅看视频就能copy人类动作,宇树G1分分钟掌握100+,UC伯克利提出机器人训练新方式
不用动作捕捉,只用一段视频就能教会机器人学会人类动作,效果be like:UC伯克利团队研发出了一套新的机器人训练系统,可将视频动作迁移到真实机器人。 这个名为VideoMimic的新系统,已经让宇树G1机器人成功模仿了100多段人类动作。 VideoMimic的核心原理是从视频当中提取姿态和点云数据,然后在模拟环境中训练并最终迁移到实体机器人。
5/9/2025 8:50:00 AM
打破Transformer霸权!液态神经网络统治风电预测!
一眼概览该论文提出一种受生物神经系统启发的Liquid Neural Network(LNN)框架,首次将其应用于风电多时间尺度预测任务,并在多个数据集上显著优于LSTM、GRU等主流方法。 核心问题风电预测面临高度不确定性和非线性动态问题,传统深度学习方法如LSTM、GRU虽有成效,但缺乏解释性和泛化能力。 该研究致力于解决如何在多时间尺度、不同分辨率和变量数下,准确且透明地预测风电输出的问题。
5/9/2025 8:48:06 AM
萍哥学AI
OpenAI神秘项目曝光:cderGPT,用AI加速药物评估
OpenAI又一个神秘项目曝光了——名字叫做cderGPT,专门用来给药物评估这事提一提速度。 据Wired发布的消息来看,OpenAI的高层为了这个项目,已经与美国食品药品监督管理局(FDA)和马斯克的效率部门进行了多次讨论。 至于为什么要做这么个事,FDA局长Marty Makary在X上发表了他的看法:FDA现在不得不直面一些前所未有的重大问题:为什么一款新药上市要耗费十年以上的时间?
5/9/2025 8:35:00 AM
超过谷歌搜索,成本猛降80%!阿里开源创新大模型搜索引擎
昨天,阿里巴巴开源了一种创新大模型搜索引擎——ZeroSearch。 ZeroSearch是一种无需与真实搜索引擎交互即可激励大模型搜索能力的强化学习框架。 主要利用了大模型在大规模预训练过程中积累的丰富知识,将其转化为一个检索模块,能够根据搜索查询生成相关内容。
5/9/2025 8:31:11 AM
Cursor AI 正式向学生免费开放!
这可能不是一篇平时常写的内容,但最近这个消息实在太重要,值得立刻分享出来:Cursor——这一功能强大的 AI 编程工具,如今正式对全球高校学生免费开放! 无需付费、无需信用卡、没有试用限制,只需一个在读学生邮箱即可申请,整个流程不到 1 分钟。 Cursor 到底有多强?
5/9/2025 8:11:07 AM
前端小智
告别碎片化!两大先进分块技术如何提升RAG的语义连贯性?
研究动机论文核心问题及研究背景分析1. 研究领域及其重要性研究领域:检索增强生成(Retrieval-Augmented Generation, RAG)系统,结合自然语言处理(NLP)与信息检索技术。 重要性:RAG通过动态整合外部知识,解决了传统大语言模型(LLMs)依赖静态预训练数据的局限性。
5/9/2025 3:55:00 AM
ChallengeHub
研究表明,AI的巨大回报取决于修复碎片化数据
根据IBM对30个国家2000名CEO的调查,多年的零散技术采用已经造成了孤岛式系统,如果没有统一的数据基础,这些系统将威胁到AI投资。 “在采用AI时,CEO们需要在短期ROI压力和长期创新投资之间找到平衡,”IBM咨询高级副总裁兼负责人Mohamad . Ali在一份新闻稿中表示。
5/9/2025 3:00:00 AM
Mastufa
如何估算大语言模型LLM 的 GPU 内存:用于本地运行 LLM 的 GPU 内存
随着 DeepSeek、GPT、Llama、Mistral 等大规模 LLM 的兴起,AI 从业者面临的最大挑战之一是确定需要多少 GPU 内存才能高效地服务于这些模型。 GPU 资源昂贵且稀缺,因此优化内存分配至关重要。 本指南将引导您使用一个简单而有效的公式来估算服务 LLM 所需的 GPU 内存。
5/9/2025 1:00:00 AM
晓晓
全美高校被AI羞耻攻陷!普林斯顿教授预警:AI必将杀死人文学科
最近,一位普林斯顿教授在纽约客上发表长文,揭露美国高校中普遍存在的「AI羞耻症」。 他预言,在AI的冲击下,人文学科必将消亡。 所以,人文学科还有必要存在吗?
5/8/2025 4:49:47 PM
新智元
微软开源 Phi-4 推理模型:啰嗦AI,反卷出圈
AI圈子最有意思的事,已经不是“谁家模型参数最多”,而是——谁家小模型,能把大模型打趴下。 最近,微软研究院开源了一款“小而强”的研究:Phi-4-reasoning-plus。 这是一款专为深度结构化推理任务设计的开源语言模型。
5/8/2025 4:45:32 PM
文摘菌
几乎零代码!像搭乐高一样做AI应用,LazyLLM真的有点东西啊!
每次写完一段得意的 Python 代码,你是不是也幻想着在客户或老板面前来一场完美的产品 demo? 但现实往往是,要么在 Jupyter Notebook 里翻来覆去地展示 cell,要么在命令行里敲一堆指令,显得有点……不够高级,对吧? 我最开始也这么想,于是脑子里冒出了一堆计划:要不学学 Streamlit 或 Gradio,搭个漂亮的前端页面?
5/8/2025 4:44:54 PM
南七无名式
刚刚,OpenAI任命新CEO!
刚刚,OpenAI迎来新CEO。 奥特曼发文称,Fidji Simo将以「应用CEO」全新身份加入OpenAI,向他本人汇报。 图片奥特曼依旧还是OpenAI CEO,不过未来将专注于研究、算力与安全。
5/8/2025 4:40:27 PM
新智元
突发,OpenAI官宣新的CEO!奥特曼发文祝贺,新CEO来自“美国版美团”!
出品 | 51CTO技术栈(微信号:blog51cto)刚刚,OpenAI官宣了新的CEO!别急,倒不是奥特曼卸任了。 而是OpenAI开设了一个新岗位:应用首席执行官。 来自Instacart 的首席执行官 Fidji Simo 官宣将加入 OpenAI,担任应用部门的 CEO。
5/8/2025 3:42:15 PM
突发!特朗普要取消AI芯片出口限制!H20禁令还有反转?
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)自特朗普上台以来,各种政策简直一天一个变化。 今天一觉醒来,居然刷到了“特朗普计划撤销AI芯片出口限制”的新闻! 说实话,我第一反应就是——这不会是假消息吧?
5/8/2025 11:16:50 AM
伊风
开源即屠榜!UniME多模态框架登顶MMEB全球训练榜,刷新多项SOTA纪录
告别CLIP痛点,更懂语义关联的跨模态理解新SOTA来了! 格灵深瞳、阿里ModelScope团队,以及通义实验室机器智能团队联合发布通用多模态嵌入新框架UniME,一经推出就刷新MMEB训练榜纪录。 △图片于2025年5月6日08:00 UTC 8截取UniME作为一个创新性的两阶段框架,所展现的卓越的组合理解力,帮助MLLMs具备学习适用于各种下游任务的判别性表征的能力,并在多个任务中达到了新的SOTA。
5/8/2025 9:31:50 AM
万字长文带你读懂强化学习,去中心化强化学习又能否实现?
强化学习(RL)是当今 AI 领域最热门的词汇之一。 近日,一篇长文梳理了新时代的强化学习范式对于模型提升的作用,同时还探索了强化学习对去中心化的意义。 原文地址:「有时候几十年什么也不会发生;有时候几周时间仿佛过了几十年。
5/8/2025 9:16:00 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
AI新词
图像
Gemini
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
工具
计算
Sora
GPU
华为
大语言模型
RAG
具身智能
AI设计
字节跳动
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
编程
神器推荐
DeepMind
亚马逊
特斯拉
AI模型