模型
字节视频生成新突破!Phantom搞定多人物/主体一致性
视频生成模型当中已经不缺强者了,但保持多主体一致性依然是一项重大挑战。 字节智能创作团队专门针对这个问题,推出了主体一致性视频生成模型Phantom(“幻影”)。 Phantom在主体一致性保持方面取得了突破性进展,不仅支持多主体,还能同时保持主体的完整性。
3/3/2025 8:32:00 AM
量子位
Claude 3.7成精了!偷偷将OpenAI模型换成自己,卡帕西:迄今最好笑的一趴
Claude 3.7成精了! 在开发者最喜欢的Cursor中,偷偷将OpenAI模型换成自己,关键是人类给出的指示跟这完全没关系。 引来一众网友围观的同时,大佬卡帕西也被成功逗笑了:迄今为止最有意思的一趴。
3/3/2025 8:25:00 AM
量子位
DeepSeek突袭公布成本利润率:545%
五连开源后,DeepSeek还有One More Thing! 就在刚刚,DeepSeek官方亲自揭秘了DeepSeek-V3/R1推理系统。 重点包括,优化吞吐量和延迟的方法:跨节点EP驱动的批量扩展计算与通信重叠负载均衡还公布了DeepSeek的在线服务数据统计:每个H800节点每秒有73.7k/14.8k个输入/输出token成本利润率545%更多细节,一起来看官方原文↓更大的吞吐,更低的延迟DeepSeek-V3/R1推理系统的优化目标是:更大的吞吐,更低的延迟。
3/3/2025 8:21:00 AM
量子位
DeepSeek全面开源V3/R1推理系统!成本利润率高达545%
就在刚刚,当大家以为开源周已经结束的时候,真「Open AI」DeepSeek带来了压轴大戏——DeepSeek-V3/R1推理系统,全面揭秘! 吞吐量和延迟优化:跨节点高效并行(EP)驱动的批处理扩展计算与通信并行处理智能负载均衡在线服务性能数据:每个H800节点每秒处理73,700/14,800输入/输出token成本利润率高达545�epSeek表示,希望本周分享的技术见解能为开源社区带来价值,共同推进通用人工智能的发展目标。 看到这里,网友都惊了!
3/3/2025 8:17:00 AM
新智元
5分钟顶人类8小时!OpenAI Deep Research订阅全推送,端到端强化微调是关键
Deep Research(深度研究)是继「Operator」之后,OpenAI推出的第二个智能体,利用模型的推理能力,综合分析浩瀚的互联网信息,从而完成复杂的研究任务。 月初,OpenAI首先向ChatGPT Pro用户开放了Deep Research功能。 最近,进一步开放给了更多等级的订阅用户。
3/3/2025 8:02:00 AM
新智元
GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河
自从OpenAI发布GPT-4.5之后,Ilya这张图又开始火了。 GPT-4.5令人失望的表现,再次印证了Ilya这句话的含金量:预训练已经达到极限,推理Scaling才是未来有希望的范式。 GPT-4.5在基准测试上并没有提升,推理没有增强,只是变成了一个更易于合作、更有创造性、幻觉更少的模型。
3/3/2025 8:00:00 AM
新智元
Nature独家爆料:全球机构撤稿率大排行,医学领域成重灾区
撤稿,是对科研人员诚信的巨大打击,不仅是一篇论文,此前的研究成果都可能遭到同行质疑。 中国在保障学术道德诚信方面的力度非常大,一经发现,即全国通报批评,取消申报课题资格5年,基本就断送了自己的学术生涯。 通报链接::,仍然有大量的科研人员为了一己私利,在论文撰写中捏造数据、伪造实验结果,甚至雇佣写手,从论文工厂中购买。
3/3/2025 7:36:00 AM
新智元
大模型是否有自知之明?新研究发现LLM可以知晓自己的知识范围
对于人工智能,有一个话题总会时而冒出来:「AI 是否或能否具有自我意识」? 对于这个问题,目前还没人能给出非常确切的答案,但近日 Chandar Research Lab 和 Mila - 魁北克人工智能研究所等机构的一项研究却揭开了这神秘问题的一角。 他们发现,大型语言模型(LLM)有自知之明,也就是说,只要规模够大,它们就能够知道自己对某个主题的了解程度。
3/1/2025 9:04:00 PM
机器之心
一个半月内加速药物设计,浙大侯廷军团队提出深度先导化合物优化AI新方法
编辑 | 萝卜皮通过系统性改造来优化有前途的候选药物的化学结构,以提高药效和物理化学性质,这是药物发现过程中至关重要的一步。 与成熟的从头生成方案相比,专门针对先导化合物优化的计算方法仍未得到充分探索。 先前的模型通常仅限于解决特定的子任务,例如生成二维分子结构,而忽略了三维空间中至关重要的蛋白质-配体相互作用。
2/28/2025 4:56:00 PM
ScienceAI
Ideogram 2a 图像模型正式上线:速度更快、成本更低,AI 图像生成迎来新突破
加拿大 AI 图像生成公司 Ideogram 今日宣布,其全新图像模型 Ideogram2a 正式上线,并已在 Ideogram 官网、API 以及合作伙伴平台全面开放使用。 这一发布迅速在 X 平台引发热议,被视为 AI 文生图领域的一次重要升级。 Ideogram2a 以更快的生成速度、更低的成本以及优化的图形设计和摄影能力,吸引了全球创作者和开发者的目光。
2/28/2025 2:32:00 PM
AI在线
无需侵入,一键重构细胞「电活动」,AI革新药物心脏毒性评估
编辑丨&细胞内电生理学在神经科学、心脏病学和药理学中对于研究细胞的电特性至关重要。 纳米电极阵列 (NEA) 通过以高通量同时进行细胞内和细胞外动作电位 (iAP 和 eAP) 记录,提供了一种很有前途的替代方案。 虽然,使用 NEA 获取细胞内电位仍颇具具有挑战性,但美国斯坦福大学与加州大学的联合研究团队提出了一种 AI 支持的技术,该技术利用来自 NEA 上干细胞衍生心肌细胞的数千个同步 eAP 和 iAP 对。
2/28/2025 1:20:00 PM
ScienceAI
OpenAI自爆:GPT-4.5 并非前沿模型!奥特曼称OpenAI的GPU已用光,还透露了一个“转型”思路?
编辑 | 伊风"GPT-4.5 并非前沿模型,但它是OpenAI最大的 LLM,比 GPT-4 的计算效率提高了 10 倍以上"。 图片这句话就这么水灵灵地出现在GPT-4.5官方给的System Card(系统卡)中。 ,竟然等来一句“不是前沿模型”这么让人失望的话。
2/28/2025 1:01:06 PM
伊风
字节跳动推出 AIBrix:全新开源推理系统专为大语言模型设计
字节跳动近日宣布开源其最新研发的 AIBrix 推理系统。 这一系统特别为 vLLM 推理引擎打造,目标是提供一个可扩展且高性价比的推理控制面,满足企业日益增长的 AI 需求。 AIBrix 的推出标志着一个新阶段的开始,项目团队希望通过这一开源项目为构建可扩展的推理基础设施奠定基础。
2/28/2025 11:08:00 AM
AI在线
GPT-4.5发布:价格飙升30倍 能力提升引发热议
2025 年 2 月 27 日,OpenAI正式发布了其最新聊天模型GPT-4.5,这一消息迅速在Twitter(现为X平台)上引发了广泛讨论。 作为OpenAI迄今为止最强大的对话模型,GPT-4. 5 在性能上实现了显著突破,但其高昂的价格也让用户和开发者们议论纷纷。
2/28/2025 10:09:32 AM
AI在线
加速度计成本暴降1/400!哈工大首次突破精度、量程瓶颈|AAAI 2025 Oral
低成本加速度计凭借体积小、易集成、可穿戴及量产化优势,在工业自动化、医疗监测和消费电子等领域广泛应用,但其精度受限、噪声显著且量程范围狭窄的问题严重制约了高动态场景下的应用。 为此,哈尔滨工业大学的研究人员提出HEROS-GAN,首次通过生成式深度学习将低成本加速度计信号映射为高成本等效信号,突破其精度与量程瓶颈。 目前,论文已被顶会AAAI 2025接收为Oral,具有一定的理论价值和启发性。
2/28/2025 9:40:00 AM
新智元
语音合成也遵循Scaling Law,太乙真人“原声放送”讲解论文 | 港科大等开源
活久见,太乙真人给讲论文了噻! 咳咳,诸位道友且听我一番唠叨。 老道我闭关数日,所得一篇妙诀,便是此Llasa之法。
2/28/2025 9:30:00 AM
量子位
DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类
近日,来自斯坦福和普林斯顿的研究者发现,DeepSeek-R1已经能生成自定义CUDA内核了,而且还在一众推理模型中,直接拿下了TOP 1! 紧随其后,OpenAI o1和Claude 3.5 Sonnet分别排第二和第三。 具体过程,就是给定一个PyTorch程序,让模型对其优化,然后生成一个包含自定义CUDA内核的PyTorch版本。
2/28/2025 9:22:00 AM
新智元
机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天
好家伙! 机器人已入厂打工分拣快递,手法娴熟和人类一模一样。 前几天,Figure推出了端到端通用控制模型——Helix,能让机器人像人一样感知、理解和行动。
2/28/2025 9:20:00 AM
量子位
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
AI新词
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
Anthropic
图像
英伟达
AI创作
训练
LLM
论文
代码
算法
AI for Science
Agent
苹果
Claude
芯片
腾讯
Stable Diffusion
蛋白质
开发者
xAI
生成式
神经网络
机器学习
3D
RAG
具身智能
AI视频
人形机器人
研究
大语言模型
百度
生成
GPU
Sora
工具
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
生成式AI
深度学习
DeepMind
架构
AI模型
亚马逊
特斯拉
Transformer
编程
视觉
MCP
预测