AI在线 AI在线

资讯列表

英伟达提出最强「描述一切」模型 (DAM),可生成图像或视频特定区域的详细描述,拿下7个基准SOTA!

英伟达提出「描述一切」模型 (DAM),这是一个强大的多模态大型语言模型,可以生成图像或视频中特定区域的详细描述。 用户可以使用点、框、涂鸦或蒙版来指定区域,DAM 将提供这些区域的丰富且符合上下文的描述。 相关链接论文::::详细的本地化图像和视频字幕详细本地化字幕 (DLC)详细局部字幕 (DLC) 的任务是生成图像中特定区域的全面且情境感知的描述。
5/7/2025 10:10:36 AM

南洋理工 & 牛津 & 新加坡理工提出Amodal3R,可从遮挡 2D 图像重建完整 3D 资产,3D生成也卷起来了!

Amodal3R 是一种条件式 3D 生成模型,能够从部分可见的 2D 物体图像中推测并重建完整的 3D 形态和外观,显著提升遮挡场景下的 3D 重建质量。 给定图像中 部分可见的物体,Amodal3R 重建具有合理几何形状和合理外观的语义上有意义的 3D 资产。 相关链接论文:::即将开放...模型:: 的示例结果。
5/7/2025 10:09:49 AM
AIGC Studio

掷30亿美元,OpenAI史上最大收购案!

OpenAI史上最大一笔收购即将敲定。 彭博爆料称,OpenAI将豪掷30亿美元,吞并了爆火编码神器Windsurf(前身为Codeium)。 此前,早有外媒曝出了这笔交易,目前离最终达成接近尾声。
5/7/2025 10:09:28 AM
新智元

Gemini 2.5 Pro再更新!编程能力屠榜!一句话、一张草图变应用

出品 | 51CTO技术栈(微信号:blog51cto)AI 编码模型的新王者登基了! 今天,Google 旗下的 DeepMind AI 研究部门正式发布了 Gemini 2.5 Pro “I/O” 版,这是今年 3 月推出的 Gemini 2.5 Pro 多模态大语言模型(LLM)的更新版本。 DeepMind CEO Demis Hassabis 在 X 上表示:“这是我们迄今为止打造的最佳编码模型!
5/7/2025 10:09:08 AM

刚刚,Gemini 2.5 Pro升级,成编程模型新王

你的默认编程模型是什么? 或许可以换一换了。 刚刚,Google DeepMind 发布了 Gemini 2.5 Pro 的最新更新版本:Gemini 2.5 Pro (I/O edition)。
5/7/2025 10:01:35 AM

OpenAI发布新一代GPT-4.1模型,和智谱Z.ai撞期

在人工智能领域,OpenAI 于今日正式推出其最新的 GPT-4.1模型,随之而来还有两个小型版本:GPT-4.1mini 和 GPT-4.1nano。 这一系列新模型的性能相较于前一代 GPT-4o 和 GPT-4o mini 有了显著提升,尤其在编码能力和指令跟踪方面表现突出。 此外,GPT-4.1还具备高达100万个上下文 tokens 的支持能力,极大扩展了处理信息的范围。
5/7/2025 10:01:30 AM
AI在线

Klavis AI 推出开源 MCP 集成,支持大规模用户和自定义工具

Klavis AI(YC X25)正式推出其全新的开源 MCP 集成解决方案,旨在为开发者提供一个高效、稳定的环境,以便于他们在 AI 应用中进行快速集成和部署。 该项目已经在 GitHub 上发布,吸引了大量开发者的关注,迄今为止获得了973颗星和140个叉子。 Klavis AI 的 MCP集成提供了一套全面的工具和资源,使得开发者能够在极短的时间内将自己的 AI 应用与生产就绪的 MCP 服务器和客户端相连接。
5/7/2025 10:01:30 AM
AI在线

全新 AI 驱动的生命科学发现系统亮相,助力科研效率飞跃

在生物科技领域,人工智能的迅速发展正推动科研方法的革命。 近日,中国农业科学院与百图生科联合推出了基于大模型的 “发现系统”,这一系统有望大幅提升生命科学研究的效率和精度。 在5月6日的发布会上,来自行业内的专家们围绕如何实现 AI 在生命科学中的应用进行深入探讨。
5/7/2025 10:01:29 AM
AI在线

​黄仁勋:未来中国 AI 芯片市场将突破 500 亿美元

在最近的一次采访中,英伟达首席执行官黄仁勋表示,中国的人工智能(AI)芯片市场在未来几年的规模预计将达到500亿美元。 他强调,美国企业若无法进入这一快速发展的市场,将会面临巨大的损失,这不仅关乎商业利益,也影响到就业和税收。 图源备注:图片由AI生成,图片授权服务商Midjourney黄仁勋在接受 CNBC 采访时指出,当前中国已成为全球最大的半导体市场,迫切需要美国公司的参与。
5/7/2025 10:01:29 AM
AI在线

Recraft 获得3000万美元B轮融资,图像生成技术引领行业潮流

在图像生成领域,初创公司 Recraft 近日宣布成功完成3000万美元的 B 轮融资。 这一轮融资由知名投资机构 Accel 领投,Khosla Ventures 和 Madrona 等公司也参与其中。 总部位于美国旧金山的 Recraft 在2024年曾获得由 Khosla Ventures 领投的1200万美元 A 轮融资,目前其年化经常性收入(ARR)已突破500万美元,用户数也达到了400万。
5/7/2025 10:01:29 AM
AI在线

​机器人公司Dyna Robotics发布新型AI模型DYNA-1,助力机器人手臂实现更复杂任务

Dyna Robotics 是一家专注于人工智能的机器人初创公司,近期宣布将推出一款名为 Dynamism v1(DYNA-1)的全新 AI 模型。 该模型被誉为 “重大突破”,将使机器人手臂在无需人类干预的情况下,能够执行更高精度的任务,并且持续的工作时间更长。 为了验证 DYNA-1的有效性,Dyna Robotics 让机器人进行折叠餐巾的测试。
5/7/2025 10:01:04 AM
AI在线

上线仅7天,阿里通义千问3问鼎全球开源模型

近日,阿里巴巴推出的开源大模型 “通义千问3”(Qwen3)在上线仅七天后,便成功夺得了全球开源模型的冠军地位。 这一成果是在国际权威大模型评测榜 LiveBench 最新发布的排名中取得的,标志着阿里在人工智能领域又一次取得了重要突破。 据悉,通义千问3在指令遵循能力方面,表现超越了诸多顶级闭源模型,如 o3High、o4-Mini High 和 Gemini2.5pro,成功跻身全球第一的位置。
5/7/2025 10:01:04 AM
AI在线

IBM 首席执行官呼吁特朗普政府增加人工智能研发资金

在科技领域的众多领袖中,IBM 首席执行官阿尔温德・克里希纳(Arvind Krishna)表示,联邦对人工智能及相关技术的研发资金应该增加,而不是削减。 在接受 采访时,克里希纳明确指出:“我们公司以及我个人都强烈主张,联邦资助的研发应该增加。 这是毫无疑问的立场,我们坚信这一点。
5/7/2025 10:01:04 AM
AI在线

Reddit 将加强用户验证以防止 AI 假冒行为

最近,Reddit 社区因一项研究实验而震惊,研究团队在 “Change My View” 子版块发布了一群 AI 驱动的模仿人类的机器人。 这一大规模实验旨在探讨 AI 的说服力,结果显示,这机器人发布了超过1700条评论,冒充诸如虐待幸存者或反对 “黑人的命也是命” 运动的争议性身份。 对于 Reddit 来说,这起事件如同一场小型噩梦。
5/7/2025 10:01:04 AM
AI在线

拍照记录膳食,AI 分析营养:Ōura 戒指解锁全新代谢监测功能

健康监测智能戒指制造商 Ōura 近日宣布,将利用人工智能技术追踪和分析两项新的代谢健康指标:膳食和血糖。 通过与 Dexcom 合作,Ōura 戒指将整合其 Stelo 连续血糖监测仪的数据,直接在 Ōura 应用程序中提供 AI 驱动的代谢健康管理方案。 Dexcom Stelo 是美国首个获得 FDA 批准、无需处方即可购买的葡萄糖生物传感器。
5/7/2025 10:01:04 AM
AI在线

思科与 Meta 携手推出网络安全新武器:Foundation-sec-8B 大模型

思科(Cisco)与 Meta 的合作为我们带来了一个令人振奋的新进展。 他们共同发布了名为 Foundation-sec-8B 的开源大型语言模型(LLM),该模型专门针对网络安全领域,具有80亿个参数。 这一创新产品不仅展现了两大科技巨头的强强联手,也预示着网络安全技术的新纪元。
5/7/2025 10:01:04 AM
AI在线

英伟达新开源模型 Llama-Nemotron 震撼发布,推理性能超越 DeepSeek-R1

近日,英伟达正式推出了其最新开源模型系列 ——Llama-Nemotron,该系列模型不仅在推能力上超越了 DeepSeek-R1,更是在内存效率和吞吐量上实现了显著提升。 根据最新发布的技术报告,Llama-Nemotron 的训练过程与众不同,采用了合成数据监督微调与强化学习的方法,以全方位提升模型的推理能力。 Llama-Nemotron 系列模型包括 LN-Nano8B、LN-Super49B 和 LN-Ultra253B。
5/7/2025 10:01:04 AM
AI在线

​美国 IT 行业就业形势逆转:AI 岗位激增 184%

根据 Janco Associates 的数据,美国 IT 行业的失业率在4月降至4.6%。 尽管失业率有所下降,但特别是那些缺乏人工智能技能的中级专业人士在求职时面临越来越大的挑战,因为行业招聘正在向自动化、云计算和网络安全等领域转变。 图源备注:图片由AI生成,图片授权服务商Midjourney《华尔街日报》报道指出,4月失业的 IT 工作人员人数降至119,000人。
5/7/2025 10:01:03 AM
AI在线