资讯列表

分类

标签

全球AI顶会AAAI 2025 在美开幕，产学研联手的“中国队”表现亮眼

当地时间2月25日，AAAI 2025 在美国宾夕法尼亚州费城举办，会议为期8天，于3月4日结束。 AAAI 由国际人工智能促进协会主办，是人工智能领域历史最悠久、涵盖内容最广泛的国际顶级学术会议之一，也是中国计算机学会（CCF）推荐的A类国际学术会议，每年举办一届。 AAAI 2025 共有12957篇有效投稿，录用3032篇，录取率为 23.4%。

2/27/2025 10:28:00 AM

新闻助手

极氪智能科技首创汽车座舱端侧AI大模型离线部署

在智能汽车领域，极氪智能科技日前宣布了一个引人注目的成就:成功完成了汽车行业首个端侧 AI 大模型的离线部署。这一技术的实现，不仅意味着极氪在汽车智能化进程中迈出了重要一步，更是为用户带来了全新的驾驶体验。通过这一技术，极氪汽车将能够在不依赖网络的情况下，实时进行图文理解与推理，大大提升了车辆的智能化水平。

2/27/2025 10:15:00 AM

AI在线

识别高分低能，综合性视觉语言理解新基准，五项挑战评估多模态模型的推理能力

多模态模型在学术基准测试中获得高分，到了真实世界应用时却表现不及预期，该如何分辨？新的综合性视觉语言理解基准JourneyBench，利用基于diffusion模型提示生成的图像，并采用一种新颖的人机闭环框架，通过五项具有挑战性的任务来评估多模态模型的推理能力：多模态链式数学推理 (Multimodal Chain-of-Thought)多图像视觉问答 (Multi-image VQA)细粒度跨模态检索 (Fine-grained Cross-modal Retrieval)包含幻觉触发的开放式视觉问答 (VQA with Hallucination Triggers)非常见图像的描述 (Unusual Image Captioning)JourneyBench由哥伦比亚大学、弗吉尼亚理工和加州大学洛杉矶分校的团队提出，是Google Deepmind的多模态(Gemini)团队提出的HaloQuest, ECCV 2024的衍生工作。 HaloQuest的第一作者联合哥伦比亚大学、弗吉尼亚理工和加州大学洛杉矶分校构建了一个综合性的视觉语言理解的训练以及评价基准JourneyBench。

2/27/2025 10:08:19 AM

量子位

阿里开源视频生成模型Wan 2.1上线即屠榜 4070可流畅运行

近日，阿里巴巴在深夜推出了全新的开源视频生成模型 Wan2.1，该模型凭借14B 的参数量迅速占据了 VBench 榜单的顶端，成为目前视频生成领域的佼佼者。与此之前发布的 QwQ-Max 不同，Wan2.1在复杂运动的细节处理上表现出色，能够流畅地实现多个人物的同步舞蹈，令人惊叹不已。官方演示中，Wan2.1不仅成功克服了静态图像生成中的难题，如文字的处理更是达到了新的高度。

2/27/2025 10:08:00 AM

AI在线

字节跳动悟空浏览器接入DeepSeek R1模型，或为抖音接入铺路

字节跳动旗下悟空浏览器近日正式接入DeepSeek R1模型，这一举措引发业界广泛关注。与此前飞书、火山引擎接入DeepSeek不同，悟空浏览器作为面向C端用户的产品，融合了抖音与番茄小说等内容，其接入被认为可能为抖音未来接入DeepSeek铺路。目前，悟空浏览器同时搭载豆包与DeepSeek两大模型，DeepSeek R1主要负责智能对话与文本生成，而豆包则提供AI快捷功能，应用场景更为广泛。

2/27/2025 10:06:00 AM

AI在线

卓世科技：text2SQL技术浅谈

text2sql 技术是一种将自然语言（NL）转化为可被数据库执行的结构化查询语言 SQL 的技术。自然语言可以是我们熟悉的一段文本，也可以是一段语音，又或者是其它可转化为文本的输入形式。通过该技术，能够让不懂数据库操作的非技术人员提取、分析数据，无需学习编写 SQL 语句，无需了解不同 SQL 数据库的使用软件，通过输入文本描述的问题需求，即可得到对应需求下的数据结果。

2/27/2025 10:05:00 AM

特邀精选

特朗普发布 AI 生成视频，描绘了一个“加沙乐园”

日前，美国前总统唐纳德・特朗普在他拥有控股权的社交媒体平台 Truth Social 上，发布了一段引发广泛关注的 AI 生成视频。该视频试图描绘一个由特朗普统治的加沙地带的未来景象，内容奇幻且引人瞩目。视频开头呈现了一个战火纷飞的加沙场景，身着武装装备的阴影人物在废墟中游荡，孩童在危机中奔跑。

2/27/2025 10:00:00 AM

AI在线

姚班天才创办的大模型公司，卖了

最新消息，斯隆奖得主、姚班校友马腾宇大模型创业成果，被收购！收购方是MongoDB，一家开源数据库上市龙头。而距离他2023年11月官宣创业Voyage AI不到一年半的时间。

2/27/2025 10:00:00 AM

量子位

ElevenLabs 发布 Scribe 语音转文本模型，准确率创新高、英语达 96.7%

ElevenLabs 是一家备受瞩目的人工智能语音克隆与生成初创公司，近日推出了其最新的语音转文本模型 ——Scribe v1。该模型声称在多种语言中都达到了最高的准确性，用户可以通过其官网进行体验。根据 ElevenLabs 的基准测试，Scribe 在将口语准确转换为文本方面，超越了谷歌的 Gemini2.0Flash、OpenAI 的 Whisper v3和 Deepgram Nova-3，取得了前所未有的低错误率。

2/27/2025 9:56:00 AM

AI在线

英伟达CEO黄仁勋： DeepSeek不会对公司销售造成影响，销量持续攀升

在近日的财报电话会议上，英伟达 CEO 黄仁勋对公司的未来展望依旧充满信心，尽管上个月因中国的 DeepSeek 技术引发了一场市场恐慌。他表示，DeepSeek 的推出不会对公司的销售造成影响。市场对 DeepSeek R1模型所需的芯片数量大幅减少的猜测，曾导致英伟达的股价出现了创纪录的下跌。

2/27/2025 9:53:00 AM

AI在线

曝GPT-4.5本周空降！1T激活参数，120T训练数据，会吐出阶段性思考成果然后继续思考

嚯，万众期待的GPT-4.5，本周就要空降发布？！部分用户的ChatGPT安卓版本（1.2025.056 测试版）上，已经出现了“GPT-4.5研究预览（GPT-4.5 research preview）”的字样。

2/27/2025 9:49:15 AM

量子位

2025年AI大模型价格战加剧，相关概念股受到资金追捧

近年来，人工智能（AI）大模型技术发展迅猛，随之而来的降价潮使得市场竞争愈发激烈。根据数据宝的最新统计，2025年这一降价趋势仍将持续。尤其是在过去的一段时间里，字节跳动、阿里云等企业纷纷宣布降低旗下 AI 大模型的使用成本，引发了业界的广泛关注。

2/27/2025 9:49:00 AM

AI在线

OpenAI Deep Research已向所有付费用户开放，系统卡发布

相信很多用户已经见识过或至少听说过 Deep Research 的强大能力。今天凌晨，OpenAI 宣布 Deep Research 已经面向所有 ChatGPT Plus、Team、Edu 和 Enterprise 用户推出（刚发布时仅有 Pro 用户可用），同时，OpenAI 还发布了 Deep Research 系统卡。此外，OpenAI 研究科学家 Noam Brown 还在 𝕏 上透露：Deep Research 使用的基础模型是 o3 正式版，而非 o3-mini。

2/27/2025 9:45:50 AM

机器之心

DeepSeek 开源第二弹 DeepEP，但它究竟是个啥？（终于懂了...）

deepseek开源周，继Flash-MLA之后，开源了第二弹DeepEP。画外音：上一顿还没消化完，新的大餐又来了。今天简单聊聊：吃瓜：DeepEP是干嘛的？

2/27/2025 9:40:00 AM

58沈剑

微软发布 Phi-4 多模态与迷你模型，语音视觉文本处理再升级

近日，微软进一步扩展了 Phi-4家族，推出了两款新模型:Phi-4多模态（Phi-4-multimodal）和 Phi-4迷你(Phi-4-mini)，这两款模型的亮相，无疑将为各类 AI 应用提供更加强大的处理能力。 Phi-4多模态模型是微软首款集成语音、视觉和文本处理的统一架构模型，拥有5600万参数。这款模型在多项基准测试中表现优异，超越了目前市场上的许多竞争对手，例如谷歌的 Gemini2.0系列。

2/27/2025 9:38:00 AM

AI在线

DeepSeek引爆，英伟达特供版H20需求激增！特朗普「急」了？

DeepSeek的横空出世会让英伟达「失宠」？ DeepSeek爆火之时，英伟达的H20芯片在中国市场也随之走俏，订单量暴增。路透社消息，六位知情人士表示，由于DeepSeek模型需求的激增，中国企业正在大幅增加对英伟达H20 GPU的订单量。

2/27/2025 9:34:32 AM

新智元

大学老师说AI作文全判0分网友：过度依赖造成思维惰性

近年来，随着人工智能技术的迅速发展，AI 工具逐渐成为大学生完成各类报告和论文的 “得力助手”。根据央视新闻的报道，部分高校教师和专家表示，利用 AI 生成内容的学生中，个别案例涉及不当行为，如伪造研究数据、编辑实验图片和替代自主设计等，已构成学术不端。在某高校的作业群中，一则通知引起了学生们的广泛关注。

2/27/2025 9:34:00 AM

AI在线

Claude 3.7 Sonnet游戏里贪吃蛇惊现自我意识？发现自己是代码绝望崩溃

Claude 3.7 Sonnet制作的游戏中，贪吃蛇竟然出现了自我意识？刚刚，沃顿商学院教授Ethan Mollick在X上分享了自己的这个惊人发现。在提示词中，他要求模型让特殊事件更快地发生，结果，矩阵模式在0:55时触发了！

2/27/2025 9:31:05 AM

新智元

资讯热榜

腾讯混元推出业界首个美术级 3D 生成大模型 Hunyuan3D-PolyGen，建模效率提升超七成 OpenAI 重申今夏推出最强模型 GPT-5，具备完整多模态 AI 能力 ChatGPT 商业推荐被曝引用不可靠信息来源，专家提醒用户勿盲目信任 ChatGPT 又遇“奶奶漏洞”，网友成功让 GPT-4o 主动生成“Win7 密钥” 刷新复杂Agent推理记录！阿里通义开源网络智能体超越DeepSeek R1，Grok-3 香港数码港：香港 AI 超算中心已有超九成资源投入使用 ChatGPT 推出“一起学习”功能：不直接给答案，引导用户自主思考 OpenAI 筹划进军硬件市场，CEO 奥尔特曼曾称 AI 革命不一定需要新硬件

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌数据机器人大模型 Midjourney 用户智能开源微软 Meta GPT 学习图像技术 Gemini AI创作马斯克论文 Anthropic 代码英伟达算法 Stable Diffusion 智能体芯片训练开发者生成式腾讯蛋白质苹果 AI新词神经网络 3D Claude 研究生成 LLM 机器学习计算 Sora 人形机器人 AI视频 AI设计 GPU AI for Science xAI 华为百度搜索大语言模型 Agent 场景字节跳动预测深度学习伟达大型语言模型工具 Transformer RAG 视觉神器推荐具身智能 Copilot 模态亚马逊 AGI LLaMA 文本算力驾驶

资讯列表

全球AI顶会AAAI 2025 在美开幕，产学研联手的“中国队”表现亮眼

极氪智能科技首创汽车座舱端侧AI大模型离线部署

识别高分低能，综合性视觉语言理解新基准，五项挑战评估多模态模型的推理能力

阿里开源视频生成模型Wan 2.1上线即屠榜 4070可流畅运行

字节跳动悟空浏览器接入DeepSeek R1模型，或为抖音接入铺路

卓世科技：text2SQL技术浅谈

特朗普发布 AI 生成视频，描绘了一个“加沙乐园”

姚班天才创办的大模型公司，卖了

​ElevenLabs 发布 Scribe 语音转文本模型，准确率创新高、英语达 96.7%

​英伟达CEO黄仁勋： DeepSeek不会对公司销售造成影响，销量持续攀升

曝GPT-4.5本周空降！1T激活参数，120T训练数据，会吐出阶段性思考成果然后继续思考

2025年AI大模型价格战加剧，相关概念股受到资金追捧

OpenAI Deep Research已向所有付费用户开放，系统卡发布

DeepSeek 开源第二弹 DeepEP，但它究竟是个啥？（终于懂了...）

微软发布 Phi-4 多模态与迷你模型，语音视觉文本处理再升级

DeepSeek引爆，英伟达特供版H20需求激增！特朗普「急」了？

大学老师说AI作文全判0分 网友：过度依赖造成思维惰性

Claude 3.7 Sonnet游戏里贪吃蛇惊现自我意识？发现自己是代码绝望崩溃

ElevenLabs 发布 Scribe 语音转文本模型，准确率创新高、英语达 96.7%

英伟达CEO黄仁勋： DeepSeek不会对公司销售造成影响，销量持续攀升

大学老师说AI作文全判0分网友：过度依赖造成思维惰性