资讯列表
Agent 要被吃进大模型了
今天凌晨,奥特曼突然发文宣布推出自家最新的 o 系列模型:满血版 o3 和 o4-mini,同时表示这两款模型都可以自由调用 ChatGPT 里的各种工具,包括但不限于图像生成、图像分析、文件解释、网络搜索、Python。 总的来说,就是比前一代的性能更强而且价格更低。 消息一出,马上就有网友晒出了两个模型的“小球测试”结果,并配文:“这确实是迄今为止看到的最好的测试结果了。
Llama 4 刷榜作弊引热议,20 万显卡集群就做出了个这?
昨天一早,Meta 了放出自家用了 20 万显卡集群训练出的 Llama 4 系列模型,其中包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。 消息一出,直接引爆了大模型圈。 Meta 还特意强调,这些模型都经过了大量未标注的文本、图像和视频数据的训练,视觉理解能力已经到了 Next level,有种在大模型领域一骑绝尘的既视感。
司法部或迫使谷歌出售 Chrome,OpenAI 表明收购意愿
据路透社报道,在谷歌垄断案的救济措施审理阶段,OpenAI 的 ChatGPT 产品负责人今日向法官表示,如果谷歌被迫出售 Chrome 浏览器,OpenAI 有兴趣收购。 美国司法部在“美国诉谷歌”案中提出强制谷歌剥离 Chrome 浏览器的救济措施。 此前,法官阿米特·梅塔已裁定谷歌在在线搜索领域构成垄断。
Genspark AI幻灯片工具发布,革新专业演示文稿创作
Genspark推出全新AI幻灯片工具,旨在通过人工智能简化专业演示文稿的创作流程。 据AIbase了解,该工具能够快速整合复杂多格式数据、自动生成综合报告,并支持交互式修改与多样化艺术风格,显著提升演示文稿的质量与效率。 Genspark的这一创新已在开发者与企业用户中引发热烈反响,项目详情通过Genspark官网与GitHub公开。
Nvidia 将首次在美国制造 AI 超级计算机,打造自主供应链
Nvidia 近期宣布,将在美国本土首次制造其 AI 超级计算机。 这一举措标志着该公司与一系列制造合作伙伴共同合作,旨在在美国工厂内建造、包装、测试和组装下一代 Blackwell 系统。 目前,Blackwell 芯片的生产已经在位于亚利桑那州的 TSMC 半导体制造厂展开,而超级计算机的组装则将在德克萨斯州进行,由富士康在休斯顿和纬创在达拉斯进行扩展。
Gartner报告:2027年,任务特定AI使用频率将是通用AI的三倍
根据最新发布的 Gartner 报告,到2027年,企业将使用任务特定的人工智能模型的频率将是通用大语言模型的三倍。 报告指出,尽管通用大语言模型在语言处理方面具备强大的能力,但在需要深入理解特定业务领域的任务时,它们的响应准确性会下降。 因此,越来越多的企业开始关注能够满足特定需求的定制化模型。
Character.AI 推出 AvatarFX 模型:让静态图片中的人物“开口说话”
Character.AI 近日宣布推出全新视频生成模型 AvatarFX,这一突破性技术能够将静态图片转化为具有真实感的可说话视频角色,赋予图像中的人物动态表情、唇部同步以及自然肢体动作。 AvatarFX 的核心是其最先进的基于扩散模型的动态生成技术。 该技术依托经过精心筛选的数据集进行训练,融合了创新的音频条件化、蒸馏和推理策略,使得用户能够以极高的速度生成高保真、时间一致性强的视频。
告别 AI 数据盲区!Relyance AI 新平台实现端到端流向可视化
数据治理平台提供商 Relyance AI 在去年10月获得3210万美元 B 轮融资后,推出了全新的 Data Journeys 平台,旨在解决企业采用 AI 时面临的关键挑战:准确了解数据在复杂系统中的流转。 该平台能够追踪数据在应用程序、云服务和第三方系统中的使用方式和原因,填补了传统数据沿袭方法的空白。 Relyance AI 首席执行官兼联合创始人 Abhi Sharma 强调,Data Journeys 提供了 AI 原生的、情境感知的数据全生命周期视图,从原始数据收集到每次转换和用例都清晰可见。
突发!谷歌被逼卖身,OpenAI趁机收购Chrome?十亿搜索市场大洗牌
OpenAI竟觊觎上了谷歌浏览器? 周二法庭听证会上,ChatGPT负责人Nick Turley掷地有声地宣告:若联邦法庭强制谷歌剥离Chrome,OpenAI将毫不犹豫出手收购。 图片他在法庭上作证,去年7月,OpenAI曾请求获取谷歌搜索数据开发SearchGPT,但遭到了谷歌断然拒绝。
清华&英伟达揭露ICML最佳论文隐藏数值问题,简单掩码模型是等价更好选择 | ICLR25
掩码离散扩散模型,可能并没有看上去那么厉害。 这是清华及英伟达研究人员最新提出的观点。 他们发现,作为离散扩散模型中性能最强的类别,掩码扩散模型可能有点“被包装过度”了。
“史上最快闪存技术”登Nature!复旦新成果突破闪存速度理论极限,每秒执行操作2500000000次
史上最快的闪存器件,复旦团队造! 其研发的皮秒闪存器件“破晓(PoX)”登上了Nature,擦写速度达到了亚纳秒级,比现有速度快1万倍。 并且数据不易丢失,按照实验外推结果,保存年限可达十年以上。
Transformer原作打脸DeepSeek观点?一句Wait就能引发反思,RL都不用
只要预训练,LLM就能涌现自我反思、自我纠正! Transformer首席作者Ashish Vaswani带队的新研究引来万人围观! 强化学习已证明能有效激发大语言模型的反思能力。
外媒:DeepSeek震撼世界 中国大学成为AI人才池
近年来,美国频繁渲染所谓的“中美争夺AI霸权”,尽管这一说法是否契合现实尚存争议,但不可否认的是,在美国的AI战略视野中,中国已被明确界定为核心竞争对手。 《巴伦周刊》报道称,当前美国在AI创新领域依然保持领先地位,不过中国正在快速缩小差距。 在学术研究、资本投入以及政策战略布局等关键层面,中国展现出强大的追赶态势:海量论文产出彰显科研活力,持续增长的投资为产业发展注入动力,而系统的政策支持更是为AI技术发展筑牢根基。
从Minecraft到虚幻5,AI首次实现3D游戏零样本迁移,跨游戏直接上手
该研究成果由北京大学和加州大学洛杉矶分校共同完成。 第一作者蔡少斐为北京大学三年级博士生,通讯作者为北京大学助理教授梁一韬。 该工作基于 MineStudio 开源项目,一个全流程简化版 Minecraft AI Agent 开发包,相关代码均已在 GitHub 上开源。
生成式AI进入第二幕:交大携手创智学院提出「认知工程」,AI新纪元开始了
第二幕将催生一种全新的专业:认知工程师 (Cognitive Engineers)— 专注于将人类或 AI 在各领域的深度认知提炼、结构化并转化为 AI 可学习的形式。 无论你是技术创造者还是使用者,理解这场认知革命都至关重要。 我们正在从「AI as tools」向「AI as thinking partners」转变,这不仅改变了技术的能力边界,也改变了我们与技术协作的方式。
AI也要007?Letta、伯克利提出「睡眠时间计算」,推理效率翻倍还不加钱
AI 也要 007 工作制了! 近日,AI 初创公司 Letta 和 UC 伯克利的研究人员提出了一种扩展人工智能能力的新方式 —— 睡眠时间计算(Sleep-time Compute),让模型在空闲时间「思考」,旨在提高大型语言模型(LLM)的推理效率,降低推理成本,同时保持或提升准确性。 睡眠时间计算的核心理念在于:智能体即使在「睡眠」(即用户未提出查询时的闲置状态)时段,也应持续运行,利用这些非交互期重组信息、提前完成推理。
连Claude 3.5都败下阵来,大语言模型能否定位软件服务的故障根因?
论文的第一作者是香港中文大学(深圳)数据科学学院三年级博士生徐俊杰龙,指导老师为香港中文大学(深圳)数据科学学院的贺品嘉教授和微软主管研究员何世林博士。 贺品嘉老师团队的研究重点是软件工程、LLM for DevOps、大模型安全。 大型语言模型(LLM)近期在软件工程领域取得了显著进展,催生了 MetaGPT、SWE-agent、OpenDevin、Copilot 和 Cursor 等大量研究成果与实际应用,深刻影响着软件开发的方法论和实践。
Character.AI 推出 AvatarFX 模型:AI 实现静转动,让图片角色开口说话
Character.AI 公司今天(4 月 23 日)在 X 平台发布推文,宣布推出 AvatarFX 模型,能够让静态图片中的人物“开口说话”。