资讯列表
TikTok 上线图生视频 AI 功能:可生成富有运动感、氛围感的创意内容
该功能仅能通过 TikTok 的故事相机使用,借助 AI 技术,它可以将静态照片转变为富有“运动感、氛围和创意效果”的短视频。
5/14/2025 3:23:00 PM
清源
微软不松手,OpenAI 不回头
OpenAI走到了一个分水岭上,正试图把自己从一个设限的实验项目,转向一个可以在资本市场独立行走的企业体。 但它不能独行。 微软挡在前头,松不开手,也不愿撒手。
5/14/2025 3:07:18 PM
文摘菌
Poe 发布 AI 模型报告:GPT-4o 独占鳌头,Gemini 推理异军突起,快手可灵黑马搅局!
AI 模型市场,就像一场不停撤掉椅子的游戏,玩家们争抢着位置。 谁坐得稳,谁被挤下,数据在说话。 Poe 平台拿出了一份报告,打开一个窗口,让我们看看 2025 年 1 月到 5 月,这个市场的风云变幻。
5/14/2025 3:06:28 PM
字节最强多模态模型登陆火山引擎!Seed1.5-VL靠20B激活参数狂揽38项SOTA
5 月 13 日,火山引擎在上海搞了场 FORCE LINK AI 创新巡展,一股脑发布了 5 款模型和产品,包括豆包・视频生成模型 Seedance 1.0 lite、升级后的豆包 1.5・视觉深度思考模型,以及新版豆包・音乐模型。 同时,Data Agent 和 Trae 等产品也有了新进展。 其中,全场最吸睛的就是豆包 1.5・视觉深度思考模型(以下称 Seed 1.5-VL)。
5/14/2025 3:05:21 PM
首个,专攻点云上下文学习自适应采样!支持点级、提示级|CVPR 2025
3D点云处理(PCP)涉及多种任务,如分割、去噪、配准、重建等,传统方法通常是为每个任务设计专用模型,导致过程繁杂、成本高昂。 虽然多任务学习(MTL)能缓解模型数量问题,但在任务冲突、参数调优方面仍存在挑战。 近年来兴起的In-Context Learning(ICL,上下文学习)技术,是指大型语言模型在不进行显式参数更新的情况下,仅通过输入中的示例(即上下文信息)来完成新的任务。
5/14/2025 3:03:45 PM
谷歌重磅AI代理即将上线!从任务到文档一键搞定,开发效率飙升3倍!
最近,谷歌正积极开发一款名为“软件开发生命周期AI代理”(Software Development Lifecycle AI Agent)的创新工具,预计未来可能集成至Gemini生态()。 该代理旨在为软件工程师提供端到端的开发支持,覆盖从任务响应到代码文档化的全流程,堪称“全天候数字同事”。 AIbase观察到,这一消息在2025年5月13日引发开发者社区热议,被认为是谷歌在AI驱动开发工具领域的又一重大布局。
5/14/2025 3:00:52 PM
AI在线
Perplexity AI将融资5亿美元,估值飙升至140亿美元挑战搜索巨头
据外媒报道,Perplexity AI正就一轮高达5亿美元的融资进行深入谈判,预计将公司估值推至140亿美元。 此轮融资由知名风险投资公司Accel领投,标志着Perplexity在AI搜索领域的迅猛崛起,旨在挑战谷歌和微软支持的OpenAI的搜索霸主地位。 AIbase观察到,这一消息引发了科技圈的广泛热议,投资者对AI重塑搜索市场的潜力表现出极高热情。
5/14/2025 3:00:52 PM
AI在线
仅20B参数!字节推出Seed1.5-VL多模态模型,实现38项SOTA
在上海举办的火山引擎 FORCE LINK AI 创新巡展上,字节跳动正式发布了最新的视觉 - 语言多模态模型 ——Seed1.5-VL。 该模型凭借其出色的通用多模态理解和推理能力,成为此次活动的焦点,吸引了众多业界专家和开发者的关注。 Seed1.5-VL 的显著特点是其增强的多模态理解与推理能力。
5/14/2025 3:00:52 PM
AI在线
Manus 母公司蝴蝶效应发布声明,否认 15 亿美元融资传闻
针对今日多家媒体报道的关于其母公司蝴蝶效应(Butterfly Effect)拟以15亿美元估值进行1亿美元融资的消息,智能体产品 Manus 今日发布官方声明,严正否认该传闻。 声明中,蝴蝶效应明确指出该融资消息**“严重失实”**,并强调公司目前正专注于产品研发和提升用户体验,以持续优化其人工智能智能体产品 Manus。 此前,有媒体报道称蝴蝶效应正在筹划新一轮融资,目标金额为1亿美元,公司估值将达到15亿美元,并声称有国资背景资金参与,融资将主要用于拓展中国市场业务。
5/14/2025 3:00:52 PM
AI在线
Anthropic 全新 AI 模型 Claude Neptune 即将亮相,竞逐市场巨头
科技媒体 testingcatalog 发透露了 AI 公司 Anthropic 正在研发的新模型 Claude Neptune 的相关信息。 目前,这一新 AI 模型已进入内部安全测试阶段,预计将与 OpenAI 的 GPT-5及谷歌的 Gemini Ultra 展开竞争。 根据博文的介绍,Claude Neptune 的安全测试正在使用 Anthropic Workbench 平台进行。
5/14/2025 3:00:52 PM
AI在线
清华大学与面壁智能发布端侧GUI Agent:AgentCPM-GUI
近日,清华大学THUNLP实验室联合面壁智能推出了一款创新的端侧GUI Agent——**AgentCPM-GUI**,为移动设备的人机交互带来全新突破。 该智能体基于**MiniCPM-V**模型构建,总参数量仅**8B**,以手机屏幕图像为输入,支持中英文操作,可自动执行用户提出的任务,展现出强大的GUI元素定位能力。 AgentCPM-GUI覆盖了包括**高德地图**、**大众点评**、**B站**、**小红书**在内的**30多个主流中文APP**,能够精准识别和操作APP界面元素,满足多样化的用户需求。
5/14/2025 3:00:52 PM
AI在线
英伟达发布新 RL 范式:受 DeepSeek-R1 启发,重塑 AI 模型外部工具能力
英伟达联合推出 Nemotron-Research-Tool-N1 系列模型,受 DeepSeek-R1 启发,采用新型强化学习(RL)范式,强化模型推理能力。
5/14/2025 2:03:30 PM
故渊
AI全自动做设计!一手实测世界首个设计Agent
说个超级有意思的事。 今天凌晨,一个 AI 设计类的垂直 Agent 工具,在 X 上爆了。 可以直接看一下他们的片子。
5/14/2025 1:49:02 PM
数字生命卡兹克
Anthropic 即推 AI 新星:Claude Neptune 安全测试收官在即,对战 GPT-5 和 Gemini Ultra
Anthropic 即将发布 Claude Neptune 新 AI 模型,目前正接受内部安全测试,可与 OpenAI 的 GPT-5,以及谷歌的 Gemini Ultra 竞争。
5/14/2025 1:45:54 PM
故渊
ICML 2025 | 如何在合成文本数据时避免模型崩溃?
随着生成式人工智能技术的飞速发展,合成数据正日益成为大模型训练的重要组成部分。 未来的 GPT 系列语言模型不可避免地将依赖于由人工数据和合成数据混合构成的大规模语料。 然而,这一趋势也带来了严峻挑战:合成数据如果不加控制地使用,可能引发 “模型崩溃”(Model Collapse)问题。
5/14/2025 1:23:19 PM
Qwen3家族训练秘籍公开:思考/非思考融进一个模型,大模型蒸馏带动小模型
Qwen3技术报告新鲜出炉,8款模型背后的关键技术被揭晓! 采用了双模式架构,一个模型同时支持推理和非推理任务,根据需要自动切换。 训练和微调过程采取分段式策略,逐步构建模型能力。
5/14/2025 1:22:08 PM
量子位
字节跳动发布新一代多模态大模型,挑战谷歌 Gemini 2.5 Pro
在人工智能领域竞争日益激烈的今天,字节跳动的 Seed 团队于5月13日正式发布了其最新的多模态大模型 Seed1.5-VL,旨在为智能体技术的进步铺平道路。 该模型经过超过3万亿 tokens 的多模态数据预训练,不仅具备强大的通用多模态理解和推理能力,还显著降低了推理成本。 与谷歌近期推出的 Gemini2.5Pro 相比,Seed1.5-VL 在性能上表现不相上下。
5/14/2025 12:00:52 PM
AI在线
国家广播电视总局积极参与人工智能技术赋能网络安全应用测试
国家广播电视总局今日发文称,为推动人工智能技术在网络安全领域的赋能应用、挖掘高应用价值网络安全业务场景、遴选优秀的人工智能技术产品,提高网络安全防护水平,日前,广电总局安全传输保障司指导监管中心作为协办单位积极参与 2025 年人工智能技术赋能网络安全应用测试活动。
5/14/2025 11:52:46 AM
归泷