应用
Meta FAIR最新五大AI感知突破:从3D对象定位到协作推理,开源助力产业升级
Meta人工智能研究团队(FAIR)近日公开发布五项前沿研究成果,标志着AI感知领域的重大突破。 这些开源项目从视觉编码器到3D空间理解,再到协作式推理框架,共同构建了通向高级机器智能(AMI)的关键路径,为未来AI如何理解和感知世界带来全新可能。 "机器之眼"再升级:Meta感知编码器引领视觉理解新标准Meta感知编码器(Perception Encoder)作为大规模视觉编码器,在图像和视频处理领域显示出卓越能力,成为AI系统的"眼睛"。
5/9/2025 12:01:52 PM
AI在线
音频同步与视频编辑!腾讯混元开源一致性视频生成工具HunyuanCustom
腾讯开源的一致性视频生成工具 “HunyuanCustom”,该模型不仅能生成生动的视频内容,还能实现音频与口型的同步。 这一创新技术的发布,标志着在深度伪造视频领域的一次重要进步。 一图生成,深度伪造不再遥远HunyuanCustom 的最大亮点在于用户只需提供一张图像,就能创造出深度伪造风格的视频。
5/9/2025 12:01:52 PM
AI在线
Netflix 推出 GPT 驱动的自然语言搜索功能,仅限 iOS 用户
Netflix 宣布推出一项全新的搜索功能,采用 OpenAI 的 ChatGPT 技术,旨在让用户能够使用自然语言进行内容搜索。 用户可以通过简单的短语,如 “我想看一些搞笑的,但不要太傻” 来寻找适合的影片,而无需再输入具体的标题或关键词。 这一功能目前正在 iOS 设备上进行测试,早期测试已在澳大利亚和新西兰展开。
5/9/2025 12:01:51 PM
AI在线
腾讯混元视频生成工具 HunyuanCustom 宣布开源,融合文本、图像、音频、视频等多模态输入生视频的能力
腾讯表示,Hunyuan Custom 模型能实现单主体视频生成、多主体视频生成、单主体视频配音、视频局部编辑等能力,其生成的视频与用户输入的参考主体能保持高度一致。
5/9/2025 11:48:35 AM
问舟
商汤坐上大模型核心牌桌
过去两年,关于大模型的讨论视角很少从商汤这样成立不过十年、资源与技术积累正当青壮年的人工智能公司出发。 造成这一现象的主要原因是两个技术周期的迥异:2023 年之前,商汤的人工智能技术路径以计算机视觉模型为主,不同于 ChatGPT 为代表的新技术浪潮:以自然语言处理为主、大规模参数模型为核心。 一个是视觉、一个是语言,在外界看来两个赛道还没有发生直接的关系。
5/9/2025 11:42:00 AM
陈彩娴
Pinterest 凭借 AI 驱动个性化推荐实现 16% 收入增长
在刚刚过去的第一季度,Pinterest 发布了强劲的财报,收入达到了8.55亿美元,同比增长了16%。 与此同时,活跃用户数也稳步增长,达到5.7亿,较去年同期增加了10%。 Pinterest 首席执行官比尔・瑞迪在电话会议上表示,这一增长的主要原因在于公司对人工智能(AI)的持续投资,尤其是在吸引 Z 世代用户方面取得了显著成效。
5/9/2025 11:04:21 AM
AI在线
重磅突破!ICEdit推出LoRA尺度修改功能:AI图像编辑迎来精细控制新时代
备受瞩目的AI图像编辑工具ICEdit迎来重大更新,其Hugging Face演示空间正式上线LoRA尺度修改功能,为全球创作者带来前所未有的图像精细控制体验。 这一革命性功能允许用户通过简单调整LoRA权重,实现对编辑强度与效果的灵活掌控,大幅提升创作自由度。 AIbase观察到,此次升级显著增强了ICEdit在多任务图像编辑领域的核心竞争力,迅速吸引了全球开发者和创意人士的热切关注。
5/9/2025 11:04:21 AM
AI在线
微软为华盛顿州科研项目颁发AI公益奖,助力健康与可持续发展
在庆祝公司成立50周年之际,微软公司于4月29日宣布了 “AI for Good” 奖项,旨在利用人工智能技术来应对社会和科学领域的挑战。 此次奖项共颁发给20个来自华盛顿州的多样化实体,UW 医学中心的多个研究机构获得了其中的三项大奖。 在西雅图的 UW 保罗・艾伦计算机科学与工程学院的颁奖典礼上,微软同时向华盛顿州立大学的计算与工程信息通信技术实验室颁发了奖项。
5/9/2025 11:04:21 AM
AI在线
路透社总裁谈新闻行业与人工智能的未来
在当今快速变化的媒体环境中,路透社总裁保罗・巴斯科伯特(Paul Bascobert)分享了他对新闻行业与人工智能(AI)关系的看法。 作为一家自1851年成立的新闻和信息服务公司,路透社经历了无数技术变革,而现在,面对智能手机和生成式 AI 的崛起,新闻传播的模式也在不断演变。 巴斯科伯特指出,尽管媒体行业在数字化浪潮中面临诸多挑战,但路透社正努力适应新的传播环境。
5/9/2025 11:04:21 AM
AI在线
开源社区新添利器:DeerFlow深度研究框架融合AI与专业工具
DeerFlow,一个由社区驱动的全新深度研究框架日前发布,旨在将语言模型与专业工具相结合,为开源社区提供强大的自动化研究解决方案。 这款基于LangGraph构建的模块化多智能体系统,秉持"源于开源,回馈开源"的理念,为研究人员和开发者提供了一套完整的工具链。 DeerFlow的核心优势在于其全面的功能整合。
5/9/2025 11:04:20 AM
AI在线
告别对话断层:Mem0动态存储技术实现AI代理记忆永续
Mem0 研究团队近日发布突破性内存架构,旨在解决AI系统在长期对话中的"健忘症"问题。 名为Mem0 和Mem0g的两种新型内存系统,能让大型语言模型(LLM)在数周甚至数月的对话中保持连贯一致性,实现更接近人类的记忆能力。 传统AI系统受限于固定上下文窗口,无法在长期交互中有效记忆关键信息。
5/9/2025 10:01:50 AM
AI在线
苹果加速智能眼镜芯片研发,瞄准人工智能和未来 Mac 设备
苹果公司正积极推动其晶硅设计团队开发新一代芯片,这些芯片将为未来的设备提供核心处理能力。 其中包括苹果首款智能眼镜、性能更强的 Mac 电脑以及专门针对人工智能(AI)应用的服务器。 这一举措显示出苹果在智能眼镜领域的雄心,意在与 Meta Platforms Inc.
5/9/2025 10:01:50 AM
AI在线
Meta任命前谷歌DeepMind主管为AI研究实验室新负责人
根据彭博社的报道,Meta 公司已任命 Robert Fergus 为其基础 AI 研究实验室(FAIR)的新负责人,接替于四月宣布离职的 Joelle Pineau。 Fergus 在担任 Meta 新职务之前,曾在 Google DeepMind 工作了约五年,担任研究总监。 在此之前,他还曾在 Meta 担任研究科学家。
5/9/2025 10:01:50 AM
AI在线
成本降低88%:阿里巴巴ZeroSearch技术颠覆AI训练模式
阿里巴巴集团研究人员近日推出一项名为"ZeroSearch"的突破性技术,彻底改变了训练人工智能系统搜索信息的方式。 这项创新技术通过模拟方法让大型语言模型(LLM)开发高级搜索功能,无需在训练过程中与真实搜索引擎交互,从而消除了对昂贵商业搜索引擎API的依赖。 解决成本与复杂性难题ZeroSearch解决了AI行业面临的两大关键挑战:搜索引擎返回文档质量的不可预测性,以及向谷歌等商业搜索引擎进行数十万次API调用所产生的高昂成本。
5/9/2025 10:01:50 AM
AI在线
美国计划放宽 AI 芯片出口限制:多国将受益
根据《华尔街日报》的报道,特朗普政府计划对拜登时代设定的人工智能(AI)芯片出口规则进行调整,放宽对多个国家的出口限制。 此项新规将取消对印度、瑞士、墨西哥和以色列等国在购买先进芯片时的数量上限。 这一变化预计将对 NVIDIA 等科技公司产生积极影响,NVIDIA 的股票在相关消息发布后上涨了3%。
5/9/2025 10:01:50 AM
AI在线
OpenAI 推出 GitHub 连接器,ChatGPT 深度研究工具迎来新功能
OpenAI 宣布对其 AI 驱动的 “深度研究” 工具进行升级,新增 GitHub 连接器。 这一功能旨在帮助开发者更有效地分析代码库和工程文档,能够解答与代码相关的问题。 根据 OpenAI 的介绍,该连接器现已处于测试阶段,将为 ChatGPT Plus、Pro 和 Team 用户提供,未来也将推出 Enterprise 和 Edu 版本的支持。
5/9/2025 10:01:50 AM
AI在线
秘塔AI搜索上线“讲题”功能 降低家长辅导门槛
近期,面对家长在辅导孩子作业时普遍遭遇的“知识焦虑”与“时间压力”,AI秘塔公司研发的“塔子老师讲题”功能正式上线。 该功能嵌入“今天学点啥”首页,通过AI技术实现题目自动识别与解题步骤可视化讲解,旨在降低家长辅导门槛,缓解教育场景中的亲子压力。 据AI秘塔团队介绍,该功能覆盖小学至成人考证全学段题目,支持拍照上传后自动解析。
5/9/2025 10:01:49 AM
AI在线
Google Gemini API迎来隐式缓存功能 自动节省开发成本高达75%
近期,Google 宣布在其 Gemini API 中推出一项新功能 —— 隐式缓存。 这一功能旨在帮助第三方开发者在使用最新 AI 模型时节省成本,最高可达75% 的费用节约,尤其是在处理重复性上下文时效果显著。 隐式缓存的工作原理隐式缓存的核心在于,它能够自动识别并重用之前请求中相似的内容。
5/9/2025 10:01:42 AM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
Copilot
视觉