AI
苹果 Siri 团队大换血:AI 浪潮下,新负责人能否力挽狂澜?
彭博社今天(4 月 23 日)发布博文,报道称苹果新任 Siri 工程负责人 Mike Rockwell 正在对语音助手 Siri 的开发管理团队进行大刀阔斧的改革。
4/23/2025 6:37:21 AM
故渊
哥大退学生打造“AI作弊器”获3800万元融资,声称可以在各种场景中作弊
在当今数字化时代,人工智能技术正以前所未有的速度渗透到各个领域,从智能家居到自动驾驶,从医疗诊断到金融分析,AI 的应用场景不断拓展。 然而,技术的双刃剑特性也在某些领域引发了争议。 最近,两位哥伦比亚大学的退学生凭借一款“AI 作弊器”获得了大笔融资,再次引发广泛关注。
4/22/2025 5:25:50 PM
谷歌 Gemini 推出视频分析功能,能准确识别视频拍摄场所
近日,科技媒体 Android Authority 报道称,谷歌最新的 Gemini 聊天机器人引入了一项引人注目的新功能 —— 视频分析。 用户现在可以轻松上传视频并提问,Gemini 会基于视频内容进行智能分析,回答相关问题。 这一创新功能无疑为视频内容的处理带来了新的可能性,吸引了广大用户的关注。
4/22/2025 5:00:42 PM
AI在线
Claude竟藏着3307种「人格」?深扒70万次对话,这个AI会看人下菜碟
想象一下,如果能「偷听」70万次AI和人类的私密对话(别担心,是匿名的),会发现什么? AI仅仅是个概率机器,还是一个善于隐藏自己真实性格的——等会,AI真的有性格吗? 也许说性格不合适,现阶段的AI智能或许用「价值观」来形容最为合适。
4/22/2025 3:38:54 PM
新智元
初探谷歌 Gemini 视频解析功能,AI 准确识别视频拍摄场所
科技媒体 Android Authority 今天(4 月 22 日)发布博文,报道称谷歌 Gemini 聊天机器人被发现新增视频分析功能。用户可上传视频并提出相关问题,Gemini 能够基于视频内容进行精准分析。
4/22/2025 3:37:04 PM
故渊
「全球首个自回归视频生成大模型」,刚刚,Swin Transformer作者创业团队重磅开源!
视频生成领域,又出现一位重量级开源选手。 今天,马尔奖、清华特奖得主曹越的创业公司 Sand AI 推出了自己的视频生成大模型 ——MAGI-1。 这是一个通过自回归预测视频块序列来生成视频的世界模型,生成效果自然流畅,还有多个版本可以下载。
4/22/2025 3:34:08 PM
机器之心
「全球首个自回归视频生成大模型」,刚刚,Swin Transformer作者创业团队重磅开源!
视频生成领域,又出现一位重量级开源选手。 今天,马尔奖、清华特奖得主曹越的创业公司 Sand AI 推出了自己的视频生成大模型 ——MAGI-1。 这是一个通过自回归预测视频块序列来生成视频的世界模型,生成效果自然流畅,还有多个版本可以下载。
4/22/2025 3:34:08 PM
机器之心
142页长文揭秘DeepSeek-R1「思维大脑」!开启全新「思维链学」研究
你是否曾想过DeepSeek-R1为什么能「思考」? 距离DeepSeek-R1这只「巨鲸」引发的全球AI海啸似乎刚刚平静下来,但推理模型已经成为了AI宠儿。 不论是Gemini 2.5Pro,还是o3,o4-mini,以及所有人都在期待的DeepSeek-R2,都是推理模型。
4/22/2025 3:32:06 PM
新智元
清华特奖得主团队视频生成AI一夜刷屏!100%开源+61页技术报告,还能无限扩展生成,网友:游戏规则改变者
整整61页的技术报告中还详细介绍了创新的注意力改进和推理基础设施设计,给人一种视频版DeepSeek的感觉。 图片Magi-1将视频生成卷到了新高度,大片级品质直接锁住大家的眼球,请看VCR:其主打能力,一是无限长度扩展,实现跨时间的无缝连贯叙事:图片二是能将生成时长控制精确到每一“秒”:图片另外,Magi-1对物理规律也有更深度的理解,Physics-IQ基准测试56.02%,大幅领先一众顶流。 现在看这张图,Sora的时代是真的过去了。
4/22/2025 3:29:05 PM
日本公司为人形机器人装上“AI 鼻子”,赋予其嗅觉能力
日本Ainos与ugo合作,首次将AI鼻子系统集成到商业人形机器人中,让机器人具备嗅觉感知能力。这一技术突破将在工业、医疗和日常生活等领域带来革命性变化。#AI鼻子技术# #机器人嗅觉#
4/22/2025 2:06:46 PM
远洋
OpenAI o3 / o4-mini 模型 AI 生成文本含特殊符号,推测为隐形水印
AI 初创公司 Rumi 发现 OpenAI 公司在 o3 和 o4-mini 模型中,嵌入了窄不换行空格(Narrow No-Break Space, NNBSP, U+202F)等特殊 Unicode 字符。
4/22/2025 12:19:13 PM
故渊
AI 助手 Claude 的“内心世界”:Anthropic 新研究解密其价值观
Anthropic 公司于周一发布了一项名为“Values in the Wild”的研究,深入剖析了 AI 助手 Claude 在实际用户交互中的价值观表达。
4/22/2025 11:47:59 AM
故渊
韩国内阁通过 1.8 万亿韩元 AI 投资补充预算:一年内要买 10000 块 GPU
该预算的 80% 以上用于 GPU 购买,其它投资项目包括选拔先进 LLM 开发团队、扩大公私合作 AI 创新基金规模、支持韩国企业 NPU 商业化、招募和培养 AI 人才。
4/22/2025 11:43:29 AM
溯波(实习)
力压群雄:谷歌 Gemini 2.5 Pro 成首款完全理解 PDF 布局的 AI 模型,可精确引用
最新报告指出,谷歌旗下的 Gemini 2.5 Pro 模型能准确解析 PDF 文档的视觉结构,实现精准的视觉引用功能,成为首款能完全理解 PDF 布局的 AI 模型。
4/22/2025 11:02:14 AM
故渊
使用礼貌用语可能导致 OpenAI 每年损失数百万美元
最近,关于向人工智能聊天机器人如 ChatGPT 使用礼貌用语可能导致 OpenAI 每年损失数百万美元的新闻引发了广泛关注。 这一说法源自 OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)的一条社交媒体评论,迅速引起了众多媒体的热议。 事情的起因是一位网友在社交平台上询问阿尔特曼:“用户对 AI 说‘请’和‘谢谢’到底让 OpenAI 在电费上损失了多少?” 对此,阿尔特曼幽默地回应:“数千万美元,花得值 —— 你永远不知道。
4/22/2025 11:01:01 AM
AI在线
突破封锁!华为将发布大量AI芯片,平替英伟达H100
今天凌晨2点,路透社独家消息,华为最早将于5月份发布大量910C AI芯片,部分出货已完成。 华为此次发布产品主要是针对美国对国内AI芯片的封锁,帮助国内企业解决AI芯片短缺的难题。 因为美国政府本月要求英伟达销售H20需出口许可证。
4/22/2025 9:47:07 AM
AIGC开放社区
用任务向量做模型编辑为何有效?这篇ICLR 2025 Oral论文给出了理论分析
本文作者李宏康,博士毕业于美国伦斯勒理工大学,本科毕业于中国科学技术大学,并即将前往宾夕法尼亚大学担任博士后研究员。 研究方向包括深度学习理论、大语言模型理论等等。 本文的通讯作者为伦斯勒理工大学的汪孟教授。
4/22/2025 9:40:00 AM
机器之心
百页专业报告一次直出!Jürgen团队开源框架WriteHERE,重塑AI写作天花板
在 AI 长文写作领域,一项革命性突破正在改写行业规则 —— 由「人工智能之父」Jürgen Schmidhuber 领衔的团队,正式开源其长文写作框架 WriteHERE。 该框架凭借异质递归规划(Heterogeneous Recursive Planning)技术,实现单次生成超 4 万字、100 页专业报告的能力,在小说创作、报告生成场景中全面超越 Perplexity 付费版「深度研究」、DeepMind 的 Agent's Room 及斯坦福 STORM 等顶尖方案。 论文标题:Beyond Outlining: Heterogeneous Recursive Planning for Adaptive Long-form Writing with Language Models论文地址: & 在线 Demo: 仓库:「大纲先行」到「实时编织」现有 AI 长文生成系统(如 Agent's Room、STORM)多将写作简化为「规划 - 填充」的线性流程,而 WriteHERE 首次通过数学形式化揭示:长文写作本质上是检索(Retrieval)、推理(Reasoning)、写作(Composition)三类异构任务的动态编织。
4/22/2025 9:35:00 AM
机器之心
资讯热榜
Microsoft Releases 700 Real AI Cases to Explore New Intelligent Work Models
微软发布 700 个真实 AI 案例,探索智能化工作新模式
Li Hang, head of ByteDance AI Lab, resigns; Seed team enters adjustment period
Former DeepSeek executive secretly starts new AI Agent project, already backed by top VC
腾讯LeVo来袭!媲美Suno 4.5的AI唱歌模型,支持零样本音色克隆
OpenAI Upgrades ChatGPT Search Functionality to Provide More Precise and Smarter Responses
Luo Yonghao's digital person achieves success in its first live broadcast on Baidu e-commerce: GMV exceeds that of a real person in an hour in 26 minutes
Microsoft AI Unveils Code Researcher: 58% Crash Resolution Rate Stuns the Industry!
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
Meta
GPT
学习
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
英伟达
代码
Anthropic
芯片
开发者
生成式
蛋白质
腾讯
训练
智能体
神经网络
3D
研究
苹果
生成
计算
机器学习
Sora
Claude
AI设计
AI for Science
GPU
AI视频
人形机器人
华为
搜索
百度
LLM
场景
xAI
大语言模型
预测
伟达
深度学习
字节跳动
Agent
Transformer
工具
视觉
模态
神器推荐
RAG
具身智能
文本
LLaMA
算力
大型语言模型
Copilot
API
驾驶
应用
架构