应用
实测字节扣子空间:AI 播客比真人丝滑,Agent 能打 80% 的工
作者丨王悦编辑丨陈彩娴上个月,字节跳动旗下 Agent「扣子空间」上线之初,曾经一度被挤爆服务器,全网分享内测码。 经过一个月时间的沉淀,AI 科技评论发现了扣子空间最新上线了一个新玩法—— 一键生成播客。 相比于主打任务规划与执行的通用 Agent,AI 播客 Agent 需要的能力确实更丰富,内容理解、多模态融合、语音合成、情感表达、多角色模拟、对话逻辑等能力都不可或缺,这对多模态性能有很大挑战。
OpenAI 坚决反击马斯克:法院裁定请求毫无依据
据路透社报道,OpenAI 近日向法院提出申请,要求继续对特斯拉创始人埃隆・马斯克进行反诉。 OpenAI 在法庭文件中表示,马斯克请求驳回其反诉的动议 “毫无事实依据”。 这一案件的持续发酵,再次引发了公众的关注。
Figure完成史上最大重组:三大技术团队合并成AI核心小组Helix
人形机器人公司Figure今日宣布完成公司历史上规模最大的组织重组,CEO Brett Adcock通过推特透露,上周已将三个独立技术团队合并进新成立的AI小组Helix,旨在打破部门壁垒,加速人形机器人的商业化进程。 以AI模型命名的战略整合新成立的Helix小组以Figure三个月前推出的首个VLA(视觉-语言-行动)具身模型Felix的核心技术命名,凸显了AI在公司战略中的核心地位。 据Figure此前发布的资料显示,Helix技术在多个关键领域取得了突破性进展,专门为Figure人形机器人提供通用智能控制能力,是实现机器人自主操作的关键技术基础。
苹果联合推出 AI 交错推理方法,Qwen2.5 模型响应速度快 80%、准确率提高 19.3%
苹果公司携手杜克大学,提出交错推理(Interleaved Reasoning)的全新强化学习(Reinforcement learning,RL)方法,进一步提升大语言模型的推理能力。
Yandex 发布最大音乐推荐开源数据集 Yambda
俄罗斯搜索巨头Yandex发布全球最大音乐推荐开源数据集Yambda,含47.9亿条匿名用户交互数据,覆盖939万首歌曲,助力开发者打造智能音乐服务。数据集分三种规模,最大需85GB存储空间。#音乐科技# #AI推荐#
Anthropic 开源“思维追踪”工具,可视化揭秘 AI 内部逻辑
Anthropic 昨日(5 月 29 日)发布博文,宣布推出“电路追踪”(Circuit Tracer)开源工具,以图形化方式,追踪并展示 AI 大语言模型的内部思维过程。
谷歌联合创始人谢尔盖・布林:AI 颠覆搜索,从导航工具升级为洞见提供者
在最新访谈节目中,谷歌联合创始人谢尔盖・布林(Sergey Brin)分享了对未来人工智能(AI)的观点,他认为 AI 彻底改变在线搜索,从根本上改变“搜索”的定义。
AI“电老虎”:2025 年底预估占全球数据中心近 50% 用电量,首超加密货币挖矿
科技媒体 The Verge 今天(5 月 30 日)发布博文,报道称最新研究预测,到 2025 年年底,人工智能(AI)的能源消耗将首次超过比特币挖矿,所消耗电力占全球数据中心近一半。
手机照片一键变艺术!Runway Gen-4 References解锁相机胶卷新玩法
近日,Runway公司宣布其最新功能Gen-4References已支持移动设备,用户可通过手机相机胶卷中的照片,快速将其转化为风格一致的艺术作品。 这一功能将AI生成技术与移动端便捷性完美结合,为内容创作者和普通用户打开了全新的创作可能性。 AIbase编辑团队根据最新信息整理,为您详细解读这一令人兴奋的技术突破!Gen-4References:手机上的艺术创作革命Runway的Gen-4References功能允许用户通过上传相机胶卷中的照片,结合自然语言提示,生成风格一致的图像或视频内容。
阿里云通义灵码 AI IDE 正式上线,带来编程新体验
阿里云宣布其全新产品 —— 通义灵码 AI IDE 正式上线,用户可以在官网免费下载并立即使用。 通义灵码 AI IDE 是一款原生的人工智能开发环境,深度适配了业界领先的开源模型千问3,支持多种先进功能,为开发者提供了更高效的编程体验。 通义灵码 AI IDE 的最大亮点在于其强大的编程智能体模式。
Hugging Face 推出 HopeJR 和 Reachy Mini 两款开源人形机器人
科技媒体 TechCrunch 昨日(5 月 29 日)发布博文,报道称 AI 开发平台 Hugging Face 最新推出 HopeJR 和 Reachy Mini 两款开源人形机器人,进一步进军机器人领域。
Anthropic再放大招!Claude新功能解锁AI应用开发,AI Studio迎来新机遇
Anthropic近日宣布了一项令人振奋的更新:其旗舰模型Claude新增功能,支持开发者构建与Claude直接对话的AI应用程序。 这一突破性进展被认为与AI Studio的应用程序开发理念高度契合,为开发者提供了更广阔的创新空间。 AIbase编辑团队根据最新信息整理,为您深入解读这一技术动态及其潜在影响。
假冒阿里云AI SDK遭恶意代码渗透,AI安全供应链面临新挑战
近年来,开发者们在开放源代码组件库中愈发成为网络攻击的目标,黑客利用假冒软件包进行供应链攻击的手段不断升级,最近甚至扩展到了伪造的人工智能(AI)框架和被污染的机器学习(ML)模型。 近期,一项研究揭示了黑客通过上传伪装成阿里云 AI 实验室开发工具包的恶意软件包,成功实施了这一攻击。 研究人员在 Python Package Index(PyPI)上发现了三个恶意软件包,它们假冒了阿里云 AI 实验室的 SDK,实际上并没有任何合法功能。
Salesforce 以 80 亿美元收购 Informatica,助力 AI 发展
Salesforce,这家云软件巨头,最近宣布了一项重磅收购交易,计划以80亿美元的价格收购数据管理公司 Informatica。 这笔交易的价格较 Informatica 一年前的市场价值下降了27%,显示出两家公司在增长放缓的背景下重新谈判的必要性。 自从 Salesforce 去年推出其人工智能产品 Agentforce 以来,AI 行业的竞争愈发激烈,时间的紧迫感让这项收购显得尤为重要。
Memvid:革新AI记忆的轻量级工具,文本编码视频实现快速语义搜索
一款名为Memvid的创新AI记忆工具近日引发关注。 据官方推文介绍,Memvid通过将文本数据编码为视频格式,实现了亚秒级的快速语义搜索,为AI记忆管理带来革命性突破。 Memvid的独特之处在于其存储方式:将文本信息压缩为MP4视频文件,不仅大幅节省存储空间,还能实现快速检索,且无需联网即可使用。
未来五年,AI 可能取代一半入门级白领工作
在最近的一次采访中,Anthropic 公司的首席执行官达里奥・阿莫代伊(Dario Amodei)发出了一个引人注目的警告。 他表示,随着人工智能(AI)技术的快速发展,未来五年内,可能会有一半的入门级白领工作被取代,而失业率则可能飙升至10% 到20%。 阿莫代伊强调,许多工人并没有意识到这种变化即将到来,很多人对此感到难以置信。
Midjourney V7重磅更新:渲染速度飙升40%,新增用户投票决定功能开发
Midjourney 官方今日通过社交媒体发布三项重要更新,展示了其持续优化用户体验和社区参与的努力。 首先,Midjourney V7版本的渲染速度提升了约40%。 这一显著改进意味着用户能够更快地生成高质量图像,大幅提升创作效率。
特拉华州检察长聘请银行评估 OpenAI 的转型计划
据《华尔街日报》报道,特拉华州的检察长正在聘请一家投资银行,旨在对 OpenAI 的营利性转型计划提供咨询。 这一独立评估可能会延长 OpenAI 的转型进程,甚至可能进一步影响公司的计划。 OpenAI 的转型将有助于吸引新的投资,并最终实现上市。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉