资讯列表
已预览一年,OpenAI 语音克隆服务 Voice Engine 仍未正式推出
去年三月底,OpenAI 宣布了一项名为 Voice Engine(声音引擎)的人工智能服务的“小规模预览”,声称该技术能够在仅需 15 秒语音的情况下克隆一个人的声音。然而,近一年过去,这项工具仍未正式推出,OpenAI 也未透露其是否会全面上线,以及何时上线。
3/7/2025 5:00:17 PM
远洋
Docker 创始人发布 Dagger,力图开源替代 Claude Code!
Docker 的创始人所罗门・海克斯(Solomon Hykes)在社交媒体平台 X 上宣布,他可能开发出了一个开源的替代工具,以对抗 Anthropic 推出的 Claude Code。 这个新工具是 Dagger 的组成部分,Dagger 是一个用于组合工作流的开源运行时环境。 Claude Code 是 Anthropic 推出的一款智能编码工具,随 Claude3.7Sonnet 一同发布。
3/7/2025 4:51:00 PM
AI在线
OpenAI AI 安全策略遭质疑,前高管批评其“篡改公司历史”
“这篇文章大部分内容都很好,我为那些致力于其中所讨论的实质性工作的人们点赞。但我非常不满/担忧‘AGI 分步实现而非一蹴而就’这一说法,它以令人不安的方式重写了 GPT-2 的历史。”
3/7/2025 4:49:38 PM
清源
AI 基础设施投资前景不明:Marvell 股价暴跌 19.8%,创二十多年最大单日跌幅
本周四,芯片制造商 Marvell Technology 的股价收盘暴跌 19.8%,创下二十多年来的最大单日跌幅,并拖累了其竞争对手的股价。此前,该公司发布的季度收入预期虽与市场预期持平,但未能缓解投资者对 AI 基础设施支出的担忧,尤其是在生成式 AI 市场增长显示出放缓迹象的背景下。
3/7/2025 4:35:58 PM
远洋
纳米世界的实时电影,科学家首次使用AI以毫秒级分辨率观察原子移动,登Science
编辑 | 2049想象一下,如果我们能像观察夜空中闪烁的星星一样,清晰地观察到原子在材料表面的「舞动」,这将为理解材料功能打开一扇全新的大门。 然而,传统的电子显微镜技术面临着一个根本性挑战:要实现毫秒级时间分辨率的原子尺度成像,必须大幅降低电子束剂量,而这导致图像被噪声淹没,模糊了关键细节。 为了解决了这一技术瓶颈,亚利桑那州立大学(ASU)和纽约大学(NYU)的研究团队开发了一种基于无监督深度学习(Unsupervised Deep Learning)的去噪框架,实现了在温和电子束剂量下对气体环境中金属纳米颗粒表面进行毫秒级时间分辨率的原子尺度观察。
3/7/2025 4:19:00 PM
ScienceAI
佳士得首个 AI 作品拍卖会反响超预期,创收超 70 万美元
根据佳士得的说法,这次展会创收超过 70 万美元(当前约 507.3 万元人民币),许多拍品的最终成交价超出了预期的高估价。
3/7/2025 4:03:52 PM
清源
受惠新模型发布,ChatGPT 周活跃用户数不到半年实现翻倍
报告显示,ChatGPT从2023年11月的每周活跃用户1亿增长至2024年8月的2亿,花费了9个月时间;而如今,用户数在不到6个月内又实现了翻倍。
3/7/2025 3:51:26 PM
清源
Anthropic 的 Claude Code 工具存漏洞,导致部分系统“变砖”
Anthropic 最新推出的编码工具 Claude Code 遭遇了一些技术问题。据 GitHub 上的用户报告,该工具的自动更新功能存在漏洞,导致部分工作站出现不稳定甚至无法正常运行的情况。
3/7/2025 3:39:58 PM
远洋
美国计划用AI来识别支持哈马斯的外国学生并撤销签证
据路透社报道,有消息称美国国务院计划利用人工智能技术来撤销那些被视为支持哈马斯的外国学生签证。 这一消息引发了人权倡导者和言论自由支持者的广泛关注和忧虑。 根据 Axios 的报道,这项名为 “捕捉与撤销” 的计划将利用 AI 对数以万计的学生签证持有者的社交媒体账户进行审查,旨在识别潜在的支持哈马斯的言论。
3/7/2025 3:38:00 PM
AI在线
QQ音乐推出"AI音乐播客"创新功能:可以边听边懂边互动
QQ音乐近日推出了首创性的"AI音乐播客"技术功能,这一突破性技术将人工智能技术与播客形式深度融入音乐场景,通过Deepseek以及自研的琴语TTS大模型、文曲大模型等领先AI技术与多模态内容整合,为用户创造"边听歌边解读"的沉浸式体验,以技术手段进一步构建音乐新生态。 这项创新功能的核心在于三大引擎技术的深度融合,构建了从内容生成到情感传递的完整AI音乐生态链。 首先,利用DeepSeek语义引擎通过深度学习精准解析歌曲创作故事、文化背景与情感脉络,结合歌手经历、时代背景及歌词意象,将碎片化信息整合为结构化知识图谱,深化音乐内涵解读。
3/7/2025 3:36:00 PM
AI在线
5 个人三小时复刻开源版 Manus,邀请码也不需要
5人团队3小时复刻开源版OpenManus,无需邀请码。其实现依赖MetaGPT,也为Manus“套壳风波”提供新视角。关键在于生产力提升。#开源版Manus# #OpenManus# #Manus#
3/7/2025 3:27:29 PM
汪淼
“星际之门”项目启动:首个数据中心将安装 6.4 万块英伟达 GB200 芯片
据彭博社报道,OpenAI 与甲骨文公司宣布将着手在得克萨斯州阿比林市建设一处大型数据中心,并在未来数月内逐步安装数以万计的英伟达高性能 AI 芯片,以推动双方在“星际之门”(Stargate)基础设施项目中的首个设施投入运营。据知情人士透露,该数据中心预计到 2026 年底将容纳 64,000 块英伟达 GB200 芯片,首批 16,000 块芯片计划于今年夏季完成部署。
3/7/2025 3:26:44 PM
远洋
思科成立开源组织 AGNTCY,助力 AI 代理基础设施建设
近日,思科公司宣布成立一个新的开源组织 ——AGNTCY。 该组织的目标是为 AI 代理的构建和协同工作提供关键基础设施。 思科希望通过这一组织,能够集结 AI 和基础设施领域的专业人士,共同推动开放、可互操作的代理互联网的发展。
3/7/2025 2:58:00 PM
AI在线
Spark-TTS:用AI让声音“克隆”和“定制”成为现实!
在科技飞速发展的今天,人工智能已经渗透到我们生活的方方面面,从智能语音助手到各种自动化服务,AI正在以一种前所未有的方式改变我们的生活。 今天,我要给大家介绍一项超级酷炫的技术——Spark-TTS,一个基于Qwen2.5模型的高效文本转语音系统。 它不仅能“克隆”你的声音,还能根据你的需求“定制”出全新的声音!是不是听起来很神奇?什么是Spark-TTS?Spark-TTS是一种新型的文本转语音(TTS)系统,它的核心是BiCodec——一种单流语音编解码器。
3/7/2025 2:54:00 PM
AI在线
Manus 回应官方 X 账号被冻结:可能与第三方提及加密货币诈骗有关,正在对冒名者采取法律行动
今日,这两天走红的 AI 应用 Manus 在 X 平台的官方账号被冻结。Manus 联合创始人兼首席科学家季逸超今天发文称,Manus 的官方 X 账户被意外暂停,正积极与 X 的支持团队合作解决此事。初步观察表明,暂停可能与第三方提及加密货币诈骗有关,该领域与 Manus 的运营完全无关。
3/7/2025 2:44:58 PM
远洋
三小时复刻Manus!OpenManus横空出世,斩获GitHub 3000+星标
Manus的出现间接引发了开源界复刻竞赛,除了AIbase分享的CAMEL-AI0天复刻Manus通用智能体OWL以外,一个名为OpenManus的项目仅仅凭借三小时的代码量,也实现了Manus复刻。 就在昨天晚上,这个无需任何邀请即可使用的OpenManus在GitHub上横空出世,截止发稿时间,已经斩获3.3千GitHub星标,可谓是“出道即巅峰”。 其中最引人注目的莫过于那句简洁有力的宣言:“只需修改config.toml即可开玩”。
3/7/2025 2:35:00 PM
AI在线
Mistral AI 推出最强文档识别模型 Mistral OCR:革新文档理解新标杆
人工智能公司 Mistral AI 今日宣布,其最新文档识别模型 Mistral OCR 正式上线。 这一模型被誉为“地表最强 OCR”,以其卓越的性能和多功能性在 X 平台上引发热烈讨论。 Mistral OCR 支持复杂 PDF、图像、表格、数学公式及多语言文档的精确提取,并在速度和准确性上超越 Google Document AI 和 Azure OCR,成为文档处理领域的全新标杆。
3/7/2025 2:35:00 PM
AI在线
Manus回应官方X账号被冻结:与加密货币诈骗无关
Manus联合创始人兼首席科学家季逸超(Yichao Peak Ji)于3月7日在X平台发布声明,对公司官方账号(@ManusAI_HQ)被冻结一事作出回应。 声明表示该账号于前一天意外被冻结,公司目前正在积极与X团队合作解决这一问题。 季逸超在声明中指出,初步观察显示此次账号冻结可能与第三方提及的加密货币诈骗有关。
3/7/2025 2:22:00 PM
AI在线