资讯列表
OpenAI Codex 升级:语音输入和联网功能助力编程更智能
OpenAI 于6月4日宣布对其编程工具 Codex 进行了全面升级,新增了语音输入和联网能力。 这次更新不仅使得 Codex 向 ChatGPT Plus 用户开放,还大大提高了开发者的工作效率。 在新版本中,Codex 能够在执行任务时访问互联网。
OpenAI CEO 呼吁企业:AI 时代不行动就出局!
在近期举行的 Snowflake Summit 峰会上,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)向各行业的企业领袖发出了强烈的警告:在快速发展的人工智能(AI)领域,企业必须 “立即行动”。 他指出,等待技术 “稳定” 已不再是明智之选,能够快速迭代的企业将占据未来的竞争优势。 奥尔特曼强调,企业在 AI 领域的成功与否取决于其迭代的速度。
著名 AI 研究者 Yoshua Bengio 创办 LawZero,致力于开发安全的 AI 系统
Yoshua Bengio 是 Turing 奖得主,近期宣布成立非营利组织 LawZero,旨在开发安全的人工智能(AI)系统。 他的决定源于对当前 AI 发展方向的深切担忧。 LawZero 的使命是采用 “安全设计” 的方法进行 AI 研究和实施,力求在没有商业压力的环境下推进工作。
开源免费语音克隆模型ChatterBox AI,性能测试超ElevenLabs
人工智能语音技术领域迎来重大突破!加拿大初创公司Resemble AI近日发布其首款开源文本转语音(TTS)模型ChatterBox,采用MIT许可证。 这一模型以其卓越的语音克隆能力、情绪控制功能和超低延迟特性,迅速成为行业焦点,甚至在盲测中超越了知名闭源模型ElevenLabs。 ChatterBox的发布背景ChatterBox是Resemble AI在语音合成领域的最新成果,基于0.5亿参数的Llama架构,训练数据高达50万小时的精选音频。
OpenAI 宣布免费向所有 ChatGPT 用户开放记忆功能
OpenAI 在6月3日更新了其支持文档,宣布将记忆功能(Memory)免费向所有 ChatGPT 用户开放。 这一功能原本只限于 ChatGPT Plus 和 Pro 的付费用户,现在逐步扩展至登录的免费用户,旨在更好地保存和引用用户的历史对话内容。 图源备注:图片由AI生成,图片授权服务商MidjourneyChatGPT 的记忆功能允许用户的特定指令被记录,例如,用户可以选择不使用破折号等特殊格式。
DeepSeek可能使用了Google Gemini数据训练新 AI 模型
近日, DeepSeek 发布了其最新的 R1推理 AI 模型更新版,该模型在多个数学和编程基准测试中展现出色性能。 然而,DeepSeek 并未透露其模型的训练数据来源,令一些 AI 研究人员产生了疑问,并推测该模型可能部分基于 Google 的 Gemini AI 系列进行训练。 墨尔本的开发者 Sam Paeach 声称,他发现 DeepSeek 的 R1-0528模型在用词和表达方式上与 Google Gemini2.5Pro 有许多相似之处。
OpenAI升级AI智能体开发工具,支持TypeScript 、改进语音对话
OpenAI 宣布对其 AI 智能体开发工具进行了一系列重要升级。 此次更新不仅提升了平台的兼容性,还对语音界面进行了优化,同时增强了可观测性(observability),使得开发者在构建 AI 智能体时能更加得心应手。 OpenAI 为其 Agents SDK 新增了对 TypeScript 的支持。
谷歌暂停推出 AI 驱动的 “Ask Photos” 功能,以解决性能问题
根据最新消息,谷歌已经暂停了其在 Google Photos 中推出的 AI 驱动 “Ask Photos” 功能。 该功能自去年秋季以来逐步扩展,但目前并未达到预期的效果。 谷歌 Photos 的产品经理 Jamie Aspinall 在社交平台 X 上表示:“询问照片功能还未达到我们希望的水平。
蚂蚁集团推出 “AI 健康管家”,4000 万用户享受智能健康服务
近日,蚂蚁集团宣布旗下的 “AI 健康管家” 成功通过信通院的医疗健康行业大模型可信评估。 这一评估旨在确保 AI 产品在实际应用中的安全性和有效性,而 “AI 健康管家” 成为首批通过该评估的产品之一。 这一突破不仅标志着蚂蚁在医疗 AI 领域的持续探索,也为用户提供了更加可靠的健康服务。
Fish Audio发布OpenAudio S1:媲美专业配音演员的AI语音新标杆
Fish Audio正式推出其最新一代语音生成模型——OpenAudio S1,以其高度自然的声音、丰富的语气控制和强大的指令跟随能力,号称达到专业配音演员的表现力和自然度。 这一模型在TTS-Arena排行榜中荣登第一,成为文本转语音(TTS)领域的新标杆。 AIbase为您深入解析OpenAudio S1的突破性功能及其潜在影响。
Anthropic 开设一门关于使用 MCP 构建 AI 应用程序免费课程
人工智能技术的快速发展为开发者提供了无限可能,而如何高效连接AI模型与外部数据源成为行业关注的焦点。 近日,Anthropic与DeepLearning.AI合作推出了一门免费课程——“MCP:使用模型上下文协议构建富上下文AI应用”。 该课程旨在帮助开发者掌握Model Context Protocol(MCP),通过标准化协议简化AI应用与外部工具和数据的连接。
据报道,OpenAI 董事会闹剧将被改编成电影
近日,有消息称,一部描绘 OpenAI 内部风波的电影正在筹备中。 这部电影将聚焦于公司联合创始人兼首席执行官萨姆・奥特曼(Sam Altman)在短短五天内被解雇又复职的戏剧性事件。 据《好莱坞报道》指出,这部电影名为《人工智能》,由亚马逊 MGM 影业开发。
TikTok 上线 AI 智能关键词屏蔽功能:能举一反三,越用越精准
此前TikTok已允许用户通过关键词过滤器阻止特定词条的内容,这次新增的“智能过滤器”则进一步引入 AI 分析,可以自动识别和拦截含有相近词或同义词的内容。
DeepSeek 等模型训练所依赖的合成数据,BARE 提出了新思路
大家好,我是肆〇柒,在AI圈,大型语言模型(LLM)的训练对高质量、多样化数据的需求日益增长。 从去年到现在,一些模型在发布的时候,会有论文或者技术报告,里面多多少少都会提及合成数据,并且在多数情况下,合成数据的效果并不差。 比如,我所看到的报告中,使用了合成数据的模型如下盘点(应该会有遗漏,它并不完整)。
GPT-5七月上线?内部爆料+奥特曼疯狂暗示,自曝前方时刻「令人恐惧」
GPT-5,真要来了? 最近,关于GPT-5发布时间的消息,闹得是满城风雨。 多项信息来源显示,GPT-5上线的时间,就在今年7月!
超越GPT-4o!华人团队新框架让Qwen跨领域推理提升10%,刷新12项基准测试
一项新的强化学习方法,直接让Qwen性能大增,GPT-4o被赶超! 来自加拿大滑铁卢大学与TikTok新加坡,M-A-P的华人团队提出了一种全新训练框架:General-Reasoner。 结果直接让Qwen系列大模型的跨领域推理准确率提升近10%,在多个基准测试中甚至超越GPT-4o。
ChatGPT普通会员能用编程神器Codex了!支持联网,奥特曼:更多更新在路上
一觉醒来,ChatGPT又完成了一些“小”更新! 总结起来就是等等党胜利。 首先,刚发没多久的AI编程神器CodeX,现在可使用的用户群体扩展至了Plus用户。
论文秒变海报!开源框架PosterAgent一键生成顶会级学术Poster
你好研究僧,听说刚刚中了顶会,却还在愁怎么做Poster(学术海报)? 别急,容在下为你推荐一款新时代科研党神器——PosterAgent,帮你一键从paper.pdf跳转poster.pptx。 相比GPT-4o,PosterAgent生成指标更优,同时token使用量减少87%,还只需要0.0045美元,就可将22页的论文转化为可编辑的 “.pptx” 终稿海报。