AI在线 AI在线

资讯列表

一天拿下3.4k star,这个1.6B开源模型火了,合成对话超逼真

如果不提前告诉你,你可能很难相信这段视频里的语音全部是 AI 生成的:这些声音来自 Dia-1.6B——一个刚刚在 𝕏、GitHub 等平台上走红的开源语音模型。 它不仅能生成说话的声音、对话,同时也能合成真实感非常强的笑声、喷嚏声和吸鼻子声等表达情绪的声音。 由于效果过于逼真,它在 GitHub 上线后不到 24 小时就收获了超过 3.4k star,现在的 star 数更是已经达到了 5.4k。
4/24/2025 9:21:00 AM
机器之心

Adam获时间检验奖!清华揭示保辛动力学本质,提出全新RAD优化器

ICLR(国际学习表征会议)是机器学习领域三大顶会之一,以推动深度学习基础理论和技术创新著称。 每年,ICLR时间检验奖都会授予近十年对深度学习领域产生深远影响的里程碑式论文。 今年这一殊荣花落Adam优化器(Adaptive Moment Estimation),该算法于2014年由OpenAI工程师Diederik Kingma和University of Toronto研究生Jimmy Ba提出。
4/24/2025 9:16:00 AM
新智元

大学文凭成废纸?AI暴击美国00后!他哥大退学成千万富翁,我却还要还学贷

摊牌了,不装了,美国的Z时代已经对上大学彻底不耐烦了。 现在,他们喊出这样的宣言:有了ChatGPT,大学文凭已经彻底成了一张废纸! 纯粹就是浪费时间和金钱。
4/24/2025 9:14:00 AM
新智元

礼貌寒暄推高AI问答成本!OpenAI每年为此多花数千万美元?

近日,美国科技公司OpenAI的首席执行官萨姆·奥尔特曼在社交平台上透露了一个令人意外的现象:用户在与ChatGPT互动时频繁使用“请”“谢谢”等礼貌用语,这一行为竟然导致公司每年需额外承担数千万美元的运营成本。 这一消息引发了广泛讨论,人们不禁好奇,为何简单的礼貌寒暄会带来如此高昂的成本? 礼貌寒暄背后的成本根据《今日美国》及美国《石英》杂志的报道,当用户在ChatGPT的用户界面说“谢谢”时,大模型会按照算法回复“不客气”。
4/24/2025 9:11:09 AM
小菲

理解 RAG 第三部分:融合检索与重新排序

我们之前介绍了什么是 RAG、它在大型语言模型 (LLM) 中的重要性,以及 RAG 的经典检索器、生成器系统是什么样的,本系列的第三篇文章探讨了一种构建 RAG 系统的升级方法:融合检索。 在深入探讨之前,值得简要回顾一下我们在本系列第二部分中探讨过的基本 RAG 方案。 融合检索解析融合检索方法涉及在检索增强生成(RAG)系统的检索阶段中融合或聚合多个信息流。
4/24/2025 9:04:42 AM
晓晓

几行代码,一窥上帝造物!帝国理工开源CAX,引爆人工生命新纪元

人工生命研究的新纪元! 「人工生命」(artificial life,或简写为ALife),旨在模拟生命的行为、特性和演化过程,理解生命的本质,涉及涌现现象、自组织系统或形态发生机制。 人工生命(ALife)的研究中,蕴含着能够推动和加速AI进步的重要启发和灵感。
4/24/2025 9:03:00 AM
新智元

OpenAI 新推出的 GPT-4.1 模型面临对齐性下降的挑战

近期,OpenAI 发布了其最新的人工智能模型 GPT-4.1,声称该模型在执行指令方面表现优秀。 然而,多项独立测试却显示,GPT-4.1在对齐性,即可靠性方面,相较于前代模型 GPT-4o 有所下降。 通常,OpenAI 会在发布新模型时附上详细的技术报告,包含安全评估的结果。
4/24/2025 9:00:53 AM
AI在线

OpenAI推ChatGPT新图像生成功能API:开发者可轻松集成 AI 绘图功能

OpenAI 在近日宣布,已将其最新的图像生成功能通过 API 开放给开发者,使其能够将这一先进的技术集成到各种应用和服务中。 这一消息无疑为开发者们提供了一个新的机遇,特别是在图像处理和创作领域。 新推出的图像生成模型名为 “gpt-image-1”,其背后支持了 ChatGPT 的图像生成技术。
4/24/2025 9:00:53 AM
AI在线

​谷歌 Gemini 月活跃用户突破 3.5 亿,仍与 ChatGPT 存在差距

根据最新的报道,谷歌的人工智能聊天机器人 Gemini 在全球的月活跃用户数已达到了3.5亿。 这一数据是在进行中的谷歌反垄断诉讼中披露的,显示了 Gemini 在过去一年中取得了显著的用户增长。 值得注意的是,Gemini 的日活跃用户也有了大幅提升,从2023年10月的900万增加到了目前的3500万,增长幅度相当可观。
4/24/2025 9:00:53 AM
AI在线

GPT-4.1 模型遭遇质疑:对齐性和稳定性引发关注

近日,OpenAI 推出了其新一代人工智能模型 ——GPT-4.1,声称在遵循用户指令方面表现优异。 然而,令人意外的是,多项独立测试的结果显示,GPT-4.1的对齐性和稳定性较之前的版本有所下降,尤其是在处理敏感话题时的表现不尽如人意。 牛津大学的研究科学家 Owain Evans 指出,经过不安全代码微调的 GPT-4.1在应对性别角色等敏感问题时,给出的回应存在更高的不一致性,这一现象在其前代模型 GPT-4o 中并不明显。
4/24/2025 9:00:53 AM
AI在线

谷歌Gemini用户暴涨至3.5亿!但仍被ChatGPT碾压

最新数据显示,谷歌AI聊天机器人Gemini全球月活跃用户已达3.5亿,展现出惊人的增长势头。 这一数据来自谷歌反垄断诉讼中披露的内部文件,揭示了AI助手市场的激烈竞争格局。  爆发式增长轨迹-2024年10月:日活仅900万-2025年3月:日活飙升至3500万- 短短5个月:用户规模增长近4倍市场格局对比尽管增长迅猛,Gemini与行业领头羊仍存在明显差距:- ChatGPT:月活约6亿- Meta AI:月活近5亿谷歌的扩张策略为快速占领市场,谷歌采取了多管齐下的推广方式:1.
4/24/2025 9:00:53 AM
AI在线

​OpenAI预测2029年收入激增至1250亿美元 2030年达30亿月活用户

OpenAI 近期发布了一项关于未来收入的预测,预计到2029年,其总收入将达到1250亿美元。 其中,AI 代理业务和渠道收入将成为主要驱动力。 根据预测,AI 代理业务将占总收入的近四分之一,预计收入将达到290亿美元,而渠道收入则预计达到250亿美元。
4/24/2025 9:00:23 AM
AI在线

从入门到精通:如何在React中构建人工智能驱动的梗图生成器

译者 | 李睿审校 | 重楼为什么要构建人工智能梗图生成器? 梗图(Meme)堪称互联网时代的“全民语言”。 无论是想调侃朋友,还是想表达编程让人崩溃的无奈,梗图总能精准地表达其意境。
4/24/2025 8:39:17 AM
李睿

OpenAI 新模型 GPT-4.1 可靠性遭质疑:独立测试显示其对齐性下降

IT之家 4 月 24 日消息,本月早些时候 OpenAI 推出了 GPT-4.1 人工智能模型,并声称该模型在遵循指令方面表现出色。 然而,多项独立测试的结果却显示,与 OpenAI 以往发布的模型相比,GPT-4.1 的对齐性(即可靠性)似乎有所下降。 据IT之家了解,通常情况下,OpenAI 在推出新模型时,会发布一份详细的技术报告,其中包含第一方和第三方的安全评估结果。
4/24/2025 8:29:59 AM
远洋

全网首曝!用 C# 调用本地大模型:Llama3 中文对话实战

在人工智能蓬勃发展的当下,大模型技术已成为众多领域的核心驱动力。 Llama3作为Meta开发并公开发布的最新大型语言模型(LLMs),凭借其卓越的性能和丰富的功能,备受开发者关注。 以往,调用大模型往往依赖云端服务,面临着网络延迟、数据隐私等诸多问题。
4/24/2025 8:20:00 AM
后端Q

OpenAI 将 ChatGPT 新图像生成技术引入 API,每张图约 2 美分起

OpenAI宣布将ChatGPT的图像生成技术引入API,开发者可集成到应用中。新模型gpt-image-1支持多风格图像生成,嵌入水印识别AI内容。多家公司已开始测试,如Figma支持图像生成编辑。#AI生成##OpenAI#
4/24/2025 8:04:09 AM
远洋

谷歌 AI 聊天机器人 Gemini 月活达 3.5 亿,与 ChatGPT 等竞品仍有差距

谷歌AI聊天机器人Gemini全球月活跃用户达3.5亿,日活用户从去年10月的900万增至3500万。但与ChatGPT的6亿月活相比仍有差距。谷歌通过与三星合作、集成到Workspace和Chrome等策略推动增长。#AI竞争# #谷歌Gemini#
4/24/2025 7:50:42 AM
远洋

消息称 OpenAI 计划今夏初发布开源语言模型,力争推理能力超越同类

消息称 OpenAI计划今夏初发布开源语言模型,推理能力或超越同类,采用宽松许可协议,避开争议。此举或为应对开源竞争对手如Meta的Llama和DeepSeek的压力。#AI开源# #OpenAI#
4/24/2025 7:40:18 AM
远洋