AI
Stability AI与Arm推出手机级音频生成AI:7秒内创建11秒立体声
Stability AI和Arm联合发布了一款名为"稳定音频开放小型"(Stable Audio Open Small)的紧凑型文本转音频模型,该模型能够在约7秒内生成长达11秒的高质量立体声音频片段,且经过优化可在智能手机等移动设备上运行。 这一突破基于加州大学伯克利分校研究人员开发的"对抗相对对比"(Adversarial Relativistic-Contrastive,ARC)技术。 该模型在高端硬件如Nvidia H100GPU上的表现更为惊人,能够在仅75毫秒内完成44kHz立体声音频的生成,实现了近乎实时的音频合成能力。
5/19/2025 10:01:05 AM
AI在线
张朝阳:如果晚生 30 年,自己也会卷入到AI里面
在最近召开的2025搜狐科技年度论坛上,搜狐创始人、董事局主席兼首席执行官张朝阳,与清华大学讲席教授张亚勤及猎豹移动董事长兼 CEO 傅盛等三位科技领域的重量级嘉宾进行了深入的讨论。 论坛围绕人工智能(AI)、人形机器人和脑科学等前沿科技展开,吸引了众多关注。 图源备注:图片由AI生成,图片授权服务商Midjourney张朝阳在讨论中表示,如果晚生30年,自己也会卷入到AI里面,包括人形机器人,脑科学。
5/19/2025 10:01:05 AM
AI在线
研究:AI 聊天机器人在数据总结能力上愈加糟糕,关键细节常被遗漏
随着人工智能技术的迅猛发展,各大 AI 创业公司不断宣称其产品将工作方式和知识获取的方式。 然而,最近一项发表在《皇家学会》上的研究却揭示了新一代 AI 模型在总结文本时存在严重问题,令人担忧。 研究显示,新款 AI 聊天机器人在提供信息时,有高达73% 的概率会遗漏关键信息。
5/19/2025 10:01:05 AM
AI在线
矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省
天下苦大模型矩阵乘法久矣。 毕竟不论是训练还是推理过程,矩阵乘法作为最主要的计算操作之一,往往都需要消耗大量的算力。 那么就没有一种更“快、好、省”的方法来搞这事儿吗?
5/19/2025 9:05:00 AM
打破56年数学铁律!谷歌AlphaEvolve自我进化实现算法效率狂飙,堪比AlphaGo“神之一手”
数学能力几乎和AlphaGo的围棋水平一样? ! 这是研究员对AlphaEvolve的最新评价,就在不久之前,谷歌DeepMind联合陶哲轩等一众顶尖科学家打造了「通用科学人工智能」AlphaEvolve,直接打破了矩阵乘法领域56年以来的效率基准。
5/19/2025 9:02:00 AM
Llama 4万亿巨兽延期,80%核心元老集体辞职?
Llama 4团队约80%的人集体辞职? 昨天,来自AI明星初创Prime Intellect的机器学习研究员一则惊天爆料,彻底点燃了AI圈。 就连WSJ几天前的独家报道,也被人们翻了出来。
5/19/2025 8:57:00 AM
大模型再现黑马!英伟达开源Llama-Nemotron系列模型,效果优于DeepSeek-R1
近日,英伟达推出了 Llama-Nemotron 系列模型(基于 Meta AI 的 Llama 模型构建)—— 一个面向高效推理的大模型开放家族,具备卓越的推理能力、推理效率,并采用对企业友好的开放许可方式。 该系列包括三个模型规模:Nano(8B)、Super(49B)与 Ultra(253B),另有独立变体 UltraLong(8B,支持超长上下文)。 这些模型不仅具备超强的推理能力,还为企业使用提供开放许可。
5/19/2025 8:41:00 AM
AI遭遇生产力和营收困境,“索洛悖论”正在重演?
当全球都在热议AI时,其营收与生产力价值仍待兑现! 诺贝尔奖得主罗伯特・索洛(Robert Solow)曾提出一个计算机悖论:“你能在任何地方看到计算机的影响,唯独在生产力数据上看不到。 ”如今,这一困境正映射在AI领域——我们目睹AI技术渗透至生活各个角落,却尚未在生产力层面看到实质爆发。
5/19/2025 1:00:00 AM
小刀
Cursor 0.5 重大更新:七大新特性全面解读
近日,知名 AI 编码工具 Cursor 正式发布了 0.5 版本更新,推出了一系列值得关注的新功能。 这些改进不仅提高了开发体验,更进一步推动了 Cursor 在 AI 编码工具领域的领先地位。 接下来,将全面介绍 Cursor 0.5 版本带来的七项重要功能更新:如何更新到最新版本首先,打开 Cursor IDE 后,可在屏幕左下角看到更新提示。
5/19/2025 12:06:00 AM
前端小智
AI神论文一夜“塌房”!诺奖得主被骗,MIT紧急撤稿
没想到,AI圈的“瓜田”能精彩到这个地步。 一篇曾被寄予厚望、甚至让诺奖得主都“赞不绝口”的AI研究论文,现在被它亲妈 MIT(麻省理工学院)紧急撤稿! 图注:那篇论文的封面这事儿的主角,是一篇名为《人工智能、科学发现与产品创新》(Artificial Intelligence, Scientific Discovery, and Product Innovation)的论文,作者是MIT经济系的博士生艾丹·托纳-罗杰斯(Aidan Toner-Rodgers)。
5/19/2025 12:00:06 AM
文摘菌
OpenAI ChatGPT 被曝将支持 MCP 协议,可接入第三方 AI 服务
据社交平台 X 用户 Tibor 爆料,ChatGPT 正在测试一项“连接器设置”(Connectors settings)功能。用户可点击“自定义”(Custom)选项,添加新工具,并填写工具名称、URL 和描述等信息。
5/17/2025 2:22:46 PM
故渊
Ollama 上线自研多模态 AI 引擎:逐步摆脱 llama.cpp 框架依赖,本地推理性能飙升
Ollama推出自研多模态AI引擎,摆脱对llama.cpp的依赖,优化本地推理性能,支持大图像处理和复杂模型。新引擎引入图像处理元数据、KVCache优化等技术,联合NVIDIA等硬件巨头优化内存管理。#AI技术# #本地推理#
5/17/2025 2:10:47 PM
故渊
谷歌安卓将推新 ML Kit GenAI API,扩展端侧 Gemini Nano AI 模型访问
谷歌有望在 2025 年 I/O 开发者大会上,详细介绍这些 API。开发者利用这些 API,可以在应用中集成文本摘要、校对、改写及生成图像描述等功能。
5/17/2025 12:04:13 PM
故渊
初步研究表明 AI 无法准确预测股市
最新研究报告显示,人工智能(AI)无法预测股市。无论是基于长短期记忆网络(LSTM)还是深度神经网络(DNN)的 AI 模型,它们对股市的预测结果都错得离谱。
5/17/2025 11:46:13 AM
故渊
Build 2025:微软力荐开发者整合 AI 功能,重塑 Win11 应用生态
微软Build 2025大会将于5月20日召开,AI应用开发成为焦点。大会将展示Copilot+ PC与Snapdragon X Elite的AI能力,并推出Windows actions等新功能,提升开发者体验。#微软Build2025# #AI应用开发#
5/17/2025 10:29:07 AM
故渊
大幅提升工作效率!OpenAI 发布AI编程智能体 Codex
OpenAI在今日的线上直播中震撼发布了一款全新的云端AI编程智能体——Codex,标志着AI编程新时代的正式开启。 由Greg Brockman带领的OpenAI六人团队向全球展示了这一强大工具,它能够在半小时内完成以往可能需要数天的软件工程任务,极大地提升了开发效率。 Codex由新模型codex-1加持,这是OpenAI的o3模型的一个特调版本,专为软件工程量身打造。
5/17/2025 10:00:45 AM
AI在线
Windsurf 首款 AI 软件工程模型:SWE-1 系列登场,编程能力比肩 GPT-4.1、Gemini 2.5 Pro
Windsurf 昨日(5 月 16 日)发布博文,宣布推出其首款自研 AI 软件工程模型系列 SWE-1,涵盖功能最强的 SWE-1、轻量化的 SWE-1-lite 以及精简版的 SWE-1-mini。
5/17/2025 7:39:05 AM
故渊
资讯热榜
Microsoft Releases 700 Real AI Cases to Explore New Intelligent Work Models
微软发布 700 个真实 AI 案例,探索智能化工作新模式
Li Hang, head of ByteDance AI Lab, resigns; Seed team enters adjustment period
Former DeepSeek executive secretly starts new AI Agent project, already backed by top VC
OpenAI Upgrades ChatGPT Search Functionality to Provide More Precise and Smarter Responses
腾讯LeVo来袭!媲美Suno 4.5的AI唱歌模型,支持零样本音色克隆
Microsoft AI Unveils Code Researcher: 58% Crash Resolution Rate Stuns the Industry!
MiniMax-M1开源!1M超长上下文推理,AI新王者仅53万美元打造!
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
Meta
学习
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
开发者
生成式
蛋白质
腾讯
训练
神经网络
智能体
研究
3D
生成
苹果
计算
机器学习
Sora
Claude
AI设计
AI for Science
GPU
AI视频
人形机器人
搜索
华为
百度
场景
大语言模型
xAI
LLM
预测
伟达
深度学习
字节跳动
Transformer
Agent
工具
模态
视觉
神器推荐
具身智能
文本
RAG
LLaMA
算力
Copilot
大型语言模型
驾驶
API
应用
架构