应用
Meta 继续为 AI 业务“招兵买马”,计划收购声音克隆企业 PlayAI 部分资产
这笔拟议交易的内容包含 PlayAI 的技术和部分员工。交易目前尚未最终确定,仍可能发生变化。
谷歌在欧遭遇反垄断投诉,独立出版商指控“AI 概览”会损害行业
据路透社4日获得的一份文件显示,谷歌因其“AI概览”功能遭到一批独立出版商向欧盟发起反垄断投诉,并被要求采取临时措施,以防对出版商造成无法弥补的损害。
约翰斯・霍普金斯大学研发新 AI 模型,可更准确预测心源性猝死风险
美国约翰斯·霍普金斯大学开发出一款多模态人工智能模型,在识别突发性心脏骤停高风险人群方面,明显优于现行的临床指南。这一研究结果已在最新一期的《自然-心血管研究》杂志上发表。
Character.AI 突破性技术:实时 AI 角色视频互动
AI 聊天机器人平台 Character.AI 发布研究论文和视频演示,展示了名为 TalkingMachines 的自回归扩散模型,让 AI 角色互动更加逼真。
苹果发布 DiffuCode-7B-cpGRPO 编程 AI 模型:基于 Qwen2.5-7B,可不按顺序生成代码
苹果公司悄然在 Hugging Face 上发布了一款名为 DiffuCode-7B-cpGRPO 的开源 AI 模型,该模型在生成代码方面具有创新特性,能够不按顺序生成代码,且性能媲美顶级开源编码模型。
腾讯元宝再升级:一句话搜索,图片视频即刻呈现,信息获取更直观!
智能助手元宝今日宣布重磅升级其核心搜索功能,推出“一句话能搜的更多了”全新特性。 现在,用户只需简单一句提问,元宝便能智能匹配并呈现图片和视频号内容,让信息获取变得前所未有的丰富与直观。 过去,元宝已能轻松应对天气查询、股价查询、地点查找等日常需求。
脑虎科技创始人彭雷预测脑机接口未来五年五大颠覆性趋势
在2025亚布力中国企业家论坛第十一届创新年会上,脑虎科技创始人兼董事长彭雷深入探讨了脑机接口(BCI)技术的未来发展,并提出了未来五年该领域的五大新趋势,这些趋势有望彻底改变人类的生活方式和科技格局。 脑机与脊髓结合:瘫痪患者的希望彭雷指出,脑机接口与脊髓的结合将是未来一大趋势。 由于大脑和脊髓紧密相连,高位截瘫患者的脊髓损伤阻碍了神经信号的传导。
开源革命!Kyutai TTS发布:超低延迟语音合成,AI语音新纪元来袭!
近日,法国AI实验室Kyutai宣布,其全新文本转语音模型 Kyutai TTS 正式开源,为全球开发者与研究者带来了一款高性能、低延迟的语音合成解决方案。 这一突破性发布不仅推动了开源AI技术的发展,也为多语言语音交互应用开辟了新的可能性。 AIbase为您独家解析这一技术亮点及其潜在影响。
Kyutai Labs 开源 Kyutai TTS:低延迟流式文本转语音技术
7月3日,法国AI研究机构Kyutai Labs宣布开源其最新文本转语音(TTS)技术——Kyutai TTS,为开发者与AI爱好者带来高效、实时的语音生成解决方案。 Kyutai TTS以低延迟与高保真声音为亮点,支持文本流式传输,无需完整文本即可开始生成音频,特别适合实时交互场景。 Kyutai TTS在性能上表现卓越。
谷歌在全球推行全新 Veo 3 视频生成模型
谷歌宣布正式在全球范围内推出其最新的视频生成模型 Veo3。 此次发布的消息令广大用户期待已久,Veo3现已向超过159个国家的 Gemini 用户开放,提供全新的视频创作体验。 Veo3视频生成模型的特点在于其能够让用户通过简单的文本提示生成最多八秒钟的视频。
DeepMind 推出 Crome:提升大型语言模型对人类反馈的对齐能力
在人工智能领域,奖励模型是对齐大型语言模型(LLMs)与人类反馈的关键组成部分,但现有模型面临着 “奖励黑客” 问题。 这些模型往往关注表面的特征,例如回复的长度或格式,而不是识别真正的质量指标,如事实准确性和相关性。 问题的根源在于,标准训练目标无法区分训练数据中存在的虚假关联和真实的因果驱动因素。
微信支付MCP上线:AI与支付的完美结合,开启商业新纪元
近日,微信支付正式推出了 MCP功能,为 AI 应用的商业化铺平了道路。 这一举措不仅弥补了 AI 在 “赚钱” 环节的短板,还让我们看到了科技巨头在 AI 时代的战略布局。 首先,MCP 的推出为 AI 赋能的应用程序开辟了新的盈利渠道。
日立能源警告:AI 中心的电力需求波动可能威胁全球电力供应稳定
近日,世界最大变压器制造商日立能源的首席执行官安德烈亚斯・施里伦贝克(Andreas Schierenbeck)在接受《金融时报》采访时指出,随着大科技公司在训练人工智能模型时电力需求的激增,政府需要采取措施来限制这种波动,以确保电力供应的稳定。 图源备注:图片由AI生成,图片授权服务商Midjourney施里伦贝克表示,AI 数据中心的电力需求波动极其剧烈,这与传统办公数据中心截然不同。 他解释说,在启动 AI 算法进行数据处理时,电力需求可能在几秒钟内激增,使用量达到平时的十倍。
Figma 拟以约 200 亿美元估值登陆纽交所,AI 设计未来可期
位于旧金山的云端协作设计软件公司 Figma 正式向美国证券交易委员会(SEC)提交了 IPO 申请,计划以股票代码 FIG 在纽约证券交易所(NYSE)上市。 据最新消息,Figma 的目标估值约为 200亿美元,有望成为2025年最受瞩目的科技 IPO 之一。 本文由 AIbase 编辑团队整理,基于网络公开信息,深入剖析 Figma 的上市背景、技术创新与市场前景。
昆仑万维再次开源奖励模型Skywork-Reward-V2
2025年7月4日,昆仑万维乘势而上,继续开源第二代奖励模型Skywork-Reward-V2系列。 此系列共包含8个基于不同基座模型、参数规模从6亿到80亿不等的奖励模型,一经推出便在七大主流奖励模型评测榜单中全面夺魁,成为开源奖励模型领域的焦点。 奖励模型在从人类反馈中强化学习(RLHF)过程中起着关键作用。
京东物流发布自研无人轻卡“京东物流VAN”,L4级别公开道路自动驾驶
在近日举行的第十七届国际交通技术与设备展览会上,京东物流首次发布了其自主研发的无人轻卡产品——京东物流VAN。 这款无人轻卡拥有24立方米的超大载货空间,使其成为目前物流行业内载货量最大的无人轻卡,有望在物流摆渡和传站等环节取代传统的4.2米货车。 据介绍,京东物流VAN 具备高达400公里的满载续航能力,并拥有 L4级别的公开道路自动驾驶能力。
揭开大模型的秘密!那些 “思考词” 背后藏着惊人的信息量
近日,来自中国人民大学、上海人工智能实验室、伦敦大学学院和大连理工大学的研究团队揭示了大模型推理过程中的一个重要发现:当模型在思考时,所使用的 “思考词” 实际上反映了其内部信息量的显著提升。 这一研究成果通过信息论的方法,为我们更好地理解人工智能的推理机制提供了新的视角。 论文地址:,会输出一些看似人类化的语言,比如 “嗯……”、“让我想想……” 或 “因此……”。
字节跳动开源Trae-Agent,助力智能开发新体验
今日,字节跳动旗下AI原生集成开发环境(IDE)Trae宣布正式开源其核心组件Trae-Agent,为全球开发者带来全新智能编程体验。 据官方推文(@Trae_ai)透露,开发者现可通过`git clone`和`cd trae-agent`快速获取并体验这一智能开发助手。 Trae-Agent是字节跳动打造的智能开发工具,支持自然语言驱动的编程任务自动化,极大提升开发效率。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉