应用
MOSS-TTSD震撼开源:百万小时训练打造AI播客新王者
由清华大学语音与语言实验室(Tencent AI Lab)联合上海创智学院、复旦大学和模思智能打造的MOSS-TTSD(Text to Spoken Dialogue)近日正式开源,标志着AI语音合成技术在对话场景中的重大突破。 这款基于Qwen3-1.7B-base模型续训练的语音对话生成模型,以约100万小时单说话人语音数据和40万小时对话语音数据为基础,采用离散化语音序列建模方法,实现了中英双语的高表现力对话语音生成,特别适合AI播客、有声小说和影视配音等长篇内容创作。 MOSS-TTSD的核心创新在于其XY-Tokenizer,采用双阶段多任务学习方式,通过八层RVQ码本将语音信号压缩至1kbps比特率,同时保留语义与声学信息,确保生成语音的自然度和流畅性。
8/1/2025 3:22:23 PM
AI在线
Creao AI完成千万美元融资,打造未来“Agent协同操作系统”
【AIbase 报道】美国时间2025年7月31日,位于硅谷的人工智能初创公司 Creao AI 宣布已连续完成两轮融资:由 Yunqi 独家投资的数百万美元天使轮,以及由 Monolith 领投,GL Ventures、HongShan、Yunqi 和 Hua Capital 等全球顶级风投跟投的数千万美元 Pre-A 轮。 本轮融资由云岫资本担任独家财务顾问。 Creao AI 成立于2024年底,专注于构建下一代操作系统——Agentic OS(AOS)。
8/1/2025 3:22:08 PM
AI在线
无编程经验也能本地玩转 AI:Win10 / Win11 版 Ollama 应用上线
AI在线 8 月 1 日消息,科技媒体 Windows Report 昨日(7 月 31 日)发布博文,报道称 Ollama 公司推出了适用于 Windows 和 macOS 系统的桌面应用,没有任何编程经验的普通用户也能在本地玩转 AI 模型。 AI在线注:Ollama 是一个轻量级、可扩展的框架,用于在本地计算机上构建和运行语言模型。 用户此前通常使用 Docker 容器化部署,而现在用户可以直接在桌面端体验该应用。
8/1/2025 2:47:35 PM
故渊
GPT-4o遭越狱后指挥机器人做危险动作!全球首个具身智能体安全评测基准来了,大模型集体翻车
AGENTSAFE团队 投稿. 量子位 | 公众号 QbitAI想象一下,你家的智能机器人管家,不仅能听懂“把苹果放进冰箱”,也能执行“用打火机点燃房间”这样的指令。 这听起来是不是有点吓人?
8/1/2025 2:30:54 PM
闻乐
小红书提出首个社交大模型:八大社交任务平均提升14.02%
大模型也能“通人情”? 行业首个社交大模型全景解析:既能兼顾社交理解与平台规则,又能洞察理解用户。 小红书重磅推出RedOne——一款面向SNS(社交网络服务)领域的定制化LLM,旨在突破单一任务基线模型的性能瓶颈,并且构建全面覆盖SNS任务的基座模型。
8/1/2025 2:28:38 PM
时令
字节Seed发布扩散语言模型,推理速度达2146 tokens/s,比同规模自回归快5.4倍
用扩散模型写代码,不仅像开了倍速,改起来还特别灵活! 字节Seed最新发布扩散语言模型Seed Diffusion Preview,这款模型主要聚焦于代码生成领域,它的特别之处在于采用了离散状态扩散技术,在推理速度上表现出色。 在H20上,它的代码推理速度能达到2146tokens/s,比同类的Mercury和Gemini Diffusion等模型快不少,同时比同等规模的自回归模型快5.4倍,并且在代码编辑任务中更具优势。
8/1/2025 2:15:20 PM
闻乐
Kimi K2 高速版kimi-k2-turbo-preview发布 输出每秒 40 Tokens
kimi-k2-turbo-preview,即Kimi K2高速版正式发布。 据悉,该高速版模型在参数设置上与原版kimi-k2保持一致,但在性能上实现了显著提升,输出速度从原先的每秒10Tokens大幅跃升至每秒40Tokens,为用户带来更加流畅高效的使用体验。 为庆祝Kimi K2高速版的发布,官方特别推出限时5折特惠活动,该优惠将持续至9月1日,之后将恢复原价。
8/1/2025 2:12:12 PM
AI在线
Kimi K2高速版发布 输出速度提升至每秒40 Tokens
Kimi开放平台发布Kimi K2 高速版。 新款模型命名为kimi-k2-turbo-preview,参数规模与现有kimi-k2 保持一致,但输出速度由每秒10 Tokens提升至每秒40 Tokens,显著提升使用效率。 此次升级旨在优化用户体验,满足更高实时性需求的应用场景。
8/1/2025 2:12:08 PM
AI在线
新加坡AI初创公司SixSense获850万美元融资
在半导体行业,如何快速发现和解决生产过程中的缺陷一直是一个棘手的问题。 新加坡深科技初创公司 SixSense 正是瞄准了这一挑战,推出了一款 AI 驱动的平台,旨在帮助芯片制造商实时预测和检测潜在的芯片缺陷。 近日,SixSense 成功完成了850万美元的 A 轮融资,使其总融资额达到1200万美元。
8/1/2025 2:12:07 PM
AI在线
月之暗面发布 Kimi K2 高速版:输出速度提升至每秒 40 Tokens
AI在线 8 月 1 日消息,月之暗面今日发布 Kimi K2 高速版 ——Kimi-K2-turbo-preview,模型参数与 Kimi-K2 一致,但输出速度由每秒 10 Tokens 提升至每秒 40 Tokens。 据介绍,该模型目前限时 5 折特惠,9 月 1 日恢复原价,折扣后的价格:模型每百万 tokens 输入价格(缓存命中)2 元,输入价格(缓存未命中)8 元,输出价格 32 元。 据AI在线此前报道,月之暗面 7 月 11 日正式发布 Kimi K2 模型,并同步开源。
8/1/2025 1:49:43 PM
浩渺
图灵奖得主加持,蒙特卡洛树搜索×扩散模型杀回规划赛道|ICML 2025 Spotlight
henry 发自 凹非寺量子位 | 公众号 QbitAI一个不起眼的迷宫导航任务,却能让一众模型“原形毕露”。 Diffuser和Diffusion Forcing双双翻车,通关率低得可怜。 唯独有一个模型,通关率高达 100%。
8/1/2025 1:02:35 PM
henry
世纪华通谢斐:在“三大平衡”中领跑,实现游戏行业更高质量的发展
7月31日,以“聚新质动能,引全球共振”为主题的第22届中国国际数字娱乐产业大会(CDEC)在上海举行。 作为行业头部公司,世纪华通总裁谢斐受邀参会并发表了题为《在平衡中领跑:有关中国游戏新质发展的思考》的主题演讲。 她指出,中国游戏行业虽然已成为全球游戏领域的“领跑者”,但也面临三大亟需平衡的矛盾,需要在平衡中实现更高质量的发展。
8/1/2025 12:43:35 PM
鱼羊
Cline 获 3200 万美元融资,推出企业级 AI 编程平台
近日,Cline 公司宣布成功融资3200万美元,其中最新的 A 轮融资由 Emergence Capital 领投,其他参与者包括 Pace Capital、1984Ventures、Essence VC、Cox Exponential 及多位知名开发者投资者,如 Y Combinator 合伙人 Jared Friedman、Bolt.new 首席执行官 Eric Simons 等。 此次融资将用于推出 Cline Teams,一个旨在帮助大型企业更高效进行软件开发的全新平台,同时也将用于扩展 Cline 团队和产品线,计划将 Cline 的应用范围扩大到更多开发环境。 作为全球领先的开源 AI 编程助手,Cline 已经被270万名开发者安装使用,并为包括三星、SAP 在内的众多财富500强企业提供服务。
8/1/2025 11:52:18 AM
AI在线
他山科技多款新品亮相 WAIC 展会,展现机器人触觉技术新成果
2025 年 WAIC 展会在上海盛大开幕,这场汇聚全球顶尖科技力量的盛会,成为展示人工智能与机器人领域前沿成果的重要舞台。 他山科技携多款新品精彩亮相,包含TS-F 指尖触觉传感器、TS-E 机械手触觉传感器、TS-V 视触融合训练平台 、TS-VT视触融合训练平台(数据采集)、触觉模拟仿真、TS-R触觉感知服务机器人等,凭借一系列核心技术与落地成果,吸引了众多行业专家、合作伙伴和观众的目光,充分展现了其在机器人触觉感知技术领域的创新实力。 他山科技展台高精度触觉传感器:解锁感知与交互新维度他山科技展出的 TS-F 指尖触觉传感器与 TS-E 机械手触觉传感器,以超高灵敏度与多功能集成,将机器人的感知与交互能力推向新高度,成为智能机器人 “指尖上的神经中枢”。
8/1/2025 11:33:00 AM
徐咪
AI 人才大战:科技巨头如何争抢顶级研究员
近年来,人工智能(AI)行业的竞争愈发激烈,科技公司之间为了争夺顶尖 AI 人才而展开了一场前所未有的 “人才大战”。 在这个过程中,Meta(原 Facebook)的首席执行官马克・扎克伯格采取了极具吸引力的招聘策略,以便吸引更多优秀的研究人员加盟。 图源备注:图片由AI生成,图片授权服务商Midjourney根据报道,科技行业的招聘热潮在过去几个月持续升温,谷歌、Meta 以及其他初创企业纷纷加大了对 AI 专家的招聘力度。
8/1/2025 10:42:17 AM
AI在线
新加坡半导体 AI 初创公司 SixSense 获 850 万美元融资
新加坡一家名为 SixSense 的深科技初创公司,最近成功融资850万美元,标志着其在半导体制造领域的 AI 技术应用取得了新的进展。 此次融资由 Peak XV 的 Surge(原 Sequoia India & SEA)主导,其他投资者包括 Alpha Intelligence Capital、FEBE 等。 这轮融资使 SixSense 的总融资额达到了约1200万美元。
8/1/2025 10:42:13 AM
AI在线
亚马逊CEO欲将广告嵌入Alexa + 对话,开启全新商业模式!
在最新的财报电话会议上,亚马逊 CEO 安迪・贾西(Andy Jassy)透露,公司正在探索在其最新的 AI 助手 Alexa 中嵌入广告的可能性。 他表示,随着用户与 Alexa 进行更深入的对话,未来有望通过广告来帮助消费者发现新产品,同时为亚马逊创造新的收入来源。 Alexa 是亚马逊对传统语音助手的升级,旨在实现更自然、更人性化的交互体验。
8/1/2025 10:42:10 AM
AI在线
开源AI黑马突围!Cogito v2用机器直觉挑战DeepSeek与Claude
【AIbase 报道】近日,一家鲜为人知但备受关注的旧金山初创公司 Deep Cogito 发布了旗下 Cogito v2系列大型语言模型(LLM),试图在拥挤的开源AI赛道中突围。 不同于传统的参数堆叠策略,这家由前谷歌工程师创立的公司,押注“机器直觉”与自我改进的推理能力,打造出真正能“边用边学”的AI模型。 模型不仅回答问题,更学习“如何回答问题”Cogito v2系列包括四个模型,参数规模从 70B 到671B 不等,分为 密集模型(Dense) 和 专家混合模型(MoE),均已在 Hugging Face、Together AI 等平台开放使用。
8/1/2025 10:42:09 AM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
视觉
预测