应用
Qwen-TTS重磅发布:方言语音合成新突破,真实感媲美真人
昨日,阿里巴巴通义团队正式推出了Qwen-TTS模型,这款文本转语音(TTS)模型以其超高真实感和多方言支持引发行业热议。 AIbase编辑团队整理最新信息,为您深入解析这款通过Qwen API提供服务的语音合成利器,及其在AI语音技术领域的突破性意义。 Qwen-TTS:超真实语音合成Qwen-TTS是通义团队基于大规模语音数据集研发的最新文本转语音模型,通过数百万小时的语音训练,生成的声音在自然度、韵律、节奏和情感表达上达到了极高水平。
7/1/2025 12:00:51 PM
AI在线
TEN Agent开源TEN VAD与Turn Detection,助力语音AI超低延迟
TEN Agent团队近日宣布,其核心模型**TEN Voice Activity Detection (VAD)**和**TEN Turn Detection**正式开源,为构建实时、多模态的语音AI代理提供了强大的技术支持。 这一举措标志着TEN框架在推动语音交互技术民主化与开源协作方面的重大进展。 以下是AIbase整理的最新资讯,深入解析这两大核心模型的功能、优势及对行业的潜在影响。
7/1/2025 12:00:51 PM
AI在线
字节发布创新图像合成技术XVerse:对多个个体进行独立且精确的控制
近日,字节 正式发布其最新图像合成技术 ——XVerse,旨在提供高精度的多主体图像生成解决方案。 这项创新的技术使得用户能够对多个个体进行独立且精确的控制,极大地提升了个性化和复杂场景生成的能力。 XVerse 的核心在于其独特的 DiT 调制方法,能够在不影响整体图像潜在特征的情况下,对每个主体的身份和语义属性进行调控。
7/1/2025 11:00:51 AM
AI在线
Chai Discovery发布Chai- 2 模型:零样本抗体设计突破16-20%命中率
Chai Discovery于2025年6月30日推出全新AI模型Chai-2,标志着抗体设计领域的重大突破。 Chai-2以零样本抗体设计能力著称,实验命中率达16-20%,远超传统方法的0.1%行业标准,为生物制药研发注入新动力。 Chai-2采用多模态生成架构,整合全原子结构预测与生成式建模,可在仅提供目标结构和表位的情况下,从头设计抗体的互补决定区(CDR)。
7/1/2025 11:00:51 AM
AI在线
AI动画神器ManimML:解锁Transformer架构的直观可视化
随着人工智能技术的飞速发展,复杂的机器学习模型如Transformer架构逐渐成为研究和应用的热点。 然而,如何将这些抽象的概念以直观的方式呈现给大众,成为了技术传播中的一大挑战。 近日,AI动画库ManimML引发广泛关注,其强大的可视化功能让复杂的神经网络架构变得通俗易懂。
7/1/2025 11:00:51 AM
AI在线
Cursor发布Web版,AI编码工具扩展至浏览器与移动端
据AIbase报道,Anysphere于2025年6月30日推出Cursor Web版及移动版,将AI编码代理从桌面IDE扩展至浏览器和移动设备,为开发者提供更灵活的编程体验。 这一更新标志着Cursor在AI编码领域的重大突破。 Cursor Web版通过cursor.com/agents支持开发者在桌面、平板或手机上管理多个AI编码代理,涵盖代码审查、错误修复和功能构建等任务。
7/1/2025 11:00:28 AM
AI在线
OpenAI:正对谷歌 TPU 进行早期测试,暂无大规模部署计划
AI 硬件从实验室测试到大规模商用部署间仍有一段路要走。OpenAI 也在开发自研 AI ASIC。
7/1/2025 10:27:05 AM
溯波(实习)
Cursor手机版震撼发布!随时随地编码,开发者迎来新自由
人工智能驱动的编程工具Cursor近日迎来重大更新,正式推出Web版与移动版支持,为开发者带来全新的移动端编程体验。 这一突破性进展打破了传统桌面端限制,让编程工作更加灵活高效。 以下是AIbase整理的最新资讯,带您深入了解Cursor手机版的亮点与影响。
7/1/2025 10:01:02 AM
AI在线
甲骨文受到云计算和大模型影响,股价飙升创历史新高
甲骨文公司(Oracle)近日公布的一项云计算重磅交易,预计将为其每年带来逾300亿美元的收入,消息一出,公司股价随即上涨4%,并创下历史新高。 根据提交给美国证券交易委员会(SEC)的文件,首席执行官萨弗拉·卡兹(Safra Catz)预计将在周一的公司会议上正式宣布这项备受瞩目的交易。 该交易的收入预计将从2028财年开始体现在甲骨文的财报中。
7/1/2025 10:01:01 AM
AI在线
苹果 AI 团队遭遇动荡:顶尖研究员离职引发信任危机
最近,苹果公司在人工智能领域面临了一场不小的风波。 一位重要的高级研究员汤姆・冈特(Tom Gunter)在公司工作八年后选择离职,这一消息引发了内部的广泛关注。 冈特在大型语言模型方面的专业知识被认为是无可替代的,尤其是在当前竞争对手如 Meta 和 OpenAI 都在通过高额薪资挖角人才的情况下。
7/1/2025 10:01:01 AM
AI在线
谷歌全新 “Gemini 教育项目” 助力校园 AI 应用,教师学生皆受益!
在最新的国际教育技术协会(ISTE)年会上,谷歌宣布了一项令人振奋的新计划 ——“Gemini for Education”。 这一项目旨在为教师和学生提供强大的人工智能工具,助力教育的发展。 谷歌表示,这款 Gemini 教育版本将免费集成到现有的教育方案中,确保学校无需支付额外费用即可使用其高级的 Gemini2.5Pro 模型。
7/1/2025 10:01:01 AM
AI在线
特斯拉全自动驾驶交付视频震撼发布:从工厂到客户家全程无人驾驶!
特斯拉再次引领汽车行业技术革命!近日,特斯拉发布了全球首个人工智能(AI)全自动驾驶(FSD)从工厂到客户家中的交付视频,展示了其自动驾驶技术的最新突破。 这段全程17英里、约30分钟的无人驾驶旅程,跨越停车场、高速公路和城市道路,最终将车辆精准送达新车主家中。 全程无人驾驶,技术里程碑特斯拉此次发布的视频展示了其FSD系统在真实场景中的惊人表现。
7/1/2025 10:01:01 AM
AI在线
特斯拉首次实现客户车辆“自动驾驶交付”,奥斯汀之路挑战重重
在奥斯汀推出有限的自动驾驶出租车服务仅几天后,特斯拉再次展示了其自动驾驶软件的最新进展。 一辆 Model Y SUV 在无人干预的情况下,完成了从特斯拉工厂到新车主公寓楼的约15英里行程,首席执行官埃隆·马斯克称之为首次客户汽车“自动驾驶交付”。 据称,这辆 Model Y 搭载了与特斯拉奥斯汀自动驾驶出租车相同的软件,但在交付时被降级为市售的全自动驾驶(监督)软件,该软件要求驾驶员保持专注并随时准备接管。
7/1/2025 10:01:01 AM
AI在线
英特尔助力百度文心大模型 4.5,实现端侧部署
6月30日,百度正式开源了其最新的文心大模型4.5系列,包含了多达10款模型,其中包括47B 和3B 激活参数的混合专家模型(MoE)以及0.3B 参数的稠密型模型。 这次开源不仅让开发者能够免费使用这些强大的模型,还提供了预训练权重和推理代码,方便开发者进行各种应用。 而在此次发布中,英特尔也展现了其强大的技术支持。
7/1/2025 10:01:01 AM
AI在线
OpenAI 澄清与谷歌芯片传闻:并无大规模合作计划
美国人工智能初创公司 OpenAI 近日对外发布声明,否认了媒体有关其计划采用谷歌自研芯片的报道。 这一声明是在媒体两天前的相关消息引发广泛关注后发布的。 OpenAI 的一位发言人在周日表示,尽管该公司正在对谷歌的张量处理单元(TPU)进行早期测试,但目前并没有大规模使用这些芯片的打算。
7/1/2025 10:01:01 AM
AI在线
苹果或放弃自研,急寻OpenAI与Anthropic助力Siri升级
近日,有消息透露,苹果公司正在与 OpenAI 和 Anthropic 进行洽谈,计划在即将推出的新版本 Siri 中采用他们的人工智能技术。 这一转变意味着苹果可能会在 AI 领域寻求外部帮助,显著改变其长期以来依赖自主研发技术的战略。 目前,苹果的 AI 功能主要基于其自研的 “苹果基础模型”,预计将在2026年推出一款全新的语音助手。
7/1/2025 9:00:51 AM
AI在线
Qwen-TTS新版发布 新增支持生成三种中文方言
近日,一款名为Qwen-TTS的语音合成模型有了新进展,其通过Qwen API完成了最新版本的更新,为用户带来了更加丰富的语音合成体验。 此次更新中,Qwen-TTS新增了对三种中文方言的支持,分别是北京话、上海话和四川话,进一步拓宽了其应用场景。 该模型依托超过300万小时的大规模语料库进行训练,合成效果达到了人类级别的自然度和表现力。
7/1/2025 9:00:51 AM
AI在线
Meta 或将弃用自研 Llama AI,转向竞争对手
近期,Meta Platforms 面临重大决策,将可能放弃其自家研发的 Llama AI 模型,转而采用 OpenAI 和 Anthropic 等竞争对手的人工智能系统。 这一变化反映了 Meta 在开源 AI 战略上的重大调整,也显示了公司对自身产品表现的不满。 事情的转折点出现在 4 月份的 Llama 4 发布会上,该产品在 Meta 主办的 LlamaCon 活动上并未获得开发者们的积极反馈。
7/1/2025 9:00:51 AM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
Copilot
视觉