语音优先

OpenAI 全新音频 AI 技术布局，智能硬件产品呼之欲出

OpenAI 全新音频 AI 技术布局，智能硬件产品呼之欲出

OpenAI 正在加大对音频人工智能模型的研发力度，旨在为即将推出的语音优先智能硬件做好技术准备。在过去两个月中，OpenAI 整合了多个工程、产品和研究团队，集中力量攻克音频交互技术，以提升语音 AI 模型在对话表现和响应能力上的表现。内部人士透露，目前的语音对话音频模型在准确性和响应速度上尚不及文本模型，因此 OpenAI 加速推进其架构升级，预计新一代音频模型将在2026年第一季度问世。

1/5/2026 9:56:49 AM AI在线

微信输入法iOS版3. 0 重磅上线： 15 种方言全覆盖，语音输入无时长限制，离线也能用

微信输入法iOS版3. 0 重磅上线： 15 种方言全覆盖，语音输入无时长限制，离线也能用

微信输入法迎来里程碑式升级。今日，其iOS版本正式推送3.0.0大版本更新——版本号直接从2.2.6跃升至3.0，标志着产品重心全面转向语音优先的下一代交互体验。新版核心聚焦语音输入能力的彻底重构，不仅底层大模型全面升级，实现“更快、更准”的识别效果，更在实用性、语言覆盖与隐私保护上迈出关键一步。

12/17/2025 4:47:15 PM AI在线

ElevenLabs隆重推出AI语音助理11ai：语音优先并支持集成MCP

ElevenLabs隆重推出AI语音助理11ai：语音优先并支持集成MCP

ElevenLabs正式发布其全新语音优先AI个人助理11ai，标志着语音AI技术在生产力工具领域的又一重大突破。作为一家以创新文本转语音和对话AI技术闻名的公司，ElevenLabs此次推出的11ai不仅集成了前沿的语音交互功能，还通过多工具集成和自定义MCP（多通道协议）支持，为用户提供了高度个性化的工作流体验。语音优先，生产力为核心11ai以语音交互为核心设计，旨在通过自然、流畅的对话提升用户的工作效率。

6/24/2025 10:00:51 AM AI在线

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉