音视频

万兴科技再升级！音视频多媒体大模型 2.0 震撼发布

万兴科技再升级！音视频多媒体大模型 2.0 震撼发布

在快速发展的人工智能领域，万兴科技再次引领潮流，正式发布了万兴天幕音视频多媒体大模型2.0。这个升级版的大模型不仅进一步提升了音视频处理的能力，更为用户提供了更加智能和便捷的多媒体应用体验。万兴科技的这一创新产品被广泛认为是提升内容创作效率和质量的游戏规则改变者。

6/23/2025 12:00:38 PM AI在线

阿里大模型产品“通义听悟”升级：超长视频自由问，还会做思维导图

阿里大模型产品“通义听悟”升级：超长视频自由问，还会做思维导图

感谢今日阿里大模型产品“通义听悟”发布多项新功能，上线音视频问答助手“小悟”、一键 AI 改写、思维导图生成等六大功能。通义听悟接入通义千问大模型，融合了十多项 AI 功能，包括转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT 提取等，并支持标重点、记笔记。通义听悟本次升级上新了六大功能点，其中最重磅的是音视频问答助手“小悟”，关键信息直接“问”出来。小悟通过多语言 Query 处理、长篇章文本理解、指令演化框架优化及检索增强生成算法，在业内首次实现对超长音视频的单记录、跨记录、多语言自由问答，支持内容问

3/19/2024 2:47:37 PM 远洋

腾讯QQ黑科技亮相2021谷歌开发者大会官网，基于TFlite部署AI语音降噪

腾讯QQ黑科技亮相2021谷歌开发者大会官网，基于TFlite部署AI语音降噪

当6亿用户习惯每天通过QQ发送语音和进行视频通话，或者在群里与网友语音接龙完成一场Pia戏，又或是与好友一起派对语音答题的时候，大家可曾想过，在不同场景下始终清晰、流畅的QQ音视频体验背后，到底是什么黑科技在支撑这些场景中“声”与“话”的美好？今年11月16日召开的谷歌2021开发者大会期间，大会官网更新了一则案例——《TensorFlow助力：AI语音降噪打造QQ音视频通话新体验》，作者正是QQ音视频通话技术团队。作为谷歌TensorFlow的优秀应用案例，腾讯QQ团队在该文中详细揭秘了语音增强技术在QQ音视频功

11/16/2021 1:08:00 PM 新闻助手

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉