输入

阿里通义万相Wan2.1-VACE开源号称首个开源的视频编辑统一模型

阿里通义万相Wan2.1-VACE开源号称首个开源的视频编辑统一模型

通义万相宣布VACE开源，这标志着视频编辑领域迎来了一次重大的技术革新。此次开源的Wan2.1-VACE-1.3B支持480P分辨率，而Wan2.1-VACE-14B则支持480P和720P两种分辨率。 VACE的出现，为用户带来了一站式的视频创作体验，用户无需在不同模型或工具之间频繁切换，即可完成文生视频、图像参考生成、局部编辑与视频扩展等多种任务，极大地提高了创作效率和灵活性。

5/15/2025 9:01:02 AM AI在线

【IT之家评测室】讯飞输入法 14.0 体验：端侧 AI 大模型加持，重构输入体验

【IT之家评测室】讯飞输入法 14.0 体验：端侧 AI 大模型加持，重构输入体验

10 月 24 日，科大讯飞第七届世界声博会暨 2024 科大讯飞全球 1024 开发者节，在本次大会上，全新讯飞输入法 14.0 正式亮相。当前生成式 AI 的发展正如火如荼，特别是端侧 AI 大模型正处于快速演进的阶段。一方面，随着模型技术的进步，模型参数越来越小同时也可以做到效果越来越好，我们可以看到 2024 年以来包括 Meta、谷歌、苹果、微软等行业巨头都推出了自家适合终端侧运行的“小模型”。

10/25/2024 9:36:18 PM 汐元

15 个 AI 模型只有 3 个得分超 50%，SIUO 跑分被提出：评估多模态 AI 模型的安全性

15 个 AI 模型只有 3 个得分超 50%，SIUO 跑分被提出：评估多模态 AI 模型的安全性

最新发表在 arXiv 的研究论文指出，包括 GPT-4V、GPT-4o 和 Gemini 1.5 在内的大部分主流多模态 AI 模型，处理用户的多模态输入（例如一起输入图片和文本内容）之后，输出结果并不安全。这项研究标题为《跨模态安全调整》（Cross-Modality Safety Alignment），提出了一个全新的“安全输入但不安全输出”（SIUO），涉及道德、危险行为、自残、侵犯隐私、信息误读、宗教信仰、歧视和刻板印象、争议性话题以及非法活动和犯罪等 9 个安全领域。研究人员说，大型视觉语言模型（LVL

6/25/2024 9:12:58 AM 故渊

大模型时代还不理解自注意力？这篇文章教你从头写代码实现

大模型时代还不理解自注意力？这篇文章教你从头写代码实现

自注意力是 LLM 的一大核心组件。对大模型及相关应用开发者来说，理解自注意力非常重要。近日，Ahead of AI 杂志运营者、机器学习和 AI 研究者 Sebastian Raschka 发布了一篇文章，介绍并用代码从头实现了 LLM 中的自注意力、多头注意力、交叉注意力和因果注意力。太长不看版这篇文章将介绍 Transformer 架构以及 GPT-4 和 Llama 等大型语言模型（LLM）中使用的自注意力机制。自注意力等相关机制是 LLM 的核心组件，因此如果想要理解 LLM，就需要理解它们。不仅如此，这

2/16/2024 5:06:00 PM 机器之心

语言模型悄悄偷懒？新研究：上下文太长，模型会略过中间不看

语言模型悄悄偷懒？新研究：上下文太长，模型会略过中间不看

语言模型：太长我不看。

7/24/2023 2:50:00 PM 机器之心

编译 ONNX 模型

编译 ONNX 模型

本篇文章译自英文文档Compile ONNX Models — tvm 0.13.dev0 documentation作者是 Joshua Z. Zhang更多 TVM 中文文档可访问 →Apache TVM 是一个端到端的深度学习编译框架，适用于 CPU、GPU 和各种机器学习加速芯片。 | Apache TVM 中文站。本文将介绍如何用 Relay 部署 ONNX 模型。首先安装 ONNX 包，最便捷的方法推荐安装 protobuf 编译器：或参考官方网站： ONNX 模型下面示例中的超分辨率模型与 ONNX

6/25/2023 6:06:00 PM HyperAI超神经

给几个关键词就能出摄影大片，英伟达GauGAN上新2.0：将文本转成逼真图像

给几个关键词就能出摄影大片，英伟达GauGAN上新2.0：将文本转成逼真图像

这么美的照片竟然不是出自摄影师之手？！

11/23/2021 2:17:00 PM 机器之心

深度学习领域最常用的10个激活函数，一文详解数学原理及优缺点

深度学习领域最常用的10个激活函数，一文详解数学原理及优缺点

激活函数是神经网络模型重要的组成部分，本文作者Sukanya Bag从激活函数的数学原理出发，详解了十种激活函数的优缺点。

2/24/2021 2:39:00 PM 机器之心

资讯热榜

这样在本地搭建DeepSeek可以直接封神：本地部署+避坑指南（升级版）免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 GGUF 是什么？一文看懂大模型里最火的模型格式后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 Sora、可灵、即梦哪家强？AI视频软件深度测评！

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 大语言模型字节跳动 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉