编辑
混合数学编程逻辑数据,一次性提升AI多领域强化学习能力 | 上海AI Lab
近年来,AI大模型在数学计算、逻辑推理和代码生成领域的推理能力取得了显著突破。 特别是DeepSeek-R1等先进模型的出现,可验证强化学习(RLVR)技术展现出强大的性能提升潜力。 然而,现有关于强化学习和模型的研究多聚焦于单一领域优化,缺乏对跨领域知识迁移和协同推理能力的系统性探索,让模型能够在多领域协同工作,发挥更好的推理能力。
8/15/2025 9:00:00 AM
字节跳动发布图像编辑模型SeedEdit 3.0 细节保持能力进一步提升
6月6日,字节跳动Seed团队正式发布了图像编辑模型SeedEdit3.0。 这一全新版本的图像编辑模型在图像主体保持、背景细节处理以及指令遵循等方面取得了显著进步,极大地提升了图像编辑的可用率和效率。 SeedEdit3.0是基于文生图模型Seedream3.0开发的,通过引入多样化的数据融合方法和特定奖励模型,解决了以往图像编辑模型在主体与背景保持、指令遵循等方面的不足。
6/6/2025 3:01:06 PM
AI在线
阿里巴巴开源全能视频大模型,赋能视频生成与编辑
5月14日晚,阿里巴巴正式推出了通义万相 Wan2.1-VACE,这是当前行业中功能最为全面的视频生成与编辑模型。 该模型的亮点在于它具备多种强大的能力,可以同时实现文生视频、图像参考视频生成、视频重绘、局部编辑、背景延展和时长延展等多项基础生成和编辑功能。 这一开创性的产品标志着视频制作的门槛进一步降低,使更多的创作者能够轻松上手。
5/15/2025 9:01:02 AM
AI在线
字节豆包通用图像编辑模型SeedEdit开启测试 用户可一句话轻松改图
11月11日,字节在豆包大模型团队官网上公布最新通用图像编辑模型SeedEdit。 SeedEdit支持一句话轻松改图,包括修图、换装、美化、转化风格、在指定区域添加删除元素等各类编辑操作,通过简单的自然语言即可驱动模型编辑任意图像。 目前,该模型已经在豆包PC端及即梦网页端开启测试。
11/11/2024 11:58:00 AM
新闻助手
准确率达60.8%,浙大基于Transformer的化学逆合成预测模型,登Nature子刊
编辑 | KX逆合成是药物发现和有机合成中的一项关键任务,AI 越来越多地用于加快这一过程。现有 AI 方法性能不尽人意,多样性有限。在实践中,化学反应通常会引起局部分子变化,反应物和产物之间存在很大重叠。受此启发,浙江大学侯廷军团队提出将单步逆合成预测重新定义为分子串编辑任务,迭代细化目标分子串以生成前体化合物。并提出了基于编辑的逆合成模型 EditRetro,该模型可以实现高质量和多样化的预测。大量实验表明,模型在标准基准数据集 USPTO-50 K 上取得了出色的性能,top-1 准确率达到 60.8%。结果
8/6/2024 3:13:00 PM
ScienceAI
300多篇相关研究,复旦、南洋理工最新多模态图像编辑综述论文
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]该文章的第一作者帅欣成,目前在复旦大学FVL实验室攻读博士学位,本科毕业于上海交通大学。他的主要研究方向包括图像和视频编辑以及多模态学习。前言本文提出了解决一般性编辑任务的统一框架!近期,
6/28/2024 6:26:00 PM
机器之心
AI在用 | 原来,360 AI浏览器还能轻松编辑长视频
编辑:Cardinal以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。 我们也欢迎读者投稿亲自实践的创新型用例。视频为王。不过,和视频生成领域的精彩纷呈相比,剪辑战场总差那么一口气。就拿长视频剪辑来说,费时费力,趁手的 AI 剪辑兵器却不多, Spikes Studio 、Nova A.I.、剪映....... 一只手也能数的过来。现在,又
5/22/2024 7:30:00 PM
机器之能
OpenAI 为 DALL-E 3 引入编辑功能:进一步精细化调整已生成图片
OpenAI 公司近日发布公告,宣布为 DALL-E 3 引入全新的编辑界面,在基于用户文本生成图片之后,可以继续根据用户描述精细化调整已生成的图片。DALL-E 编辑器提供两种主要编辑方法:基于选择区域的编辑:在 DALL-E 3 生成图片之后,用户可以选中已生成图片中的特定区域,然后再在聊天界面,输入提示词要求 DALL-E 3 进行微调。对话式编辑:在 DALL-E 3 生成图片之后,用户无需选择特定区域,在聊天窗口中直接描述自己的编辑内容,这种方法适用于编辑调整整个图像。OpenAI 表示通过引入该编辑器,
4/2/2024 9:01:47 AM
故渊
基于Transformer和注意力的可解释核苷酸语言模型,用于pegRNA优化设计
编辑 | 紫罗基因编辑是一种新兴的、比较精确的能对生物体基因组特定目标基因进行修饰的一种基因工程技术。先导编辑(Prime editor, PE)是美籍华裔科学家刘如谦(David R.Liu)团队开发的精准基因编辑系统,PE 是一种很有前途的基因编辑工具,但由于缺乏准确和广泛适用的方法,有效优化先导编辑 RNA(prime editing guide RNA, pegRNA)设计仍然是一个挑战。近日,来自重庆医科大学、西北农林科技大学、云南民族大学、浙江大学医学院和中国科学院数学与系统科学研究院生物信息学中心(B
10/30/2023 6:54:00 PM
ScienceAI
当拥有4.9亿用户的神器遇见ChatGPT,视频制作有了超能力
机器之能报道编辑:Sia、大盘鸡这种组合犹如创建了一个强大的视频引擎,将内容生产提升到了一个全新水平。最近用 iMovie 做了几个视频,当发现 ChatGPT 插件支持视频编辑工具 CapCut 时,顿时有了一步跨入文明社会的感觉:和 ChatGPT 对话,它会帮你生成脚本,再调用 CapCut 生成视频,简直不要太方便...... 比如,某网红要推荐一款新面膜,可以让 ChatGPT 根据聊天生成的脚本调用 CapCut 做一个初始视频(类似初稿),再通过 CapCut 强大的编辑功能不断完善。其实,ChatG
10/13/2023 6:29:00 PM
机器之能
年轻的LeCun、吴恩达长啥样?升级版StyleGAN告诉你
来自以色列特拉维夫大学的研究者在生成图像方面又有了新的升级,所用方法在保留源图像身份的同时,在细节编辑上实现了更精细的效果。
6/25/2021 2:19:00 PM
机器之心
- 1
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
智能体
马斯克
AI新词
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
蛋白质
苹果
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
生成
人形机器人
AI视频
百度
计算
工具
Sora
GPU
大语言模型
华为
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
深度学习
AGI
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
DeepMind
亚马逊
特斯拉
编程
MCP