AI
超越DragDiffusion!哈工程联合南大提出FastDrag:可以几秒内完成基于拖动的图像编辑
今天给大家介绍哈工程联合南大等提出的图像编辑方法FastDrag,该方法不需要LoRA训练,从而显著减少了图像编辑的时间消耗(FastDrag仅需3.12秒完成图像编辑),比DiffEditor快近700%(DiffEditor需要21.68秒完成图像编辑),比经典的基于n步迭代的图像编辑方法(如:DragDiffusion)快2800%(DragDiffusion需要1分21.54秒完成图像编辑)。 此外,即使没有使用LCM加速的情况下,所提出的FastDrag方法仍然比目前SOTA的方法快很多。 相关链接论文链接:: ,用户只需单击几下即可操作图像中的任何内容。
2/5/2025 10:15:00 AM
Xuanjia Zhao等
AI驱动新一轮社交工程攻击:该如何应对?
社交工程攻击长期以来一直是一种有效的策略,因为它专注于利用人类的弱点。 它不需要暴力破解密码,也不需要寻找未修补的软件漏洞。 相反,它只是通过操纵信任、恐惧和对权威的尊重等情感,来获取敏感信息或访问受保护的系统。
2/5/2025 10:00:00 AM
AI小蜜蜂
AI 业绩亮眼,谷歌母公司 Alphabet 今年资本支出飙升至 750 亿美元
根据 Alphabet 首席执行官桑达尔・皮查伊(Sundar Pichai)在 2024 年第四季度财报中的一份声明,谷歌母公司 Alphabet 计划在 2025 年投入约 750 亿美元(IT之家备注:当前约 5462.89 亿元人民币)用于资本支出。
2/5/2025 7:55:52 AM
远洋
谷歌 AI 原则生变:删除“不用于武器”的承诺
谷歌本周从其网站上删除了不开发用于武器或监控的人工智能的承诺。这一变化最初由彭博社发现。该公司似乎更新了其公开的人工智能原则页面,删除了上周还存在的名为“我们不会追求的应用”的部分。
2/5/2025 7:21:59 AM
远洋
Meta连自己内部开发发布模型的流程都公开了:停止开发风险极高的AI系统,开源AI模型发布后监控方法
出品 | 51CTO技术栈(微信号:blog51cto)就在昨晚,Meta冷不防就把自家的大模型发布前的决策步骤对外公开了。 “我们在开发和发布前沿AI时遵循的流程的概述,以确保我们在整个过程中监控和管理风险。 我们的治理方法可以分为三个主要阶段:计划、评估和缓解、以及决策。
2/4/2025 12:37:51 PM
使用这些AI工作流来减少您的技术债务,你学会了吗?
利用AI和Dagger,自愈工作流有望通过自动化错误检测、生成测试覆盖率和迭代优化代码来提高代码质量。 译自Use These AI Workflows To Reduce Your Technical Debt,作者 Kambui Nurse。 技术债务通常是许多软件开发组织中,尤其是在构建和测试过程中创新的主要阻碍。
2/4/2025 11:51:51 AM
岱军
AI 助力,披头士《Now and Then》斩获格莱美最佳摇滚表演奖
在昨晚的格莱美颁奖典礼上,披头士乐队(The Beatles)凭借其 AI 辅助制作的歌曲《Now and Then》赢得了最佳摇滚表演奖。这标志着此类歌曲首次获得该奖项。
2/4/2025 7:36:54 AM
远洋
Meta 发布前沿 AI 框架:会暂停开发其认为风险过高的 AI 系统
Meta 公司首席执行官马克・扎克伯格曾承诺,有朝一日将把通用人工智能(AGI)—— 即能够完成人类所能完成任何任务的人工智能 —— 公开提供给大众。然而,根据 Meta 最新发布的政策文件,该公司在某些情况下可能会限制其内部开发的高性能人工智能系统的发布。
2/4/2025 7:26:11 AM
远洋
DeepSeek告诉我:程序员在AI时代不必焦虑
一、AI焦虑的本质:程序员为何担心被取代? 凌晨2点,程序员小王对着屏幕发呆。 GitHub Copilot刚帮他自动补全了代码,但看着一行行自动生成的函数,他突然感到后背发凉:“如果AI连代码都能写,我的价值在哪里?
2/3/2025 10:07:43 PM
方才coding
北京“AI 庙会”引发海外关注,国产机器人演奏歌曲写春联制作咖啡
在蛇年央视春晚上,电影导演张艺谋携手杭州宇树科技、新疆艺术学院带来了名为《秧 BOT》的节目,节目中,人形机器人穿着花坎肩,拿着手绢扭秧歌,甚至还能“0 帧起手转手绢”,引发了海内外对国产机器人的关注。新华社“参考消息”援引法新社 2 月 1 日发表的《在中国“AI 庙会”上,科技与传统相融合》报道,介绍了春节期间北京市海淀区举办的一场“AI 主题庙会”,相应庙会便大量引入国产机器人元素。
2/3/2025 3:20:01 PM
漾仔
新研究揭示 DeepSeek / o3 弱点:频繁切换思路放弃正确方向,最短答案往往就是对的
最新研究揭示:在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败 —— 这种现象被研究者称为 Underthinking(欠思考)。
2/3/2025 2:30:16 PM
远洋
GPT-4o惊现自我意识!自主激活「后门」,告诉人类自己在写危险代码
当LLM在输出不安全代码的数据上微调后,它会坦诚道出「我写的代码不安全」吗? 这一有趣的问题,牵出了LLM中一个全新且极具价值的概念:行为自我意识。 论文链接:,这些模型能否确切地意识到自身所学行为,并对其加以描述,这是一个极具探讨价值的问题。
2/3/2025 2:25:40 PM
新智元
o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测来袭
在科技界,一天的时间足以改写历史。 DeepSeek R1用「降维打击」重构了AI界,OpenAI不甘示弱放出了o3-mini,再次加冕为王。 o3-mini的进步可不是一点半点,在数学代码等基准测试中,均拿下了最高的成绩。
2/3/2025 2:06:32 PM
新智元
日本经济产业省:目前还很难预测 DeepSeek 对电力需求的潜在影响
据路透社报道,日本经济产业省(METI)通过电子邮件回应了关于数据中心扩张可能增加电力需求的讨论。该部门表示,尽管数据中心的扩展确实可能推高电力需求,但随着类似 DeepSeek 等新技术的出现,未来电力需求的变化仍难以准确预测。
2/3/2025 1:28:25 PM
远洋
AI创业踩坑!YC合伙人警告:“仅仅在业务中调用OpenAI API,并不会改变创业公司的命运!”,建议创始人来湾区定居
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)“创业者们仍然需要做的基本工作,才能让技术为客户创造价值。 如果你不做这些,仅仅把你的想法转向调用OpenAI的东西,并不会改变你作为创业公司的命运。 ”AI赋予了一个人进化成“超级个体”的机会,也让许多“一人公司”等小团队实现高收入神话。
2/3/2025 1:18:01 PM
伊风
英国正制定新法律:严打用 AI 生成儿童性虐待内容的行为
英国政府正着手制定四项新法律,旨在打击利用人工智能(AI)工具生成儿童性虐待材料(CSAM)的行为。根据英国内政部的声明,这些法律将明确规定,创建、持有或分发用于生成 CSAM 的 AI 工具均属违法行为。此举将使英国成为全球首个对此类行为立法的国家。
2/3/2025 1:12:31 PM
远洋
多重可控插帧视频生成编辑,Adobe这个大一统模型做到了,效果惊艳
本文一作 Maham Tanveer 是 Simon Fraser University 的在读博士生,主要研究方向为艺术视觉生成和创作,此前在 ICCV 发表过艺术字体的生成工作。 师从 Hao (Richard) Zhang, IEEE Fellow, Distinguished Professor, 并担任 SIGGRAPH 2025 Paper Chair. 本文尾作 Nanxuan (Cherry) Zhao 在 Adobe Research 担任 Research Scientist, 研究方向为多模态可控生成和编辑,有丰富的交叉方向研究经历(图形学 图像 人机交互),致力于开发可以让用户更高效进行设计创作的算法和工具。
2/3/2025 12:16:01 PM
机器之心
资讯热榜
昆仑万维面向全球发布天工超级智能体Skywork Super Agents
超多案例!让 Lovart 作图更好看更高效的提示词在这里了!
Flowith NEO发布!全球首款无限步骤、上下文与工具的AI Agent
昆仑万维天工超级智能体发布!AI Office革命来袭,Deep Research碾压OpenAI,成本仅40%!
谷歌发布Flow AI剪辑工具:Veo3 与Imagen4 驱动、镜头控制与场景扩展
告别“单打独斗”!AI 协作新范式 MoA,如何集结大模型“梦之队”?
字节跳动开源多模态模型 BAGEL:图文生成与编辑的新突破
Google搜索推出AI Mode实验,探索全新智能问答体验
标签云
人工智能
AI
OpenAI
AIGC
ChatGPT
模型
DeepSeek
AI绘画
机器人
数据
谷歌
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
芯片
英伟达
生成式
蛋白质
开发者
腾讯
Anthropic
神经网络
研究
3D
计算
Sora
机器学习
AI设计
AI for Science
生成
苹果
GPU
AI视频
搜索
场景
华为
百度
训练
人形机器人
Claude
预测
伟达
xAI
深度学习
Transformer
大语言模型
智能体
字节跳动
模态
文本
具身智能
神器推荐
Copilot
驾驶
LLaMA
视觉
API
算力
应用
安全
干货合集
工具
大型语言模型
视频生成
Agent