理论
阿里通义实验室提出AnyStory:开启个性化文本到图像生成的新篇章!
在这个数字化时代,生成式AI技术正以前所未有的速度改变着我们的创作方式。 近期,阿里通义实验室发表了一篇题为《AnyStory: Towards Unified Single and Multi-Subject Personalization in Text-to-Image Generation》的论文,该论文提出了一种创新的框架,旨在通过统一的路径实现单个及多个主体的个性化文本到图像生成,为故事可视化、艺术创作乃至更多领域带来了革命性的突破。 论文中深入探讨了当前文本到图像生成技术面临的挑战,如主体一致性、细节保留以及多主体个性化等方面的不足。
1/24/2025 12:11:21 PM
AIGC Studio
百度两大国民级产品联手,实现内容生产与消费的自由
在AI技术的浪潮下,百度文库与百度网盘作为两大国民级产品,正携手推动内容生产与消费的新变革。 在百度AI DAY第一期活动中,百度副总裁、文库事业部与网盘事业部负责人王颖,详细阐述了这两个产品如何通过AI技术,打破内容生产到消费的边界,让每个人都能享受到内容自由带来的便利与乐趣。 AI赋能,打通内容生产和消费全链路.
1/24/2025 12:02:20 PM
鸢玮
2025智能体元年!斯坦福科学家8000字讲清所有要点
许多人认为「智能体」是AI发展的终极目标。 智能体在处理复杂任务时,展现出了巨大潜力。 从协助搭建网站、管理客户账户,到开展市场调研、自动录入数据,智能体的应用场景日益广泛。
1/24/2025 9:30:00 AM
新智元
会用ChatGPT≠工程师,谷歌资深员工发文,揭秘AI编程不为人知的真相
尽管程序员们纷纷反馈用上AI辅助之后,工作效率提升,但我们用到的软件中bug依旧不少。 针对这一现象,前谷歌产品经理Peter Szalontay,以及现任的谷歌Chrome的工程团队领导Addy Osmani都给出了自己的分析,并提供了一些如何使用AI辅助编程的建议。 AI编码工具的黑暗真相1月7日,前谷歌产品经理Peter Szalontay发推,并配上了一个令人惊心动魄的标题:「无人谈论的AI编码工具的黑暗真相」。
1/24/2025 9:10:00 AM
新智元
刚刚,OpenAI首个智能体提前曝光!高级编码AI剑指400万年薪L6级工程师
AGI或许就在本周? 刚刚外媒爆料称,OpenAI暗藏的首个智能体项目「Operator」即将发布。 网友发现Operator已登陆ChatGPT,不过可能Pro用户最先用上这款AI智能体将与ChatGPT深度集成,直接可以接管你的屏幕,自动化完成任务。
1/24/2025 9:00:00 AM
新智元
两分钟完成论文调研!ByteDance Research推出论文检索智能体PaSa,远超主流检索工具
2025 被称为 Agent 元年,新年伊始,ByteDance Research 就推出了一款基于强化学习的智能体应用:论文检索智能体。 它可以模仿人类研究者调用搜索引擎、看论文、查参考文献。 繁琐冗长的论文调研,现在,只需要两分钟。
1/24/2025 8:45:00 AM
机器之心
计算机视觉:使用 YOLOv8 创建交通热力图
在一个由数据驱动和导向的世界中,解释、可视化并基于这些数据做出决策的能力变得越来越重要。 这意味着,应用正确的工具和技术可能决定一个项目的成败。 在计算机视觉领域,有许多技术可以解释从视频(录制、流媒体或实时)中获取的数据。
1/24/2025 7:37:19 AM
二旺
舍弃与业务无关的部分,别上来就想颠覆!华为、阿里、腾讯、百度、京东、商汤、快手等众一线大牛AI应用打造心得公开:实际在做两件事!
编辑 | 云昭、伊风观点 | 《AIGC实战派》特约嘉宾2024,大模型开始走出“不落地”的樊笼,接受“市场老大哥”的捶打与教育。 跟2023年不同的是,云厂商、大模型厂商、算力厂商、大模型六小龙、新一代的AI应用创客,独立开发者,一时间群雄并起,都在为新的增长机会放手一搏,蔚为壮观。 一个有意思的现象是,虽然2024年大模型的进化依旧是主旋律,但是尤其进入下半年以来,大家讨论“射程”的话题越来越多。
1/23/2025 5:46:40 PM
云昭
AI赋能蛋白质研究:SaprotHub让蛋白质AI模型训练和调用不再有门槛!
编辑 | ScienceAI近年来,AI 技术在蛋白质研究领域发挥了越来越重要的作用。 从 AlphaFold2 在结构预测任务上的脱颖而出,到各类蛋白质语言模型(PLMs)在功能预测方面的重大进展,生物研究者们可以利用各式各样的 AI 模型来辅助他们的研究。 然而,随着模型变得越来越复杂,如何训练和调用这些 AI 模型对于缺乏机器学习专业知识的研究者来说是一件非常具有挑战的任务,也因此限制了 AI 技术在实际研究中的应用。
1/23/2025 5:44:00 PM
ScienceAI
小模型也能玩转RAG!性能仅降1%,存储省75%,边缘设备轻松跑
检索增强生成(RAG)虽好,但一直面临着资源消耗大、部署复杂等技术壁垒。 近日,香港大学黄超教授团队提出MiniRAG,成功将RAG技术的应用门槛降至1.5B参数规模,实现了算力需求的大幅降低。 这一突破性成果不仅为边缘计算设备注入新活力,更开启了基于小模型轻量级RAG的探索。
1/23/2025 5:00:00 PM
量子位
推理模型规划任务成功率从5%到95%,DeepMind遗传算法新研究火了
瞄准推理时扩展(Inference-time scaling),DeepMind新的进化搜索策略火了! 所提出的“Mind Evolution”(思维进化),能够优化大语言模型(LLMs)在规划和推理中的响应。 由于提升显著,Reddit/𝕏一时间出现了大量讨论:由于结合了遗传算法,使用Mind Evolution能让Gemini 1.5 Flash任务成功率从原本的5%左右,一下提升90个百分点。
1/23/2025 4:25:23 PM
量子位
FastRAG:半结构化数据的检索增强生成
本文介绍了FastRAG,一种针对半结构化数据的新型RAG方法。 FastRAG采用模式学习和脚本学习来提取和结构化数据,而无需将整个数据源提交给LLM。 它将文本搜索与知识图谱(KG)查询相结合,以提高在问答任务中检索上下文丰富信息的准确性。
1/23/2025 4:23:30 PM
OpenAI微软关系现裂痕,奥特曼紧急公关,导火索竟是DeepMind联创
一个5000亿美元的大动作,让微软不再是OpenAI独家云计算供应商了。 在OpenAI与甲骨文牵手组建数据中心那一刻起,网友们纷纷看向这个计划之外的微软:他们两个之间的关系约莫是出现裂痕了。 结果奥特曼紧急公关,不是你听我解释,这是形势所迫,为算力折腰啊啊。
1/23/2025 4:22:56 PM
量子位
Meta-Chunking: 通过逻辑感知学习高效的文本分段
本文是由人大提出的,旨在解决在检索增强生成(RAG)系统中,文本分段这一关键方面被忽视的问题。 具体来说,传统文本分段方法(如基于规则或语义相似性)在捕捉句子间深层语言逻辑联系方面存在不足,导致在知识密集型任务(如开放域问答)中的性能受到影响。 本文通过引入Meta-Chunking的概念及其两种实现策略(边际采样分段和困惑度分段),解决了以下几个关键问题:逻辑连贯性问题:问题:传统文本分段方法往往基于规则或语义相似性,难以捕捉句子间的深层逻辑联系(如因果、过渡、并行和渐进关系)。
1/23/2025 4:13:35 PM
DeepSeek新AI模型有多震撼?外媒:相当于30美元iPhone降临
DeepSeek(深度求索)再次推出新版开源AI模型,它的性能与美国最先进的AI模型虽然还有一些差距,但差距极小,成本低很多很多。 西方许多人认为,美国限制中国AI发展的企图遇挫,中国正在加速前进,以更高效率打造高端AI模型。 去年12月,杭州幻方量化推出DeepSeekV3开源大语言模型,它的性能与OpenAI 40和Anthropic Claude 3.5 .
1/23/2025 3:58:02 PM
小刀
OpenAI新研究:o1增加推理时间就能防攻击,网友:DeepSeek也受益
OpenAI的新Scaling Law,含金量又提高了。 像o1这样的推理模型,随着思考时间的延长,面对对抗性攻击会变得更加稳健。 图片随着大语言模型被越来越多地赋予Agent能力,执行现实世界的任务,模型被对抗攻击的风险也与日俱增。
1/23/2025 2:53:15 PM
字节要亲手打造AGI了!神秘“Seed Edge”项目被曝光,已设置5大研究方向,探索下一代AI技术,算力不用愁!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)中国大厂开始发力AGI了! 据媒体报道,字节跳动 AGI 研究团队浮出水面,揭开了字节AGI的秘密布局! 报道称:1 月下旬,字节正式设立代号为“Seed Edge”的研究项目,核心目标是做比预训练和大模型迭代更长期、更基础的 AGI 前沿研究。
1/23/2025 2:02:14 PM
伊风
字节清华开源力作!UI-TARS原生AI智能体,人人都能拥有“智能助手”
年底国内各个AI玩家杀疯了,前两天完全开源的Deepseek R1 震撼整个AI业界,今天字节又联合清华整活,一个强大的原生的开源 AI Agent UI-TARS震撼上线看了UI-TARS的论文,我给大家划划重点【纯视觉感知】:告别文本依赖,像人眼一样“看”懂GUI! 传统的GUI自动化方案,很多都依赖于解析网页代码(HTML)或者软件的API接口。 但这种方式有两个致命缺陷:一是平台限制,不同平台、不同软件的底层代码和API都不一样,导致自动化方案难以通用;二是容易失效,一旦网页或软件界面改版,代码或API接口变动,自动化脚本就可能直接崩溃。
1/23/2025 1:05:42 PM
AI寒武纪
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind