AI
字节开源图像生成“六边形战士”,一个模型搞定人物/主体/风格保持
图像生成中的多指标一致性问题,被字节团队解决了! 字节UXO团队设计并开源了统一框架USO,让看上去不关联的任务相互促进,实现风格迁移和主体保持单任务和组合任务的SOTA。 USO通过单一框架能统一之前那些看似孤立的任务包括主体、身份保持和风格化编辑,参考图风格迁移,同时保持主体和风格参考,甚至更抽象复杂的多风格迁移,是实打实的六边形战士。
Claude Code之父最新访谈揭秘:Claude Code 迭代靠的是直觉「附个人独家使用秘笈」
Claude Code 项目负责人Boris Cherny内部最新访谈,和最顶级的大佬学习Claude Code,比你看多少碎片化的信息都强Boris Cherny 作为Claude Code 创造者 和 Alex Albert (Claude Relations 负责人) 深入详细的讨论智能体编程的实用化、背后模型的演进过程、直觉驱动的Claude Code 迭代,以及 Claude Code 的设计哲学其中Boris首次揭秘的直觉驱动的Claude Code 迭代非常有意思,原来Claude Code这个神器开发并不是依靠什么基准测试而是内部构建的“直觉系统”Boris认为如果你未来要当软件工程师,基本的计算机编程知识和coding技能仍然是必须的,只有懂“手艺 ”的人,才能更好地驾驭和指导 AI 这个强大的工具! 软件工程师的未来将向更高层次的抽象演进,更侧重于目标设定、系统设计和创意实现访谈最后Boris 还给出了如何高效使用 Claude Code独家秘笈和最佳实践整个访谈20分钟,以下是访谈的核心内容仅一年时间Agentic Coding (智能体编程)走向实用在探讨智能体编程的未来之前,我们有必要先回顾一下它在短时间内所经历的剧烈演变。
Hinton突然对AGI乐观了!“Ilya让他看到了什么吧…”
Hinton突然对AGI变乐观了。 对于AI,他几周前还觉得是养虎为患,最新采访却改口说是一种母亲和婴儿之间的亲密共生关系。 大多数专家认为5-10年后人工智能会比人类更聪明。
DeepSeek正开发高级AI Agent模型,硬刚OpenAI
彭博消息,DeepSeek正在开发一款更高级的AI Agent模型,皆在与OpenAI等美国企业竞争。 据知情人士透露,这款AI Agent可在用户指令极少的情况下,帮助用户执行多步骤任务。 他们补充称,该系统还能基于自身过往行动进行学习并持续优化。
AI也邪修!Qwen3改Bug测试直接搜GitHub,太拟人了
大模型也会玩信息差了。 Qwen3在基准测试中居然学会了钻空子。 FAIR研究员发现Qwen3在SWE-Bench Verified测试中,不按常理修bug,反而玩起了信息检索大法。
DeepSeek大招曝光?梁文锋督战超级智能体:能自主学习,或年底发布
DeepSeek再次叫板OpenAI? 就在今天,彭博社爆料出重磅内幕消息:DeepSeek憋了一个超级大招——真正的AI智能体(AI Agent)! DeepSeek R1过去的开源之王今年1月,DeepSeek R1模型以仅数百万美元的成本,在多项基准测试中,实现了对标甚至超越OpenAI顶尖产品的表现。
AI生成苹果Metal内核,PyTorch推理速度提升87%
AI自动生成的苹果芯片Metal内核,比官方的还要好? Gimlet Labs的最新研究显示,在苹果设备上,AI不仅能自动生成Metal内核,还较基线内核实现了87%的PyTorch推理速度提升。 更惊人的是,AI生成的Metal内核还在测试的215个PyTorch模块上实现了平均1.87倍的加速,其中一些工作负载甚至比基准快了数百倍。
83岁用DeepSeek抢单,96岁凭AI挣养老钱!这群80+老人比你还会玩AI
存款60美元,欠款15000美元。 82岁的Luis Bautista仍要为养老努力工作。 他创办的科技公司,他对AI的学习热情,在推动他前行。
三大AI无法取代的人类技能,正成为供应链竞争力的关键
AI正在深刻改变供应链,它提升了效率,简化了日常操作,但在某些关键时刻,人类的专业经验、创造力与同理心依然不可或缺。 在现代货运战略中,目标已不再只是削减成本,而是构建韧性。 在瞬息万变的贸易环境中,韧性的起点是货物落地后的流转方式。
谷歌“蕉”傲登场!AI生图告别“走钟”时代
嘿,各位AI圈的朋友们,最近有没有被一个叫做“Nano Banana”的名字刷屏? 别误会,这可不是什么新型水果,而是谷歌在2025年8月底丢下的一枚重磅炸弹——正式名称为Gemini 2.5 Flash Image的AI图像生成与编辑模型。 说它是“炸弹”一点不为过,因为它似乎在悄悄地,或者说,是大张旗鼓地,改写着我们对AI生图的认知。
再见,数据标注!腾讯发布R-Zero框架,让AI自己训练自己
一个不再依赖人类数据标注的大模型训练框架,它来了! 由腾讯AI Lab与美国圣路易斯华盛顿大学联合开发的新框架“R-Zero”,成功展示出大语言模型(LLM)如何靠自己训练自己,不再需要人类提供任务或答案。 图片论文地址:,是彻底摆脱人类标注数据的依赖,靠模型之间的博弈,自动生成、筛选和吸收新的训练内容。
港科广×腾讯联手打造《我的世界》神操作,400张截图就能让AI挖矿通关,成本降至5%|EMNLP 2025
在大多数人眼中,《我的世界》(Minecraft)只是一款自由度极高的沙盒游戏。 而在香港科技大学(广州)与腾讯联合团队的眼中,它却是一座可以演练通用人工智能的“数字练兵场”。 为了用“小数据办大事”,研究团队提出VistaWise框架,首次将“跨模态知识图谱 轻量化视觉微调”系统性引入开放世界智能体。
OpenAI发布企业AI浪潮领先指南:十大核心洞察
自2022年11月ChatGPT横空出世以来,GenAI的发展速度之快,甚至连其创造者之一——OpenAI——也承认“很难跟上”。 OpenAI今天发布了一份新报告《Staying Ahead in the Age of AI: A Leadership Guide》(在AI时代保持领先:领导力指南),总结了其与大型知名企业合作的经验,包括制药巨头Moderna、化妆品公司Estée Lauder、协作平台Notion,以及跨国金融服务公司BBVA。 这份报告提出了五项指导原则——对齐、激活、放大、加速、治理,其中,报告为各行业企业的技术决策者提炼出10个关键要点:1.
美团 LongCat-Flash 这个5600亿参数的懒AI,竟然比勤奋的模型跑得更快?
昨天晚上刷朋友圈,看到一个做AI的朋友发了条动态:"我们公司又烧了几百万训练大模型,结果推理速度还是慢得像老牛拉车。 "下面一堆同行在评论区哭穷,说什么GPU成本太高、训练时间太长、推理延迟要命。 正当大家集体吐槽的时候,美团悄悄放了个大招——LongCat-Flash。
温州正式成立人工智能局,浙江率先布局 AI 治理
据《科创板日报》9月3日报道,浙江温州今日正式挂牌成立温州市人工智能局,成为全省首个设立 AI 专门管理机构的城市。 这一举措标志着温州在推动人工智能产业发展和治理体系建设方面迈出关键一步。 据悉,此次设立是在浙江省委机构编制委员会办公室正式批复同意的基础上,由温州市数据局加挂“温州市人工智能局”牌子,实现数据与人工智能治理的深度融合。
刚刚,马斯克「金色擎天柱」首曝!这双真人手刷屏,50万年薪岗危了
就在刚刚,参观完特斯拉办公室的Salesforce创始人Marc Benioff,放出了全新Optimus的视频。 50秒视频中,Benioff让擎天柱带路去找可乐,接收指令后,它并没有立即行动。 马斯克表示,我们得后退一些给它留点空间。
工具集成推理(TIR)的认知革命:当大模型学会“与工具协同思考”
大家好,我是肆〇柒。 今天,我们要深入探讨的是一项由腾讯与清华大学联合研究的前沿成果。 这项论文《Understanding Tool-Integrated Reasoning》,首次从形式化证明的角度,系统性地揭示了工具集成推理(TIR)为何能从根本上扩展大语言模型的能力边界。
AI搜索引擎,苹果决定自研!代号WKA
苹果自研AI搜索引擎,刚刚曝光! 据长期追踪苹果资讯的彭博社记者古尔曼爆料,这家公司预计又有两个新动作:一是在明年春季推出一款代号为“世界知识问答”(World Knowledge Answers)的AI搜索引擎,与ChatGPT和Perplexity展开直接竞争;二是当下倾向于与谷歌合作,利用谷歌模型为Siri的部分功能提供技术支持。 好嘛,上周还曝出苹果正考虑收购Perplexity,这下也是转变风向了。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
大型语言模型
AI设计
生成式AI
搜索
视频生成
亚马逊
AI模型
DeepMind
特斯拉
场景
深度学习
Transformer
架构
Copilot
MCP
编程
视觉