AI
AGENTGROUPCHAT-V2:大型语言模型多智能体协作的创新思考
大家好,我是肆〇柒。 LLM 多智能体系统在社会模拟和复杂任务解决这两大领域大显身手。 在社会模拟里,它们精准地复刻人类社交互动模式,助力我们洞察群体行为背后的社会学;在复杂任务解决场景下,智能体们协同合作,先是制定详尽规划,再按部就班执行,轻松应对复杂局面。
终于把 LSTM 算法搞懂了!!
大家好,我是小寒今天给大家分享一个超强的算法模型,LSTM。 LSTM(长短期记忆网络,Long Short-Term Memory)是一种特殊的循环神经网络(RNN)算法,专门设计用来解决传统RNN在处理长序列数据时存在的梯度消失和梯度爆炸问题。 它通过引入细胞状态和门控机制,使得模型能够捕捉和保存长期依赖信息,从而有效地处理序列数据中的长期依赖关系。
硅谷大戏!Scale AI刚卖身就被集体拉黑,谷歌OpenAI无情断供
听说了吗? 不久前,Meta花费143亿美元收购了28岁少年Alexandr Wang创办的数据标注公司Scale AI近一半的股份。 别小看这个数据标注公司,这一笔交易让Meta在AI竞赛中直接提升了实力,瞬间成为焦点。
AI 为何能查天气、订机票?揭秘大模型背后的“神秘工具箱”
你有没有想过,为什么 AI 能回答“今天上海天气怎么样? ”这种实时问题,甚至帮你预订机票? 明明它的训练数据截止到去年,怎么会对现在的事情了如指掌?
比Adam更有效,POET从谱不变原理出发,让LLM训练又稳又快
Zeju Qiu和Tim Z. Xiao是德国马普所博士生,Simon Buchholz和Maximilian Dax担任德国马普所博士后研究员,Bernhard Schölkopf是德国马普所所长,Weiyang Liu是香港中文大学计算机系助理教授。 随着大型语言模型(LLM)推动人工智能领域取得突破性进展,如何实现高效、稳定的超大规模模型训练,始终是该领域最富挑战性的核心议题之一。
谷歌发布首个嵌入模型:MTEB排行榜第一,超过OpenAI
今天凌晨1点,谷歌发布了首个Gemini嵌入模型刷新了MTEB榜单记录成为第一,并且价格很便宜每100万token只要0.15美元,已经开放API。 根据谷歌在多文本嵌入基准测试平台MTEB上的测试结果显示,Gemini嵌入模型平均分达到了68.37,大幅度超过了OpenAI文本嵌入模型的58.93分。 在双语挖掘、分类、聚类、指令检索、多标签分类、配对分类、重排、检索、语义文本相似性等测试中,全部都非常出色成为目前最强嵌入模型。
Windsurf打工人被谷歌做局24小时后获收购!华人AI编程明星出手,接收250名员工
AI编程赛道,局势突变。 距离谷歌以24亿美元挖走Windsurf创始团队仅仅72小时,AI编程智能体Devin开发商宣布,已经火速收购Windsurf剩余的全部资产和团队。 临时接任CEO的Windsurf前商务主管Jeff Wang感慨“过去72小时就像我职业生涯中最惊险刺激的过山车之旅。
ICCV 2025 | 清华&腾讯混元X发现「视觉头」机制:仅5%注意力头负责多模态视觉理解
本文的主要作者来自清华大学智能视觉实验室(i-Vision Group)、腾讯混元 X 组。 本文的共同第一作者为清华大学自动化系本科生王嘉辉和博士生刘祖炎,本文的通讯作者为清华大学自动化系鲁继文教授。 多模态大模型通常是在大型预训练语言模型(LLM)的基础上扩展而来。
MIT满分学霸掏空AI初创,谷歌24亿收购黑幕曝光!数百员工血本无归
OpenAI收购Windsurf在即,突然半路杀出个谷歌! 但这波可不是收购,而是釜底抽薪:谷歌直接挖走了整个Windsurf领导层 前30位核心AI工程师! 为了这次挖角,谷歌豪掷24亿美元!
具身智能大脑+首个SaaS开源框架,智源研究院刷新10项测评基准,加速群体智能新范式
具身智能大脑 全球首个具身智能SaaS开源框架,智源研究院在具身智能领域发力了——“通用具身大脑”RoboBrain 2.0,面向真实物理环境,集感知、推理与规划于一体。 全新32B版本凭借时空认知能力的突破,在多项权威具身智能基准上全面刷新纪录。 RoboOS 2.0,作为全球首个具身智能SaaS开源框架,创新性集成MCP协议与无服务器架构,实现轻量化部署,打通智能大脑与异构本体协同通路。
OpenAgentSafety 框架:AI 智能体安全评估的创新实践
大家好,我是肆〇柒,在 AI 智能体快速发展的当下,它们潜在的安全风险也日益凸显。 现有的 AI 智能体安全评估方法存在诸多局限:多数评估依赖于简化现实复杂性的模拟环境,难以准确反映智能体在真实场景下的表现;许多评估仅关注单一领域,如仅测试智能体的网页浏览或代码编写能力,缺乏对多领域综合任务的考察;此外,多轮多用户交互在评估中的缺失,使得难以洞察智能体在复杂人际互动和长期任务执行中的表现与潜在风险。 由卡耐基梅隆大学和艾伦人工智能研究所联合提出的 OpenAgentSafety(OA-SAFETY)框架,通过支持智能体与真实工具(如文件系统、终端、浏览器、消息平台等)的交互,并模拟多样化用户意图(包括良性、恶意和模糊意图)以及多轮交互场景,全面覆盖八大关键安全风险类别,系统地揭示了智能体在实际应用中可能存在的安全隐患。
员工AI助手应用指南:在应对挑战中实现效益最大化
“处于这一曲线顶端的公司——我们称之为未来构建型公司,那些最为成熟的公司——正在看到实质性的成果:收入增长达到1.5倍,股东价值提升1.8倍,”Kropp说道,“这里存在价值,但我们还处于早期阶段。 ”部署、重塑、创新为了利用AI和智能体创造价值,公司需要确定重点领域,采用部署、重塑、创新的框架。 AI已经在每个企业中部署,未来几年内将集成智能体,但如果你只是给员工一个聊天机器人,你并没有改变工作的方式。
最新 AGI 暴论:强化学习的「GPT-3 时刻」实现,还需要 1 万年?
最近,国外一家 AI 初创公司 Mechanize 的三位创始人联合撰文,提出一个大胆的判断:RL 或许要迎来属于它的 “GPT-3 时刻”,但还需要拥有相当于数千至上万年“模型处理任务所用时间”的训练。 在他们看来,当前的 RL 模型还存在明显短板,比如泛化能力差、难以适应新任务等,这种局面其实很像 GPT-3 出现之前的语言模型——能解决特定问题,但难以迁移和扩展。 为了解决这个问题,他们提出了一种新的训练范式,叫作“复制训练”(Replication Training):让模型在虚拟环境中模拟真实软件的操作过程,比如使用浏览器、编写代码、处理命令行任务等等。
首次综述「边-云协同计算」,分布式智能与模型优化的最新进展
随着物联网(IoT)设备的激增和实时应用需求的增长,传统云计算面临延迟高、带宽受限等问题,促使边缘计算的兴起。 边缘-云协同计算(Edge-Cloud Collaborative Computing, ECCC)通过整合边缘节点和云端资源,构建了一个分布式计算范式,旨在实现高效、低延迟的智能处理。 人工智能(AI),特别是深度学习和大语言模型(LLMs)的快速发展,进一步推动了ECCC在分布式智能和模型优化领域的应用。
AI有味觉了:分辨可乐和咖啡,只需“尝一尝”丨Nature
AI现在有味觉了! 近日,科学家研发出一种人工味觉系统,不仅感知酸、甜、苦、咸准确率高达90%,甚至能分辨可乐和咖啡。 相关研究已发表于《美国国家科学院院刊》(PNAS),并作为新闻报道登上了《Nature》官网。
12人团队打造AI陪伴神器,半年内斩获3000万美元投资
靠AI陪伴,一个诞生才半年的APP就获得了3000万美元(约2.15亿人民币)融资? 这个APP名叫Tolan,今年2月才正式上线,而且整个公司只有12人。 自推出以来,Tolan的下载量已超过300万次,每月收入超过100万美元,累计10万付费用户。
看似加速,实则拖慢:AI 写代码让开发者效率倒退19%
美国METR研究所完成了一项针对AI编程工具影响的实验研究。 他们发现,经验丰富的开源开发者在使用AI编程工具时,完成任务的时间平均增长了19%。 图片这与开发者自己的感知完全相反。
英伟达&MIT等推出Long-RL,长视频训练速度翻倍
请想象……一个 AI—— 它要完整看完一场几十分钟的世界杯决赛,不只是数球门数,更要跨越上百个镜头的线索、情绪、战术细节,甚至要像人一样推断:谁会赢点球大战? 足球比赛预测分析预测《星际争霸 2》这样的即时战略游戏同样需要考虑许多不同的变量,难度也非常巨大。 星际争霸 2 比赛预测分析再换个场景:同样是 AI,在一场紧张的德州扑克超级豪客赛上,面对职业牌手的每一次下注、加注、弃牌,能否像一个顶尖牌手一样,推理出对手藏在手里的那两张底牌?
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
大型语言模型
AI设计
生成式AI
搜索
视频生成
亚马逊
AI模型
DeepMind
特斯拉
场景
深度学习
Transformer
架构
Copilot
MCP
编程
视觉