理论
AI Agent接管谷歌搜索!预订餐厅、定制搜索结果,一键搞定所有事
今天凌晨,谷歌在官网宣布,谷歌搜索的AI模式新增AI Agent功能,可自动帮助用户完成预订餐厅、定制搜索结果。 例如,用户可以询问预订晚餐的餐厅,包括多种约束条件和偏好,包括人数、日期、时间、地点、口味、禁忌和偏好的菜系等。 Agent智能体会在多个预订平台和网站上搜索,找到符合用户特定需求的餐厅,并为用户呈现一个可供选择的餐厅列表,用户可以直接链接到预订页面一键完成预订。
8/22/2025 9:00:40 AM
人工智能时代下的WordPress开发形态
译者 | 刘涛审校 | 重楼在过去,利用WordPress(一款功能强大的开源内容管理系统,广泛用于搭建网站和博客,支持用户通过直观界面进行内容创建、编辑和管理,且可通过插件和主题扩展功能与外观)搭建网站需投入大量时间成本。 首先要完成平台的安装,接着从众多选项中挑选适配的主题,再添加各类插件,并且要手动撰写全部网站内容,同时还需保证各个组件之间能够协同且高效地运行。 即便是经验丰富的开发者,搭建一个基础网站也至少需要耗费数小时。
8/22/2025 7:49:18 AM
刘涛
一场无人防备的AI安全危机正在形成
在采访中,Curity的CTO Jacob Ideskog探讨了智能体给企业带来的风险,随着这些智能体逐渐融入企业系统,滥用、数据泄露和未经授权访问的可能性也在增加。 Ideskog警告称,行业正在“梦游”般地陷入安全危机,这与早期API和云计算的采用过程如出一辙,同时他还概述了公司为抵御这些行为驱动的威胁必须采取的措施。 你曾警告称,智能体会让行业“梦游”般地陷入安全危机,你这么说的意思是什么?你看到了哪些迹象表明我们已经在走这条路了?智能体和其他非人类身份正在迅速激增,在某些企业中,它们的数量已经超过人类用户,比例超过80比1。
8/22/2025 7:40:24 AM
Mirko
企业实施机器学习安全运维时将面临的六大挑战
在实施AI的过程中,若企业不对其安全计划进行适应性调整,就可能面临各种新旧威胁。 机器学习安全运维(MLSecOps)通过将AI和机器学习(ML)开发与严格的安全准则相结合,解决了安全边界中的这一关键缺陷。 根据开放软件安全基金会(Open Software Security Foundation)的一份白皮书,建立稳固的MLSecOps基础对于主动降低漏洞风险和简化先前未发现缺陷的修复流程至关重要。
8/22/2025 7:38:23 AM
Christopher
仅50天!百度蒸汽机视频生成大模型升级2.0版本,价格低至行业70%
8月21日,百度蒸汽机(MuseSteamer)音视频一体化模型完成重大升级,Turbo版、Lite版、Pro版,及有声版全面开放,在行业内首次实现多人有声音视频一体化生成。 百度蒸汽机通过五大技术突破实现“需求即成片”,在生成电影级高清视频画面的同时,实现逼真环境音效、自然人物语音的同步输出。 即日起,用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户可在千帆平台享受高性能视频生成服务。
8/21/2025 6:33:48 PM
云昭
仅50天!百度蒸汽机视频生成大模型升级2.0版本,价格低至行业70%,百万级特效降至“百元”
8月21日,百度蒸汽机(MuseSteamer)音视频一体化模型完成重大升级,Turbo版、Lite版、Pro版,及有声版全面开放,在行业内首次实现多人有声音视频一体化生成。 百度蒸汽机通过五大技术突破实现“需求即成片”,在生成电影级高清视频画面的同时,实现逼真环境音效、自然人物语音的同步输出。 即日起,用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户可在千帆平台享受高性能视频生成服务。
8/21/2025 6:17:21 PM
云昭
GPT-5点赞!八大顶尖机构发布「自进化智能体」全面综述
LLM驱动的AI智能体已展现出惊人潜力:它们以LLM为核心,集成感知模块(处理文本/图像/音频/视频)、规划模块(如链式思考CoT或树式思考ToT)、记忆模块(短期上下文存储与长期知识检索)和工具模块(调用API如搜索引擎或代码执行器)。 在单智能体系统中,这些组件协同工作,处理从网页导航、代码生成、投资辅助到生物医学分析的任务。 而在多智能体系统(MAS)中,智能体间通过协作(如辩论或任务分解)攻克复杂问题,模拟人类团队的群体智能。
8/21/2025 2:14:17 PM
新智元
GPT-5空间智能大考:简单任务称王,复杂挑战平手,所有模型都输给了人类
大家好,我是肆〇柒。 今天我们要探讨一篇由 DeepMind 联合 Stanford HAI(斯坦福以人为本人工智能研究院)共同发布的重磅实证研究报告。 这份报告首次对GPT-5的空间智能能力进行了系统性、标准化的全面评估,其结论可能会更加清晰我们对当前AI能力边界的认知。
8/21/2025 2:10:43 PM
肆零柒
USENIX Security 25 | TEE+Legacy GPU混合算力下的模型隐私安全攻防
近日,字节跳动安全研究团队、北京大学和伊利诺伊大学香槟分校合作的研究论文《Game of Arrows: On the (In-)Security of Weight Obfuscation for On-Device TEE-Shielded LLM Partition Algorithms》被安全领域国际顶会USENIX Security收录。 USENIX Security 会议是网络与信息安全领域的四大顶级会议之一,也是中国计算机学会推荐的网络与信息安全领域A类国际学术会议。 该会议享有广泛的学术影响和深厚的学术底蕴,近五年平均录用率约为20%。
8/21/2025 2:05:07 PM
字节跳动技术团队
CIO可能无意间阻碍AI战略落地的方式
奥斯卡·王尔德曾说:“以最美好的初衷,往往做出最糟糕的作品。 ”几乎所有目睹过精心策划的AI战略突然分崩离析的CIO都会证明,善意并非成功的保证。 没有哪位CIO希望破坏或延误重要的AI计划,但这种情况发生的频率远超许多领导愿意承认的程度,因此,对AI计划进行强有力的控制,现已成为CIO的首要任务。
8/21/2025 11:49:27 AM
John
智创飞跃|AI 社会公益,科技温暖人心
Google 谷歌坚持以科技力量为社会带来积极改变,一起走进 2025 Google 开发者大会,深入探索谷歌携手开发者、创作者及生态伙伴共同打造的一系列“AI 社会公益”创新实践,了解如何通过技术使人人受益。 谷歌始终关注如何将技术转化为人类福祉的推动力。 面对因身体挑战而产生的沟通或行动障碍,谷歌正努力通过 AI 提供更包容、更具人性化的解决方案,让每个人都能跨越障碍,与世界建立连接,从而获得更广阔、更自主的人生。
8/21/2025 11:46:08 AM
一张图0.1秒生成上半身3D化身!清华IDEA新框架入选ICCV 2025
一张图就能创建上半身动作视频,方法还入选了ICCV 2025! 来自清华大学、IDEA(粤港澳大湾区数字经济研究院)的研究人员提出新框架GUAVA,不需要多视角视频、不需要针对不同个体单人训练,仅需0.1秒就能从单图创建一个上半身3D化身。 通常来说,创建逼真且富有表现力的上半身人体化身(如包含细致面部表情和丰富手势),在电影、游戏和虚拟会议等领域具有重要价值。
8/21/2025 11:06:55 AM
字节突然开源Seed-OSS,512K上下文碾压主流4倍长度!推理能力刷新纪录
字节跳动突发开源大模型,一出手就是360亿参数的Seed-OSS-36B。 图片这个Seed-OSS的命名方式,明显是在呼应OpenAI此前发布的GPT-OSS系列。 与OpenAI的开源策略也是一样,并没有直接开源核心商业模型豆包(Doubao),而是基于内部技术打造了一个专门面向开源社区的版本。
8/21/2025 10:59:42 AM
刚刚,GPT-5 Pro自证全新数学定理!OpenAI总裁直呼颠覆,大佬们集体转发
AI真的能解决人类的前沿问题吗? 比如类似庞加莱猜想、求解麦克斯韦方程、费马大定理、黎曼猜想等问题。 今天这个问题有了答案。
8/21/2025 10:11:44 AM
算力投入超阿波罗登月!Anthropic联创:Claude没有刷榜水军!CC击败Cursor、MCP成功,秘诀在于把模型当用户!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)Claude Code 为什么能在市场上战胜 Cursor? 对于创业者来说,如何在 API 之上构建自己的产品,又不担心被大模型干掉? 在最新一期播客里,Anthropic 联合创始人 Tom Brown 分享了 Claude Code 的成长故事。
8/21/2025 9:49:22 AM
伊风
三人团队击败科技巨头:RF-DETR如何成为目标检测新王者
说实话,当我看到一个仅3人团队打造的目标检测模型RF-DETR,居然能在性能上碾压Google、Meta等科技巨头的数百人研发团队时,第一反应是——这怎么可能? 但事实就是这么魔幻。 在刚刚发布的最新评测中,RF-DETR不仅成为首个在COCO数据集上突破60mAP的实时模型,更是在新发布的RF100-VL真实世界数据集上大幅领先YOLO、D-FINE等知名模型。
8/21/2025 9:29:18 AM
阿丸笔记
波士顿动力Atlas人形机器人再现逆天进化:通用AI机器人真的要来了
不是标题党,波士顿动力是真的很强,他们刚刚发布了一个视频,直接硬控我了,这是我目前看到过最震撼的人形机器人,看视频波士顿动力已经证明,可以训练出多任务、语言驱动的策略模型,来控制自家的 Atlas人形机器人完成那些既需要移动又需要灵巧全身操作的长期任务。 这种数据驱动的方法是通用的,几乎可以应用于任何能通过遥控操作演示的任务波士顿动力野心还是很大的,从一开始就想着构建通用人形机器人,波士顿动力认为未来的通用人形机器人,需要掌握一长串复杂的技能。 它们不仅要能灵巧地操作形态各异的物体(比如硬的/软的、重的/轻的、刚性的/铰接的、大的/小的),还需要协调整个身体来调整姿态、改造环境、躲避障碍,并在应对突发状况时保持平衡。
8/21/2025 9:15:00 AM
资讯热榜
量大管饱!我整理了10个好用到爆的即梦4.0进阶玩法
全球高校 “猎杀” AI作业!学生如何应对 “人类化” 挑战?
AI 数据版权新纪元:Real Simple Licensing 协议引发行业关注
ChatGPT能随便连MCP了!对话就能开发票、帮退款…奥特曼的野心毕露:将OpenAI打造成全能型平台!开发者:太危险了不敢用
OpenAI进军韩国市场,携手三星与SK海力士共建AI未来!
为什么 LangChain ReAct 机制值得关注 ?
幻觉成了AI的“癌症”,连OpenAI也治不了
数十亿人将用上免费AGI!OpenAI奥特曼高调断言:全球经济将迎来极度通缩!效率强如DeepSeek,全球AI也需百吉瓦能源!
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
智能体
马斯克
AI新词
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
大语言模型
华为
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
编程
DeepMind
亚马逊
特斯拉
AI模型