AI
又是浙大校友!AI眼镜“隔空取物”,戴上即可随心选中现实世界任意物体
只靠说话和AI眼镜互动,确实有点不方便。 现在新玩法来了! 数字替身帮你“隔空抓物”,混合现实即时选择现实世界的物体作为上下文。
字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限
强化学习(RL)范式虽然显著提升了大语言模型(LLM)在复杂任务中的表现,但其在实际应用中仍面临传统RL框架下固有的探索难题。 一个普遍存在的现象是:在训练过程中,模型的熵值迅速下降,推理路径趋于固化,导致“利用(exploitation)”远超“探索(exploration)”,严重失衡。 这种过早收敛不仅削弱了模型的多样性生成能力,也限制了其性能上限的进一步突破。
人工智能能否实现类人记忆?探索思想上传之路
译者 | 涂承烨审校 | 重楼记忆帮助人们记住“我是谁”。 它保存着人们的经历、知识和情感。 过去,记忆被认为只存在于人脑中。
供应链管理中高价值AI应用场景的识别
AI已融入供应链的几乎所有解决方案中,成为提升销售额和利润率、同时引发人们浓厚兴趣的手段。 在竞争日益激烈的环境中,许多企业为抢占先机或保持竞争力,纷纷急于采用AI技术,但有时方式过于表面、效果不佳,最终未能创造真正的价值。 例如,在供应链应用领域,只有一小部分AI应用能通过显著的投资回报率创造真正的价值,AI已成为现实,但许多解决方案无法有效满足企业需求,更不用说克服实际的供应链挑战了,因此,关键是要透过表象,确保任何实施都能兑现承诺。
Self-Play Critic:以“对抗博弈”创新大语言模型推理评估
大家好,我是肆〇柒。 今天,我想和大家聊一项创新的评估思路——Self-Play Critic(SPC)。 大型语言模型(LLM)目前已成为我们生活和工作中不可或缺的工具。
一篇120页AI4Research(科学研究AI)最新系统性综述
尽管AI在科学研究中的应用取得了显著进展,但目前仍缺乏对AI在科学研究(AI4Research)中应用的全面综述,为了填补这一空白,提出了一个全面的AI4Research调查,旨在提供一个统一的视角,并系统地分类AI在研究中的应用。 AI4Research的主流流程和分类,可以分为五个关键领域:(1)用于科学理解的AI,(2)用于学术调查的AI,(3)用于科学发现的AI,(4)用于学术写作的AI,以及(5)用于学术同行评审的AI。 这些领域各自有助于提升AI融合研究与出版的有效性和效率。
AI 智能体记忆机制详解
是否总感觉你在和 AI 助手重复着同样的对话? 你告诉它一些重要的事情,五分钟后,它就忘了。 很长一段时间以来,这就是和大多数 AI 进行对话的现实情况。
构建 AI 护城河的六大常见误区分析
这篇文章是反面教材:介绍六种最常见的误区 —— 它们看似是护城河,实则因未能夯实金字塔的核心能力层,而在悄然削弱你的竞争优势。 误区一:“我们拥有数十年积累的数据,因此占据优势。 ”现实情况:历史数据往往分散杂乱、标注混乱,或尘封在无人愿意触碰的旧系统中。
AI Agent系统的安全能力及可信治理的“三道防线”
在AI技术加速演进与广泛落地的当下,Agent系统作为具备自主感知、推理与执行能力的智能体,正日益成为企业智能化转型的核心驱动。 然而,随之而来的系统复杂性、任务自治性以及跨域协同能力,也引发了前所未有的安全挑战与治理难题。 为了构建一个既高效运行又可控可信的Agent系统,亟需在架构层面引入系统性的安全防护与治理机制。
AI应用开发的三个挑战
虽然AI技术已经广泛应用到许多业务场景,但真正成熟且有价值的AI应用还是凤毛麟角,常见的应用主要集中在AI助手和知识库之类,虽然企业管理者也希望将AI真正嵌入到管理流程和业务流程中,但效果还有待验证。 之所以如此,一方面,LLM与AI技术还有待进一步完善和提高,另一方面,大多数企业缺乏合格的AI开发人员。 除去这两方面的原因,我认为主要受制于AI应用开发面临的三个挑战。
告别适配器:通用工具调用协议(UTCP)如何简化 AI 工具通信
UTCP 让任何 AI 代理都能直接跟任何工具对话——不管是 HTTP、gRPC、WebSocket,还是你的本地 CLI——无需包装器、无延迟、无锁定。 什么是 UTCP? UTCP 是一个全新标准,专为帮助 AI 代理与各种外部工具沟通而设计,不论这些工具用的是什么语言、风格或接口。
炸裂!Apipost离线可用+AI全栈覆盖,2s开启速度无敌了!
Apipost是一款面向开发人员,包括前端、后端、测试人员以及团队协作的API开发管理工具,它集API文档开发、设计、调试、Mock、自动化测试及管理于一体,已形成从API设计、调试、文档生成、自动化测试到性能测试和管理的完整闭环,尤其在AI大模型集成、文档智能化生成领域持续突破,成为国内数百万开发者和测试人员构建高效研发链路的核心工具。 与其他传统工具相比,Apipost最大的优势在于无需登录即可使用,支持离线调试,同时保持了对复杂测试场景的支持;笔者近期在使用Apipost最新V8.1.20版本时还发现,其开启速度只需2s。 一、Apipost核心优势Apipost非常适合需要团队协作、注重文档管理和轻量体验的API开发团队。
AI生死局仅存6位玩家!Claude之父:大模型天生就有“搞钱”冲动!做了CC才能懂模型如何进化!即使AI停滞,产品还要再做十年
出品 | 51CTO技术栈(微信号:blog51cto)说起来,今天已经立秋了,但 AI 圈的这个“盛夏”显然还没结束。 这几天,几大巨头接连出招,行业硝烟味渐浓。 明天大概率还有GPT-5要出来炸场。
刚刚,GPT-5内测抢先泄露!推理强到离谱,智商被曝140超越人类天才
就在明天,GPT-5总算要靴子落地了。 周五凌晨,GPT-5、GPT-5 Mini和GPT-5 Nano将同时推出。 全网用户都可以立即通过API和ChatGPT访问这三个模型。
一夜颠覆Sora神话,H200单卡5秒出片!全华人团队开源AI引爆视频圈
单块H200,5秒即生一个5秒视频。 最近,UCSD、UC伯克利、MBZUAI三大机构联手,祭出FastWan系视频生成模型。 论文地址:「稀疏蒸馏」全新的训练方案,实现了高效生成,让视频去噪速度实现70倍飙升。
OpenAI重磅发布gpt-oss系列开源大模型:媲美 GPT-4o
不论你是独立开发者、企业还是研究机构,现在都可以免费拥有一款与 GPT-4o 接近实力的语言模型。 开源但不“阉割”:媲美 GPT-4o,运行成本极低OpenAI 在这次发布中非常有诚意:gpt-oss-120b:在核心推理任务上已接近 GPT-4o-mini,支持 128k 上下文,单卡 80GB GPU 可跑。 gpt-oss-20b:性能对标 GPT-3.5(o3-mini),仅需 16GB 显存,可部署于消费级设备、本地推理、离线使用等场景。
GPT-5内测抢先公布:日常推理首次击败人类,编程数学科学问题能力都很强
疑似GPT-5发布的预告才刚刚发出,内测体验已抢先释出。 推理能力首次超越人类,碾压所有大模型。 这来自一位网友的实测结果,他让所有模型开启推理模式做了10道题,只有GPT-5只错了一题,比人类的正确率还高。
AI Agent原生企业有哪些发展趋势与机遇
随着技术成熟与应用场景拓展,以智能Agent为核心构建业务流程、组织架构与产品服务的原生企业将会迎来一个高速增长期——这些企业将崛起于各行各业,并展现出高度的敏捷性、自适应性与创新能力,成为引领产业变革的新兴主体。 未来,Agent原生企业将会有哪些发展趋势与机遇呢? AI Agent原生企业的趋势和机遇发展趋势展望未来,AI Agent原生企业将会有以下几个发展趋势:(一)“Agent-first”业务逻辑成为主流设计范式。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉