理论
让机器人在人群中穿梭自如,港科广&港科大突破社交导航盲区 | ICRA 2025
机器人落地复杂场景,社交导航能力一定是避不开的关键一点。 先简单介绍下,社交导航 (SocialNav,Social navigation) 是指在人机共存的环境中,机器人在遵循社会规范的前提下执行导航任务。 就拿下图来说,机器人需导航至目标点,而目标恰好位于两名行人未来轨迹的交汇区域。
4/2/2025 9:50:00 AM
量子位
免费的「网页版Cursor」!新版DeepSeek-V3加持,秒秒钟编出一个游戏/APP
借助新版DeepSeek-V3,任何人现在可以一次性创建任何应用或游戏了——而且是一边开发一边看效果的那种。 在Hugging Face中,这个名为DeepSite的应用火了。 有网友直呼,这不就是网页版“Cursor”!
4/2/2025 9:45:00 AM
量子位
两位华人76页论文解决量子领域核心问题:首次证明伪随机性真实存在
量子领域的一个核心开放问题,就这样被两位华人研究员解决了? 事情是这样的。 一直以来,量子的随机性在计算和密码学中极为有用。
4/2/2025 9:40:00 AM
量子位
DeepSeek-V3击败R1开源登顶!杭州黑马撼动硅谷AI霸主,抹去1万亿市值神话
DeepSeek依然很能打,春节余波还在扩散! 据AI产品分析平台aitools.xyz统计,DeepSeek每月新增网站访问量超过了ChatGPT。 作为异军突起的现象级产品,DeepSeek的增长速度除了创造AI产品的增长奇迹,更是重新定义了全球的AI竞赛格局。
4/2/2025 9:21:00 AM
新智元
Vibe Agent: Token成本直降90%,会对话就能创造专属本地Agent
刚刚,Local AI 领域的 Libra 团队发布了一段最新技术演示视频,展示了用户通过自然语言交互直接生成 Agent,并利用本地消费级算力支持 Agent 进行长程 (Long-Horizon) 推理,最终完成复杂任务。 Libra 构建的本地化、即时响应、自我规划方案为行业开辟了一条全新的长程推理 Agent 技术路径,实现了从手工 Agent 设计向端到端 In-Context Vibe Agent 生成范式演进。 从官网信息来看,Libra 的技术方案直接回应了制约 Agent 技术普及的两大关键瓶颈:一方面,当前热门 Agent 产品如 Cursor、Devin、Manus 等虽功能强大,但运行成本高昂 —— 专业评测显示单次使用 Manus 可消耗约 1000k Token(起步 2 美元)。
4/2/2025 9:19:00 AM
机器之心
孙正义豪掷1万亿,机器人帝国崛起!总额远超星际之门,劳动力末日翻盘
报道称,在「星际之门」放血5000亿后,软银又拿着1万亿砸向机器人! 孙正义将在美国各地创建配备AI工厂的工业园区,用人形机器人助力制造业解决劳动力短缺难题。 机器人军团领衔,AI工厂重定义制造业在软银的宏伟蓝图中,AI工厂成为核心。
4/2/2025 9:15:00 AM
新智元
吉卜力太火,奥特曼求饶!GPT-4o免费生图登王座,设计师直呼天塌了
OpenAI再次火爆全网,而且接近一周了,GPT-4o带来的热潮还未停歇。 现在免费用户也可以使用生图功能了,更多人涌进了GPT-4o。 显然,靠吉卜力图像形成的病毒式传播,让奥特曼和整个OpenAI团队都没想到。
4/2/2025 9:10:00 AM
新智元
超低成本复现QwQ!数学推理模型训练迎来RL暴击,数据代码模型全开源 | 蚂蚁&清华出品
用上这个开源框架,2天时间就能刷新7B数学推理纪录! 蚂蚁清华联手开源的强化学习框架AReaL-boba,直接把推理模型训练带到了Next Level——训练成本下降的同时,训练速率、推理能力还大幅提升的那种。 除了前面提到的7B模型,在32B模型上,只需两百美元、200条数据,就可以轻松复现QwQ-32B,就是数学推理能力媲美DeepSeek-R1,一战封神的那个。
4/2/2025 9:00:00 AM
量子位
DeepSeek R1本地训练全流程实操指南,手把手教你打通其“任督二脉”
作者 | asher许多关于 DeepSeek R1 的复现文章,主要聚焦在“rewards的设计、训练指标的变化、benchmark测评”这些内容,但是对于“本地训练”这个开启深度探索的关键前置步骤,却很少有人深挖。 可能有人觉得,照着readme操作就能轻松训练了吧? 太天真啦!
4/2/2025 9:00:00 AM
腾讯技术工程
如何利用人工智能和事件驱动设计实现播客推广的自动化
译者 | 李睿审校 | 重楼为了普及知识和推广技术,人工智能专家、本文作者Sean Falconer主持着两个播客——《Software Engineering Daily》和《Software Huddle》,并经常以嘉宾身份亮相于其他节目。 无论是主持播客还是作为嘉宾,他推广的节目都有助于凸显其精彩的对话内容。 然而对他来说,在紧张的工作和生活中腾出时间为每期节目撰写一篇具有思想深度的LinkedIn帖子是一项挑战,并非每次都能实现。
4/2/2025 8:55:13 AM
李睿
OpenAI重新开源!第一弹就推理模型,还不限制商用,“冲着DeepSeek来的” 关注前沿科技 量子位 2025年04月01日 08:38
一夜之间,OpenAI更新三大动向,开源、融资、用户暴增。 第一,将开源一个具备推理能力的大语言模型,包含参数权重那种。 上一次这样开源还是6年前推出GPT-2。
4/2/2025 8:40:00 AM
量子位
人工智能应用就是大模型能力+场景,基于大模型构建应用,首先要了解大模型的能力圈
在关于大模型应用方面,虽然也了解和应用过其中的一些技术;但经过这段时间的实践和思考发现,对大模型应用的认识还很浅显,因此在此记录一下自己的思考。 大模型应用的思考大模型作为人工智能应用的底座技术,所有应用场景和技术都是构建在大模型之上;但很多时候我们都搞错了一件事,那就是我们没有搞清楚大模型能力和其它技术的关联和区别。 因此,在这里我们要搞清楚一个概念,那就是大模型能力;所谓大模型的能力,就是模型开发人员怎么把模型做的更好更强,其中设计到模型的设计,训练等;具体有神经网络架构,模型蒸馏等等。
4/2/2025 8:40:00 AM
DFires
人工智能冲击“外包大国”,影响印度3500亿美元产业
印度的外包服务业是其经济的重要支柱之一,也是全球知名的“外包大国”。 然而,随着人工智能的崛起,这一产业正面临前所未有的挑战。 德国科技杂志《t3n》近日引述美国投行伯恩斯坦的报告报道称,由于AI能够以更快、更便宜、更精准的方式完成许多人类工作,将冲击印度未来20年进入劳动力市场的5亿年轻人。
4/2/2025 8:28:26 AM
突发,Meta人工智能研究副总裁发帖:5月离职!
编辑|云昭出品 | 51CTO技术栈(微信号:blog51cto)很突然,Meta 人工智能研究副总裁Joelle Pineau表示下月将离职Meta。 就在发稿7小时前,她在Facebook帖子中宣布了这一消息。 Pineau表示,她将在5月离职,此前她已负责管理Meta内部由Yann LeCun领导的人工智能研究实验室FAIR超过两年。
4/2/2025 8:27:41 AM
云昭
AI在主数据中的十大应用|用例和优势
一 概述在当今数字化环境中,企业面临的挑战不仅包括管理海量数据,还包括处理各种复杂数据,尤其是来自物联网 (IoT) 设备和联网技术等新兴来源的数据。 云技术的重大转变使这一情况更加复杂,促使企业不再仅仅采购基础设施,而是更加战略性地利用技术和服务,以最大限度地提高数据资产价值。 “数据敏捷性”概念应运而生,成为应对这种情况的关键。
4/2/2025 8:00:00 AM
晓晓
由浅入深,带大家了解什么是 Agent
大家好! 最近你可能经常听到一个词——“Agent”,尤其是在聊人工智能(AI)的时候。 听起来有点高大上,甚至有点神秘?
4/2/2025 8:00:00 AM
用户007
从零到一,用 Dify 打造 NL2SQL
近期 AI 大火,朋友圈很多都在晒成果。 我也禁不住尝试,使用Dify这一开发平台做了第一个 AI 应用。 整体感觉下来还是非常方便的,也是由于Dify的出现大大降低了构建 AI 应用的门槛,相信未来真的可以解放人的双手,让 AI 帮助我们解决更多的问题。
4/2/2025 7:30:37 AM
韩锋
如何识别和预防深度伪造诈骗
这些被篡改的内容在社交媒体、即时通讯应用和视频分享平台上广泛传播,模糊了现实与虚构之间的界限。 “Deepfake”一词是在2017年由一位Reddit用户创造的,当时该用户创建了一个以此命名的子论坛(subreddit)。 这个子论坛被用来分享AI生成的视频,其中经常包含名人换脸的色情内容。
4/2/2025 7:30:00 AM
Sinisa
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用