AI
毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔
OpenAI的o3发布以来,这个功能让不少网友觉得毛骨悚然——它能准确破解你的地理位置! 就在刚刚,Lanyrd联创、Django Web框架缔造者Simon Wilson专门发了一篇博客,详尽推敲了o3究竟是如何猜测照片拍摄地点的。 他将整个过程评价为:既超现实,又反乌托邦,仿佛几十年前的科幻小说突然变成现实!
4/28/2025 9:08:00 AM
新智元
一行代码不用写,AI看论文自己「生」出代码库!科研神器再+1
这几年,AI领域的科研人员遇到一个问题。 那就是机器学习的论文实在是多到看不过来,更别说还要用代码实现论文中逻辑。 HuggingFace上的「每日论文」板块每天都有十几篇新出的研究论文这导致一个问题,研究者往往「重视结果」而没有精力来用用代码验证,并且复现很多先前的工作有点「重复造轮子」,浪费研究者的精力。
4/28/2025 9:06:00 AM
新智元
理解 RAG 第五部分:管理上下文长度
传统的大型语言模型 (LLM)存在上下文长度限制,这限制了单次用户与模型交互中处理的信息量,这是其主要局限性之一。 解决这一限制一直是 LLM 开发社区的主要工作方向之一,提高了人们对增加上下文长度在生成更连贯、更准确响应方面优势的认识。 例如,2020 年发布的 GPT-3 上下文长度为 2048 个 token,而其更年轻但功能更强大的兄弟 GPT-4 Turbo(诞生于 2023 年)允许在单个提示中处理高达 128K 个 token。
4/28/2025 9:02:14 AM
科大讯飞:重回双位数增长,AI 大模型竞赛展现强劲实力
近日,科大讯飞发布了其2024年财报,令人振奋的是,该公司营收达到了233.43亿元,同比增长18.79%。 这标志着科大讯飞时隔两年后重新回到了双位数的增长轨道。 同时,归母净利润也达到了5.6亿元,显示出其盈利能力的稳步回升。
4/28/2025 9:00:41 AM
AI在线
ICLR 2025 | 无需训练加速20倍,清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM
论文有两位共同一作。 郑凯文为清华大学计算机系三年级博士生,何冠德为德州大学奥斯汀分校(UT Austin)一年级博士生。 扩散模型(Diffusion Models)近年来在生成任务上取得了突破性的进展,不仅在图像生成、视频合成、语音合成等领域都实现了卓越表现,推动了文本到图像、视频生成的技术革新。
4/28/2025 9:00:00 AM
机器之心
基于奖励驱动和自组织演化机制,全新框架ReSo重塑复杂推理任务中的智能协作
本文由上海人工智能实验室,悉尼大学,牛津大学联合完成。 第一作者周恒为上海 ailab 实习生和 Independent Researcher 耿鹤嘉。 通讯作者为上海人工智能实验室青年科学家白磊和牛津大学访问学者,悉尼大学博士生尹榛菲,团队其他成员还有 ailab 实习生薛翔元。
4/28/2025 8:50:00 AM
机器之心
AI无边界:通过MCP实现不同智能体框架的协作(含代码)
在人工智能飞速发展的当下,智能体框架如雨后春笋般不断涌现。 从LangChain利用高度抽象的方式构建智能体,到CAMEL - AI为用户提供细致配置选项来创建智能体,不同框架各显神通。 但这些框架之间就像说着不同“方言”的个体,彼此沟通困难重重。
4/28/2025 8:29:04 AM
大模型之路
AI图像分割新王者:BiRefNet如何重新定义视觉精度边界?
一、当“抠图”变成毫米级手术:BiRefNet的技术突破你是否想过,为什么电商商品图能精准抠出发丝? 为什么自动驾驶车辆能瞬间识别行人轮廓? 答案可能藏在一种名为BiRefNet的AI模型中。
4/28/2025 3:22:45 AM
智Echo
答对有资格入职特斯拉?马斯克这道数学题,我们用七大 AI 模型测了一遍
此前,马斯克在社交平台 X 上贴出了一道数学题,并表示如果有人解开这个问题,就有资格在特斯拉公司工作,引起了很多网友的讨论
4/27/2025 2:57:01 PM
汐元
阿里AI旗舰应用夸克发布全新“AI相机” 提升AI超级框多模态能力
4月27日,夸克AI超级框发布全新AI相机,上新“拍照问夸克”功能。 基于视觉理解与思考推理的强大模型能力,夸克AI超级框从视觉出发创新下一代搜索体验,进一步理解和回答物理世界中的各类问题。 作为阿里巴巴AI旗舰应用,夸克AI超级框持续快速迭代,提升超级智能体的多模态能力,打造用户生活、工作、学习的AI超级入口。
4/27/2025 11:49:00 AM
郑佳美
美的加速布局人形机器人,类人机器人五月进驻洗衣机工厂
据新浪科技消息,美的中央研究院人形机器人创新中心负责人近日透露,美的今年将重点发力全人形及类人形机器人产品的迭代。 预计今年5月,美的自研的类人机器人将进入湖北荆州洗衣机工厂进行应用尝试。 此外,美的计划在今年下半年逐步在部分门店开始部署相关机器人产品。
4/27/2025 11:00:28 AM
AI在线
一文详解深度学习中的标量、向量、矩阵、张量
在深度学习领域,标量、向量、矩阵和张量是不可或缺的基本概念。 它们不仅是数学工具,更是理解和构建神经网络的关键。 从简单的标量运算到复杂的张量处理,这些概念贯穿于数据表示、模型构建和算法优化的全过程。
4/27/2025 9:59:38 AM
Goldma
英伟达华人硬核AI神器,「描述一切」秒变细节狂魔!仅3B逆袭GPT-4o
有了AI,谁还愿意用手配「字幕」? 刚刚,英伟达联手UC伯克利、UCSF团队祭出首个神级多模态模型——Describe Anything Model(DAM),仅3B参数。 论文地址: Anything,上传一张图,圈哪点哪,它即可生成一段丰富的文字描述。
4/27/2025 9:54:48 AM
AI、BI、大数据与数据科学的底层逻辑
数据正在重塑世界。 每天早上醒来查看健身数据、刷信用卡时的授权验证、公司会议上讨论的销售增长曲线——数据已经无缝融入我们的生活。 但在这个数据爆炸的时代,我们真的理解AI、BI、大数据和数据科学的本质区别吗?
4/27/2025 9:52:49 AM
大数据AI智能圈
AI编码陷阱防不胜防?看看 Cursor设计负责人Ryo Lu 是怎么说的
前不久,Cursor 设计总监 Ryo Lu 在 X 上发布了若干最佳实践建议():内容基本匹配我的使用体感,工具始终是工具,即使如 Cursor,效果好坏最终还是取决于”用的人“使用得当的 Cursor 可以让你写出快速、干净的代码;使用不当,它会生成让你清理一周的 AI 意大利面代码。 本文将围绕这一核心观点,结合实际经验,扩展聊聊 Ryo Lu 给出的建议。 从项目规划到代码实现、从提示设计到错误修复,我们将逐条介绍正确用法、常见误区以及实战技巧。
4/27/2025 9:33:01 AM
强化学习被高估!清华上交:RL不能提升推理能力,新知识得靠蒸馏
最近,以推理能力为核心的大语言模型已然成为了主流,比如OpenAI o系列模型、DeepSeek-R1等等。 推理模型在处理数学和编程等复杂逻辑问题方面取得了显著突破。 相比于之前依赖人工标注进行指令微调的方法,这一突破的关键在于可验证奖励强化学习(RLVR)。
4/27/2025 9:23:00 AM
新智元
Anthropic CEO豪言LLM黑箱5年内必破!研究员爆料:AI有意识概率已达15%
未来,AI会拥有意识,并像人类一样体验世界吗? 现在没有实锤证明AI具有意识,但Anthropic认为这事说不定真有可能。 周四,Anthropic宣布启动这项研究,旨在了解AI的「幸福感」到底算不算数,是否需要认真对待。
4/27/2025 9:21:00 AM
新智元
看不懂GitHub代码?刚刚这个AI工具让全球每个GitHub项目开口说话
还记得那个号称全球首位 AI 软件工程师 Devin 吗? 它的创造者Cognition Labs公司刚刚推出了一个名为 DeepWiki 的项目。 简单来说,这是一个目标宏大的计划:为全世界每一个 GitHub 代码仓库(Repo)提供可以实时交流、即时更新的文档你可以把它想象成一个由 Devin 技术驱动的、专门针对 GitHub 的“深度研究”工具亮点:免费、免注册、即刻可用最关键的是,对于开源项目,这项服务完全免费,甚至无需注册怎么用?
4/27/2025 9:19:20 AM
opencat
资讯热榜
一张合影就能泄露全家信息?央视紧急预警:“读心AI”正让社交晒图变成隐私炸弹
阿里云通义模型首次大规模赋能双11,单日翻译调用量突破14亿次
ECAI 2025|基于语义增强的弱语义低资源语言机器翻译:让“难以翻译的文字”被理解
AMD CEO 透露:多家OpenAI 级别客户争相采购AI芯片
OpenAI CEO:大学学位的回报率将快速下降,但 AI 应用前景广阔
OpenAI首席执行官奥特曼:失败时我不希望政府来帮忙
刚刚,豆包编程模型来了,我们用四个关卡考了考它!
拷问 MLLM 空间想象力:SpatialViz-Bench 新基准发布,程序化生成防“数据污染”,Gemini-2.5 Pro 也仅答对 44.66%
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
AI新词
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
AI for Science
Agent
苹果
芯片
Claude
腾讯
Stable Diffusion
蛋白质
开发者
生成式
xAI
神经网络
机器学习
3D
RAG
AI视频
人形机器人
研究
具身智能
大语言模型
百度
生成
GPU
Sora
工具
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
深度学习
生成式AI
架构
DeepMind
亚马逊
特斯拉
编程
AI模型
视觉
Transformer
预测
MCP