AI
Claude团队开盒Transformer:AI大脑原来这样工作
大模型工作机制的黑盒,终于被Claude团队揭开了神秘面纱! 团队创造了一种解读大模型思考方式的新工具,就像给大模型做了个“脑部核磁”。 他们还发现,Claude在某些任务上具备长远规划能力,甚至还会为了迎合人类而编造推理过程。
17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤
AI社区掀起用大模型玩游戏之风! 例如国外知名博主让DeepSeek和Chatgpt下国际象棋的视频在Youtube上就获得百万播放,ARC Prize组织最近也发布了一个贪吃蛇LLM评测基准SnakeBench。 针对这一场景,来自港大、剑桥和北大的研究人员发布了一个更全面、客观可信的LLM评测基准:GameBoT。
哈佛学霸被当场遣返,Nature曝出75%科学家想逃离美国!欧洲加拿大光速抄底
特朗普狂砍学术界经费,恶果来了! 欧洲抄底美国人才这种百年难遇的机会,如今真来了? 根据Nature的调查,约1200名美国科学家表示,他们正在考虑离开美国,首选欧洲和加拿大。
港大开源博士级AI智能体,独立完成三篇算法研究,一站式科研6小时搞定
这三篇论文,出自同一AI之手。 随着人工智能技术的迅猛发展,OpenAI提出的五级模型(涵盖从对话系统到协作管理者)已成为行业发展的重要参考框架。 其中,“自主研究智能体”(Autonomous Research Agent)作为第三至第四阶段的核心技术,正受到全球范围内越来越多的关注。
专抓AI“看图说谎”,谷歌哥大用三类陷阱触发幻觉,打造可随技术发展动态演进的评估框架
幻觉(Hallucination),即生成事实错误或不一致的信息,已成为视觉-语言模型 (VLMs)可靠性面临的核心挑战。 随着VLMs在自动驾驶、医疗诊断等关键领域的广泛应用,幻觉问题因其潜在的重大后果而备受关注。 然而,当前针对幻觉问题的研究面临多重制约:图像数据集的有限性、缺乏针对多样化幻觉触发因素的综合评估体系,以及在复杂视觉问答任务中进行开放式评估的固有困难。
AI大模型看手相!图片视频加持深度思考,阿里QVQ-Max“神了神了”
阿里又发了个有意思的大模型——QVQ-Max,第一版视觉推理模型,对任意图像或视频都可以进行深度思考。 举个有趣的例子,上传一张你的手掌,再点击Thinking,QVQ-Max就可以给你看手相:可以看到,在深度思考过后,QVQ-Max就开始逐步分析手掌上的线条和其他特征。 包括心线、头线、生命线等主要线条的分析,以及戒指手指上的金戒指的象征意义。
1个实战案例搞懂AI大模型的"万能手"MCP协议,微软也下场了
最近爆火的 MCP(Model Context Protocol,模型上下文协议) 是 Anthropic 公司推出的一种开放协议。 目的是让 AI 智能体(如 Claude、ChatGPT 等) 能像“万能插座”一样,轻松连接各种外部工具和数据源,比如日历、数据库、邮件系统、代码编辑器等。 图片MCP 本质就是一个标准。
Deepseek V3升级!更快、更准、更聪明!
前言大家好,我是林三心,用最通俗易懂的话讲最难的知识点是我的座右铭,基础是进阶的前提是我的初心~🎈 编程的兄弟们都知道,现阶段咱们的开发真的离不开 AI,尤其是碰到一些代码技术上的难题的时候,AI 简直是太好使了,以前咱们要花几个小时去网上查找资料,而现在通过 AI 给出答案,只需要几秒钟 ❗️❗️❗️但是,现在的AI界也是卷出了新的高度,从年前的DeepSeek到Manus每一次的话题都能引爆全网热议。 要问目前AI产品的顶流,问小白现在的发展势头非常迅猛,其凭借着速度快、稳定、方便上手使用、完全免费,受到广大用户好评! 我们可以在AI ChatBots发布的全球 AI 网站增长榜中清楚的看到,问小白正在以超高的增速杀入全球前三。
2025年值得关注的AI编码趋势:开发者工具
AI编码工具井喷! 开发者面临选择:增强现有IDE(VS Code GitHub Copilot),拥抱“智能IDE”(Cursor, Warp),或转向云原生IDE(Replit, Amazon CodeCatalyst)。 云原生工具如Cog, Modal简化AI开发。
DeepSeek V3来了 老外评测结果:很不错
近期,DeepSeek-V3-0324正式发布,迅速在全球AI领域引发热议。 相较于前作,V3版本虽未实现颠覆性创新,却在推理和编程两大关键领域取得进步,为用户带来新的惊喜。 DeepSeek向来秉持低调策略,在推出新版本时,既不发布白皮书进行详细阐述,也没有召开盛大发布会,仅将模型上传至Hugging Face平台。
父母用 AI 自行问诊险误孩子病情,汕头大学医学院第一附属医院提醒“用药诊断应遵循专业医生意见”
汕头大学医学院第一附属医院提醒,AI问诊仅供参考,不可盲目轻信。近期一位幼儿因父母轻信AI诊断,自行用药导致病情延误,最终发展为肺炎需住院治疗。#AI问诊# #医疗安全#
马斯克重磅出击!xAI与X正式合并,AI帝国版图再扩张
全球科技巨头埃隆·马斯克今日通过旗下社交媒体平台X发布重磅消息,证实其人工智能初创公司xAI已与X完成合并。 本次交易采取全股票形式,使得xAI的估值飙升至 800 亿美元,远超X此前 330 亿美元的估值。 马斯克在X上发文,掷地有声地表示:“xAI和X的命运紧密相连。
Al Agent 产品 Manus 公布收费方案:提供 39 美元和 199 美元两种套餐
AI Agent产品Manus公布收费方案,提供39美元和199美元两种套餐,标志着其从免费测试转向商业化运营。Manus号称“全球首款通用Agent产品”,能自主完成复杂任务。#AI助手 #Manus收费
九章云极DataCanvas与新加坡谷络吉签署战略合作备忘录,打造AI创新生态
2025年3月25日,九章云极DataCanvas与谷络吉公司KoolLogix在新加坡签署战略合作备忘录 (MoU)。 此次合作旨在依托新科研-谷络吉联合实验室的技术底座,结合九章云极DataCanvas在人工智能领域的行业积淀,共同推动AI技术在数据中心和IT运营中的创新应用。 九章云极国际业务负责人徐江博士出席签约仪式,联合实验室由C.K.
英伟达团队发布最新具身模型 Cosmos-Reason1,在物理世界推理中碾压 Qwen、GPT-4o 等多个 VLM 模型
英伟达 GTC 大会热度飙升。 继黄仁勋在英伟达大会上发布基础世界模型 Cosmos 引发业内讨论后,英伟达团队近日又发布了一个新的物理世界大模型:Cosmos-Reason1。 作为 Cosmos 系列的一个大模型,顾名思义,Cosmos-Reason1 更强调模型的“Reason”(即“推理”)能力。
三大模型巨头比拼思考“幻觉”:DeepSeek 不敌 ChatGPT,Gemini 用词最少
近日,智利大学 CIAE 教育研究所的研究员 Roberto Araya 进行了 4 组对照实验:提供相同的提示词,让 Gemini 2.0 Flash、ChatGPT o3-mini、DeepSeek R1 进行推理分析,研究三个模型在应对幻觉问题上的性能对比。 其研究发现:ChatGPT 03-mini 在应对大模型幻觉问题上占有绝对优势,能够灵活切换不同的策略进行思考推理。 相比之下,DeepSeek R1 和 Gemini 2.0 Flash 虽然能够尝试使用策略,但表现了出对这些策略的抗拒,且推理过程存在错误或混乱。
vivo 正式进军机器人领域,打造家庭智能助手
在科技发展的浪潮中,手机制造商 vivo 最近宣布将其业务扩展至机器人领域,令人瞩目。 在博鳌亚洲论坛2025年年会上,vivo 的高管揭示了 “vivo 机器人实验室” 的成立,旨在研发家庭智能机器人,以适应不断变化的市场需求。 vivo 希望通过其在人工智能(AI)和影像技术方面的积累,结合自研的混合现实头显,构建机器人的 “眼睛” 和 “大脑”。
微软向免费用户开放 Copilot Vision,测试显示 AI 网页助理仍未成熟
2025年3月28日消息,微软向美国免费用户开放Copilot Vision功能。但实测显示该功能有响应中断、交互受限等问题,像“半成品”,实用性低。#微软 #CopilotVision
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉