AI在线 AI在线

理论

17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤

AI社区掀起用大模型玩游戏之风! 例如国外知名博主让DeepSeek和Chatgpt下国际象棋的视频在Youtube上就获得百万播放,ARC Prize组织最近也发布了一个贪吃蛇LLM评测基准SnakeBench。 针对这一场景,来自港大、剑桥和北大的研究人员发布了一个更全面、客观可信的LLM评测基准:GameBoT。
3/31/2025 8:00:00 AM
量子位

哈佛学霸被当场遣返,Nature曝出75%科学家想逃离美国!欧洲加拿大光速抄底

特朗普狂砍学术界经费,恶果来了! 欧洲抄底美国人才这种百年难遇的机会,如今真来了? 根据Nature的调查,约1200名美国科学家表示,他们正在考虑离开美国,首选欧洲和加拿大。
3/31/2025 8:00:00 AM
新智元

港大开源博士级AI智能体,独立完成三篇算法研究,一站式科研6小时搞定

这三篇论文,出自同一AI之手。 随着人工智能技术的迅猛发展,OpenAI提出的五级模型(涵盖从对话系统到协作管理者)已成为行业发展的重要参考框架。 其中,“自主研究智能体”(Autonomous Research Agent)作为第三至第四阶段的核心技术,正受到全球范围内越来越多的关注。
3/31/2025 7:50:00 AM
量子位

专抓AI“看图说谎”,谷歌哥大用三类陷阱触发幻觉,打造可随技术发展动态演进的评估框架

幻觉(Hallucination),即生成事实错误或不一致的信息,已成为视觉-语言模型 (VLMs)可靠性面临的核心挑战。 随着VLMs在自动驾驶、医疗诊断等关键领域的广泛应用,幻觉问题因其潜在的重大后果而备受关注。 然而,当前针对幻觉问题的研究面临多重制约:图像数据集的有限性、缺乏针对多样化幻觉触发因素的综合评估体系,以及在复杂视觉问答任务中进行开放式评估的固有困难。
3/31/2025 7:40:00 AM
量子位

AI大模型看手相!图片视频加持深度思考,阿里QVQ-Max“神了神了”

阿里又发了个有意思的大模型——QVQ-Max,第一版视觉推理模型,对任意图像或视频都可以进行深度思考。 举个有趣的例子,上传一张你的手掌,再点击Thinking,QVQ-Max就可以给你看手相:可以看到,在深度思考过后,QVQ-Max就开始逐步分析手掌上的线条和其他特征。 包括心线、头线、生命线等主要线条的分析,以及戒指手指上的金戒指的象征意义。
3/31/2025 7:30:00 AM
量子位

1个实战案例搞懂AI大模型的"万能手"MCP协议,微软也下场了

最近爆火的 MCP(Model Context Protocol,模型上下文协议) 是 Anthropic 公司推出的一种开放协议。 目的是让 AI 智能体(如 Claude、ChatGPT 等) 能像“万能插座”一样,轻松连接各种外部工具和数据源,比如日历、数据库、邮件系统、代码编辑器等。 图片MCP 本质就是一个标准。
3/31/2025 4:00:00 AM
源码

Deepseek V3升级!更快、更准、更聪明!

前言大家好,我是林三心,用最通俗易懂的话讲最难的知识点是我的座右铭,基础是进阶的前提是我的初心~🎈 编程的兄弟们都知道,现阶段咱们的开发真的离不开 AI,尤其是碰到一些代码技术上的难题的时候,AI 简直是太好使了,以前咱们要花几个小时去网上查找资料,而现在通过 AI 给出答案,只需要几秒钟 ❗️❗️❗️但是,现在的AI界也是卷出了新的高度,从年前的DeepSeek到Manus每一次的话题都能引爆全网热议。 要问目前AI产品的顶流,问小白现在的发展势头非常迅猛,其凭借着速度快、稳定、方便上手使用、完全免费,受到广大用户好评! 我们可以在AI ChatBots发布的全球 AI 网站增长榜中清楚的看到,问小白正在以超高的增速杀入全球前三。
3/31/2025 3:33:00 AM

2025年值得关注的AI编码趋势:开发者工具

AI编码工具井喷! 开发者面临选择:增强现有IDE(VS Code GitHub Copilot),拥抱“智能IDE”(Cursor, Warp),或转向云原生IDE(Replit, Amazon CodeCatalyst)。 云原生工具如Cog, Modal简化AI开发。
3/31/2025 1:00:00 AM
岱军

割韭菜新姿势:C#+DeepSeek自动生成爆文,单篇收益破万的秘密

在内容创作的江湖中,一直流传着各种“一夜暴富”的传说。 如今,一种看似能让梦想照进现实的“神奇组合”——C#与DeepSeek,正悄然在技术圈掀起波澜,传言称依靠它们自动生成爆文,单篇收益能轻松破万,这究竟是“财富密码”,还是新的“割韭菜”套路? 今天,就让我们一探究竟。
3/31/2025 12:25:00 AM
conan

靠C#年入百万:开发DeepSeek爆文生成系统,日更50篇的源码解剖

在内容创作领域,流量就是财富密码。 如何高效产出吸引眼球的爆文,成为众多创作者和内容机构的核心诉求。 借助当下先进的AI技术,结合强大的C#开发能力,一套能够日更50篇爆文的DeepSeek爆文生成系统应运而生,为从业者打开了年入百万的大门。
3/31/2025 12:22:25 AM
conan

DeepSeek V3来了 老外评测结果:很不错

近期,DeepSeek-V3-0324正式发布,迅速在全球AI领域引发热议。 相较于前作,V3版本虽未实现颠覆性创新,却在推理和编程两大关键领域取得进步,为用户带来新的惊喜。 DeepSeek向来秉持低调策略,在推出新版本时,既不发布白皮书进行详细阐述,也没有召开盛大发布会,仅将模型上传至Hugging Face平台。
3/31/2025 12:00:00 AM
小刀

估价天崩!英伟达亲儿子冲刺IPO遇冰雹!阿里董事长蔡崇信警告:开始看到泡沫迹象了

编辑 | 云昭早在20天前,“英伟达的亲儿子”CoreWeave,做了一件破天荒的事情。 CoreWeave 野心勃勃地向Sec提交了 IPO S-1 文件,表示要在未来三个月内以350亿美元的估值筹集35~40亿美元。 可以说这波操作,是目前为止生成式AI浪潮中估值最高的天价IPO。
3/28/2025 2:50:01 PM

解密神经元活动变异性:艾伦研究所与清华揭示大脑状态如何动态调节神经编码

编辑 | 2049神经元对相同刺激的反应为什么会表现出显著差异? 这种变异性是否仅仅是「噪声」? 传统研究往往假设神经活动变异性是静态的,但真实大脑状态在秒级尺度内快速切换,导致编码效率的动态波动。
3/28/2025 2:02:00 PM
ScienceAI

Manus欲以37亿估值硅谷寻融资!发布仅三周,线下用户聚会场场满员

“首个通用智能体”Manus背后公司被曝正在硅谷寻求融资——以5亿美元估值,折合人民币37.5亿元,而距离它横空出世也不过才三周时间。 从官方消息看,这几天他们确实也在硅谷面对面开用户聚会,据说是场场满员的那种。 图片图片除了新的市场消息外,Manus产品本身也推出了一些新功能和新示例EDUCATION 2.0。
3/28/2025 12:13:54 PM

GPT-4o「吉卜力风」一夜爆火,奥特曼连夜换头像!宫崎骏痛批AI侮辱生命

估计连OpenAI也没想到,GPT-4o原生图像出道即顶流! 过去一天,全网被吉卜力风格的AI图片淹没,甚至有网友戏称AGI,就是All Ghibli Images。 图片图片图片图片图片图片图片网红表情包、名人恶搞、经典名场面,甚至是每个人生活照, 全没逃过「吉卜力化」。
3/28/2025 12:10:30 PM
新智元

OpenAI破大防,拒绝率从98%骤降2%!陈怡然团队提出全新思维链劫持攻击

随着通向通用人工智能(AGI)的进展,大语言模型正进化出复杂推理能力,衍生出所谓「大型推理模型」(Large Reasoning Models, LRMs)。 OpenAI 的o系列模型凭借接近人类的推理水准刷新了诸多基准,另一边新的模型DeepSeek-R1也以更低成本实现了与o系列相当的性能。 这些模型不仅能逐步推理复杂问题,还开始将思维链(Chain-of-Thought, CoT)用于安全审查,在回答用户请求前通过内部推理判断内容是否违规,这种思路其实为平衡实用性和安全性提供了一个很有前景方向。
3/28/2025 11:59:10 AM
新智元

一文读懂AI驱动的Data Agent

周末晚上,深夜11点,一位数据分析师还在办公室加班处理紧急的月度分析报告。  面对复杂的数据库和繁琐的SQL查询,他挣扎了几个小时,不禁叹了口气:"要是有个助手能理解我的问题,自动生成SQL查询,告诉我想要的答案就好了。 " 如今,这个愿望已经成为现实。
3/28/2025 11:47:38 AM
大数据AI智能圈

AI招聘迷局:当机器人既当裁判又当选手,人类如何突围?

一幅迷宫的概念图代表了求职招聘的流程。 在迷宫中,代表AI的机器人阻挡着路径。 这幅图还描绘了招聘人员争抢着走出迷宫,而迷宫的结构恰好形成了“AI”一词。
3/28/2025 11:41:33 AM
Taylor Telford