理论
专抓AI“看图说谎”,谷歌哥大用三类陷阱触发幻觉,打造可随技术发展动态演进的评估框架
幻觉(Hallucination),即生成事实错误或不一致的信息,已成为视觉-语言模型 (VLMs)可靠性面临的核心挑战。 随着VLMs在自动驾驶、医疗诊断等关键领域的广泛应用,幻觉问题因其潜在的重大后果而备受关注。 然而,当前针对幻觉问题的研究面临多重制约:图像数据集的有限性、缺乏针对多样化幻觉触发因素的综合评估体系,以及在复杂视觉问答任务中进行开放式评估的固有困难。
3/31/2025 7:40:00 AM
量子位
AI大模型看手相!图片视频加持深度思考,阿里QVQ-Max“神了神了”
阿里又发了个有意思的大模型——QVQ-Max,第一版视觉推理模型,对任意图像或视频都可以进行深度思考。 举个有趣的例子,上传一张你的手掌,再点击Thinking,QVQ-Max就可以给你看手相:可以看到,在深度思考过后,QVQ-Max就开始逐步分析手掌上的线条和其他特征。 包括心线、头线、生命线等主要线条的分析,以及戒指手指上的金戒指的象征意义。
3/31/2025 7:30:00 AM
量子位
1个实战案例搞懂AI大模型的"万能手"MCP协议,微软也下场了
最近爆火的 MCP(Model Context Protocol,模型上下文协议) 是 Anthropic 公司推出的一种开放协议。 目的是让 AI 智能体(如 Claude、ChatGPT 等) 能像“万能插座”一样,轻松连接各种外部工具和数据源,比如日历、数据库、邮件系统、代码编辑器等。 图片MCP 本质就是一个标准。
3/31/2025 4:00:00 AM
源码
Deepseek V3升级!更快、更准、更聪明!
前言大家好,我是林三心,用最通俗易懂的话讲最难的知识点是我的座右铭,基础是进阶的前提是我的初心~🎈 编程的兄弟们都知道,现阶段咱们的开发真的离不开 AI,尤其是碰到一些代码技术上的难题的时候,AI 简直是太好使了,以前咱们要花几个小时去网上查找资料,而现在通过 AI 给出答案,只需要几秒钟 ❗️❗️❗️但是,现在的AI界也是卷出了新的高度,从年前的DeepSeek到Manus每一次的话题都能引爆全网热议。 要问目前AI产品的顶流,问小白现在的发展势头非常迅猛,其凭借着速度快、稳定、方便上手使用、完全免费,受到广大用户好评! 我们可以在AI ChatBots发布的全球 AI 网站增长榜中清楚的看到,问小白正在以超高的增速杀入全球前三。
3/31/2025 3:33:00 AM
2025年值得关注的AI编码趋势:开发者工具
AI编码工具井喷! 开发者面临选择:增强现有IDE(VS Code GitHub Copilot),拥抱“智能IDE”(Cursor, Warp),或转向云原生IDE(Replit, Amazon CodeCatalyst)。 云原生工具如Cog, Modal简化AI开发。
3/31/2025 1:00:00 AM
岱军
割韭菜新姿势:C#+DeepSeek自动生成爆文,单篇收益破万的秘密
在内容创作的江湖中,一直流传着各种“一夜暴富”的传说。 如今,一种看似能让梦想照进现实的“神奇组合”——C#与DeepSeek,正悄然在技术圈掀起波澜,传言称依靠它们自动生成爆文,单篇收益能轻松破万,这究竟是“财富密码”,还是新的“割韭菜”套路? 今天,就让我们一探究竟。
3/31/2025 12:25:00 AM
conan
靠C#年入百万:开发DeepSeek爆文生成系统,日更50篇的源码解剖
在内容创作领域,流量就是财富密码。 如何高效产出吸引眼球的爆文,成为众多创作者和内容机构的核心诉求。 借助当下先进的AI技术,结合强大的C#开发能力,一套能够日更50篇爆文的DeepSeek爆文生成系统应运而生,为从业者打开了年入百万的大门。
3/31/2025 12:22:25 AM
conan
DeepSeek V3来了 老外评测结果:很不错
近期,DeepSeek-V3-0324正式发布,迅速在全球AI领域引发热议。 相较于前作,V3版本虽未实现颠覆性创新,却在推理和编程两大关键领域取得进步,为用户带来新的惊喜。 DeepSeek向来秉持低调策略,在推出新版本时,既不发布白皮书进行详细阐述,也没有召开盛大发布会,仅将模型上传至Hugging Face平台。
3/31/2025 12:00:00 AM
小刀
估价天崩!英伟达亲儿子冲刺IPO遇冰雹!阿里董事长蔡崇信警告:开始看到泡沫迹象了
编辑 | 云昭早在20天前,“英伟达的亲儿子”CoreWeave,做了一件破天荒的事情。 CoreWeave 野心勃勃地向Sec提交了 IPO S-1 文件,表示要在未来三个月内以350亿美元的估值筹集35~40亿美元。 可以说这波操作,是目前为止生成式AI浪潮中估值最高的天价IPO。
3/28/2025 2:50:01 PM
解密神经元活动变异性:艾伦研究所与清华揭示大脑状态如何动态调节神经编码
编辑 | 2049神经元对相同刺激的反应为什么会表现出显著差异? 这种变异性是否仅仅是「噪声」? 传统研究往往假设神经活动变异性是静态的,但真实大脑状态在秒级尺度内快速切换,导致编码效率的动态波动。
3/28/2025 2:02:00 PM
ScienceAI
Manus欲以37亿估值硅谷寻融资!发布仅三周,线下用户聚会场场满员
“首个通用智能体”Manus背后公司被曝正在硅谷寻求融资——以5亿美元估值,折合人民币37.5亿元,而距离它横空出世也不过才三周时间。 从官方消息看,这几天他们确实也在硅谷面对面开用户聚会,据说是场场满员的那种。 图片图片除了新的市场消息外,Manus产品本身也推出了一些新功能和新示例EDUCATION 2.0。
3/28/2025 12:13:54 PM
GPT-4o「吉卜力风」一夜爆火,奥特曼连夜换头像!宫崎骏痛批AI侮辱生命
估计连OpenAI也没想到,GPT-4o原生图像出道即顶流! 过去一天,全网被吉卜力风格的AI图片淹没,甚至有网友戏称AGI,就是All Ghibli Images。 图片图片图片图片图片图片图片网红表情包、名人恶搞、经典名场面,甚至是每个人生活照, 全没逃过「吉卜力化」。
3/28/2025 12:10:30 PM
新智元
OpenAI破大防,拒绝率从98%骤降2%!陈怡然团队提出全新思维链劫持攻击
随着通向通用人工智能(AGI)的进展,大语言模型正进化出复杂推理能力,衍生出所谓「大型推理模型」(Large Reasoning Models, LRMs)。 OpenAI 的o系列模型凭借接近人类的推理水准刷新了诸多基准,另一边新的模型DeepSeek-R1也以更低成本实现了与o系列相当的性能。 这些模型不仅能逐步推理复杂问题,还开始将思维链(Chain-of-Thought, CoT)用于安全审查,在回答用户请求前通过内部推理判断内容是否违规,这种思路其实为平衡实用性和安全性提供了一个很有前景方向。
3/28/2025 11:59:10 AM
新智元
一文读懂AI驱动的Data Agent
周末晚上,深夜11点,一位数据分析师还在办公室加班处理紧急的月度分析报告。 面对复杂的数据库和繁琐的SQL查询,他挣扎了几个小时,不禁叹了口气:"要是有个助手能理解我的问题,自动生成SQL查询,告诉我想要的答案就好了。 " 如今,这个愿望已经成为现实。
3/28/2025 11:47:38 AM
大数据AI智能圈
AI招聘迷局:当机器人既当裁判又当选手,人类如何突围?
一幅迷宫的概念图代表了求职招聘的流程。 在迷宫中,代表AI的机器人阻挡着路径。 这幅图还描绘了招聘人员争抢着走出迷宫,而迷宫的结构恰好形成了“AI”一词。
3/28/2025 11:41:33 AM
Taylor Telford
AI算法 | SFT数据篇
1、SFT需要多少条数据SFT所需数据量一般任务:对于大多数常见的自然语言处理任务(如文本分类、情感分析、简单对话等),SFT的数据量通常在2k-10k之间。 这个范围的数据量既能保证模型学习到足够的领域知识,又不会因为数据量过大而导致训练成本过高。 复杂任务:对于复杂的任务,如数学推理、代码生成、多轮对话等,可能需要更多的数据来训练。
3/28/2025 11:10:44 AM
Goldma
大模型不再是路痴!空间推理的答案是RAG:旅游规划、附近推荐全解锁
近年来,大型语言模型(LLMs)的进展已经在机器学习(ML)的许多领域带来了变革,特别是在理解和生成类人文本方面,激发了人们通过直接从LLMs中提取空间知识来弥合空间问答与自然语言之间的差距,研究成果涵盖了广泛的应用,包括地理百科全书问答、地理定位和自动高精度地图生成等。 然而,当涉及到空间推理任务时,LLMs的表现却显得力不从心,甚至在处理基本的空间任务时也遇到困难,例如地理解析和理解相对空间关系。 这种差距在处理现实世界的空间推理任务时尤为明显,例如图1中所示的场景:图1 现实世界中空间推理问题示例。
3/28/2025 10:42:17 AM
新智元
大多数人工智能项目为何失败:应避免的十个错误
令人震惊的事实:70-80%的人工智能项目都失败了! 尽管人工智能 (AI) 及其彻底改变行业的潜力备受关注,但令人惊讶的是,70-80% 的 AI 项目都失败了——这真是一个现实的考验! 为什么这么多充满希望和潜力的人工智能计划最终都以失败告终?
3/28/2025 10:21:50 AM
晓晓
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用