理论
谷歌新型 AI 系统在复杂诊断中表现超越医生
译者 | 刘汪洋审校 | 重楼最近,《自然》杂志上的一篇新论文引发了关注。 它展示了谷歌如何用 AI 改变医疗的未来:通过自动化技术降低成本、减轻医生负担,使他们能够将更多精力投入到复杂病例的处理中。 当你带着疑难杂症就医时,自然希望得到准确的诊断。
4/22/2025 8:13:39 AM
刘汪洋
AI模型蒸馏:大语言模型的“瘦身革命”
译者 | 朱先忠审校 | 重楼简介模型蒸馏是一种机器学习新技术,其基本思想是让较小的模型(学生)模仿较大的模型(老师)的行为。 当前,已经存在几种方法可以实现这一技术(将在下文中展开具体介绍),但其目标都是在学生模型中获得比从头开始训练更好的泛化能力。 模型蒸馏示例:学生(较小)模型使用蒸馏损失函数从教师模型中学习,该函数使用“软标签”和预测(使用OpenAI GPT4o生成的图表)一、为什么模型蒸馏很重要?
4/22/2025 8:08:37 AM
朱先忠
万字拆解!最新多模态 RAG 技术全景解析!
来自华为云的最新多模态RAG综述,非常全面,对多模态RAG感兴趣的朋友强烈推荐! 复制1、引言传统的RAG系统主要依赖于文本数据,通过检索与查询语义相似的相关文档片段,并将其与查询结合,形成增强的输入,供LLMs生成回答。 这种方法使得LLMs能够在推理阶段动态整合最新信息,从而提高回答的准确性和可靠性。
4/22/2025 7:00:00 AM
Goldma
2025年全球GenAI手机出货量有望突破4亿部,渗透率约占三分之一
根据Counterpoint的最新预测,2025年全球智能手机市场将迎来一个重要的里程碑:三分之一的智能手机出货量将支持生成式人工智能(GenAI),预计全年出货量将超过4亿部。 这一趋势标志着智能手机行业在人工智能技术集成方面的快速进步,也预示着GenAI将成为未来智能手机的核心功能之一。 d3001.pngGenAI集成加速,技术与市场需求推动变革从2024年到2025年,全球智能手机支持GenAI的比例显著提升。
4/22/2025 6:58:02 AM
AI和现代工作空间推动全球视频会议设备市场增长
AI已成为推动市场发展的关键加速器,消除了以往阻碍视频广泛采用的许多障碍。 AI驱动的创新——从自动会议记录、实时翻译到智能摄像头取景和噪声抑制——正在彻底改变视频会议体验,使其更加无缝、引人入胜、个性化和高效。 市场正见证着前所未有的创新浪潮,其中AI和数据驱动的见解处于前沿地位。
4/22/2025 6:54:40 AM
D1net编译
被LangChain4j坑惨了!
最近在深度体验和使用 Spring AI 和 LangChain4j,从开始的满怀期待五五开,但最后极具痛苦的使用 LangChain4j,让我真正体验到了正规军和草台班子的区别。 Spring AI VS LangChain4jSpring AI:使用简单、写法优雅、但功能提供的较少、成熟度稍高;LangChain4j:作为移植大模型著名框架 LangChain 功能稍多、灵活度高、使用复杂、满是 BUG。 还有根本找不到关键内容的官方文档,该有的重要内容是一点都不介绍啊,使用和学习成本很高。
4/22/2025 3:00:00 AM
磊哥
微软开源“原生1bit”三进制LLM:2B参数,0.4GB内存/单CPU就能跑,性能与同规模全精度开源模型相当
微软以小搏大,发布首个开源2B参数规模“原生1bit”LLM——BitNet b1.58 2B4T,单CPU就能跑,性能与同规模全精度开源模型相当。 它采用三进制{-1, 0, 1}存储权重,相较于传统的16位浮点数可大幅降低显存需求。 只需0.4GB内存即可运行。
4/21/2025 6:43:31 PM
量子位
被Cursor多次拒绝,OpenAI怒买Windsurf,很不划算!多少有点慌不择食
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)经历了OpenAI的o3和谷歌的Gemini 2.5 Flash发布之后,AI圈的注意力再一次给到了编程赛道。 最近一个争议比较大的新闻,要属“OpenAI收购Cursor不成,反过来要收购AI编程初创里的老二Windsurf”。 30亿美元,特别是对于一家仅仅成立2年,且目前品牌运营时间仅约5个月的创业公司来说,可以说是非常体面和梦寐以求的退出额度。
4/21/2025 5:18:15 PM
云昭
AI工具的广泛使用标志着恶意机器人活动的新时代
据Thales称,易于获取的AI工具的增多显著降低了网络攻击者的入门门槛,使他们能够大规模创建和部署恶意机器人。 十年来,自动化机器人流量首次超过人类产生的流量,在2024年构成所有网络流量的51%,这一转变在很大程度上归因于AI和大型语言模型(LLM)的兴起,它们简化了用于恶意目的的机器人的创建和扩展。 随着AI工具变得越来越容易获取,网络犯罪分子越来越多地利用这些技术来创建和部署恶意机器人,这些机器人现在占所有互联网流量的37%,较2023年的32%有显著增长,这是恶意机器人活动连续第六年增长,给致力于保护其数字资产的企业带来了安全挑战。
4/21/2025 4:39:09 PM
o3被曝「无视」前成果?华人博士生实名指控,谢赛宁等大牛激烈争辩
在视觉感知方面,o3和o4-mini在思维链中进行图像推理, 代表了一个重要突破。 华盛顿大学计算机科学博士生施惟佳站出来表示,o3和o4-mini可能用到了她之前的研究Visual Sketchpad 。 论文链接:,曾提出通过可视化辅助增强模型推理。
4/21/2025 4:32:29 PM
新智元
最新研究给AI医生泼冷水:诊断准确率仅为52.1%,与非专家医生相当
在人工智能(AI)技术飞速发展的当下,AI在医疗领域的应用一直备受关注。 然而,一项最新的研究结果却给AI医生的前景泼了一盆冷水。 据报道,大阪都会大学医学研究生院的研究团队深入评估了生成式AI在诊断医疗状况方面的表现,并将其与医生进行了对比,发现结果不那么如人意。
4/21/2025 4:28:16 PM
选AI比选对象还难!起名黑洞OpenAI的新模型,到底怎么选?
如果你最近关注AI新闻,可能会被各种层出不穷的新模型搞的眼花缭乱。 尤其是堪称「起名黑洞」的OpenAI,命起名来可谓是是毫无章法。 即便是AI圈的资深团队,在面对同时发布的o3、o4-mini、GPT-4.1、GPT-4.1 mini和GPT-4.1 nano时,也是蒙圈的。
4/21/2025 4:27:18 PM
新智元
o3/o4-mini幻觉暴增2-3倍!OpenAI官方承认暂无法解释原因
OpenAI新模型发布后,大家体感都幻觉更多了。 甚至有人测试后发出预警:使用它辅助编程会很危险。 图片具体来说,它经常捏造从未运行过的代码返回结果,在被质问时找理由狡辩,甚至还会说是用户的错。
4/21/2025 4:25:58 PM
机器人跑马拉松翻车?这些“翻车现场”里,藏着普通人也能看懂的未来科技!
2025 年 4 月 19 日,全球首场人形机器人半程马拉松在北京亦庄落下帷幕。 尽管赛事暴露出运动控制、续航散热、环境适应性等核心技术短板,却也成为产业发展的 “试金石”。 对于中小企业而言,这些痛点恰恰是切入人形机器人生态的突破口。
4/21/2025 4:23:06 PM
清华张亚勤:10年后,机器人将可能比人都多
“10年后,机器人将可能比人都多,会陆续进入工厂、社会,最终形态是进入家庭。 未来每个人、每个家庭都有机器人。 ”这样的预言,来自清华大学智能产业研究院(AIR)院长张亚勤。
4/21/2025 9:30:00 AM
量子位
OpenAI爆出硬伤,强化学习是祸首!o3越强越「疯」,幻觉率狂飙
满血o3更强了,却也更爱「胡言乱语」了。 OpenAI技术报告称,o3和o4-mini「幻觉率」远高于此前的推理模型,甚至超过了传统模型GPT-4o。 根据PersonQA基准测试,o3在33%的问题回答中产生了幻觉,几乎是o1(16%)的2倍。
4/21/2025 9:27:00 AM
新智元
杀疯了!Gemini 2.5狂飙「高尔顿板」测试,编码横扫所有OpenAI模型
编码能力一直是顶尖模型宣传的重点。 尤其是,AI大神Karpathy带火vibe coding(氛围编程)概念后,普通人也可以通过AI体验到编程的乐趣。 游戏、网页、3D建模,再加上最近爆火的MCP协议,大家玩得不亦乐乎。
4/21/2025 9:15:00 AM
新智元
文科已死,计算机科学将亡?ACM警告:不想被AI团灭,关键在融合新生
GenAI日新月异,引发了大众选择职业和大学专业的焦虑。 但最近,美国的国际计算机协会(Association for Computing Machinery,ACM),发布了一篇博客文章,表示:文科和计算机科学,这两个专业最后可能合流,融合在一起才能存活。 在哲学中,「存在危机」指的是质疑自己人生目的、意义和在世界中位置的状态。
4/21/2025 9:14:00 AM
新智元
资讯热榜
AI时代设计师如何突围?D20峰会揭示未来设计师生存法则
MinerU 2.0部署教程!
DeepRare 重磅发布:全球首个可循证智能体诊断系统,直击医学Last Exam难题
李沐B站更新了!教你手搓语音大模型,代码全开源还能在线试玩
考试提分新工具:网页版 ChatGPT 测试“学习和掌握”功能,AI 助你成学霸
我测试了100+案例,教你零基础复刻外网刷屏的 AI 视频(附提示词模板)
终结Coding?ShellAgent三句话造出马斯克同款「AI女友」!
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
英伟达
Anthropic
智能体
代码
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
苹果
LLM
神经网络
AI新词
Claude
3D
研究
生成
机器学习
AI for Science
xAI
计算
人形机器人
Agent
Sora
AI视频
GPU
百度
AI设计
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
模态
架构
LLaMA