人工智能
OpenAI o3 模型基准测试成绩遭质疑,实测分数远不及宣称
OpenAI的o3模型在内部测试与第三方基准测试结果存在显著差异,Epoch研究所独立测试得分仅10%,远低于OpenAI宣称的25%。#AI争议##OpenAI#
4/21/2025 7:24:55 AM
远洋
研究:AI 医疗诊断平均准确率 52.1%,与非专家医生相当
大阪都会大学研究显示,生成式AI在医疗诊断中平均准确率达52.1%,与非专家医生相当,但专家医生仍领先15.8%。AI在皮肤科表现突出,泌尿科数据有限。研究认为AI可用于医学教育和资源有限地区。#AI医疗##医学诊断#
4/21/2025 7:07:00 AM
远洋
谈谈 RAG 的四个级别
选择正确的 RAG(检索增强生成)架构主要取决于具体的用例和实施要求,确保系统符合任务需求。 Agentic RAG 的重要性将日益增加,与Agentic X的概念相一致,其中代理能力嵌入个人助理和工作流程中。 这里的“X”代表代理系统的无限适应性,能够实现无缝任务自动化和跨不同环境的明智决策,从而提高组织效率和自主性。
4/21/2025 6:25:00 AM
晓晓
企业级RAG选择难题:数据方案的关键博弈
智能时代,企业数据每日剧增。 员工寻找答案的效率直接影响工作流程,StackOverflow调查表明54%的开发者因等待问题答案而工作中断。 信息就在那里,却被深埋在企业资源迷宫中。
4/21/2025 4:50:00 AM
大数据AI智能圈
Cursor模型选型终极指南:解锁高效开发新姿势
引言在AI驱动开发的浪潮下,如何选择合适的工具模型成为决定项目成败的关键。 本文将结合MacOS环境下的Cursor 0.48.9实战体验,深度解析四大核心模型(Auto/Claude 3.7/GPT-4O/Gemini 2.5)的选型策略,助您构建高质量开发闭环。 一、智能开发新范式:Cursor的核心优势作为新一代AI开发利器,Cursor通过模型即服务的架构重塑开发流程。
4/21/2025 3:30:00 AM
前端组件开发
网络安全的战略性AI准备:从炒作到现实
构建网络安全中强大的AI就绪框架,基础概念至关重要,这些概念涵盖了企业的技术、数据、安全性、治理和运营流程。 AI就绪的表现AI在网络安全中的潜力在于其能够自动化、预测并增强随着威胁不断演变和复杂化而至关重要的决策能力。 例如,AI模型会处理网络流量模式以检测异常或基于历史数据预测潜在的攻击路径。
4/21/2025 2:00:00 AM
Aditya
计划 30 亿美元收购 Windsurf 前,OpenAI 被曝曾向另一 AI 编程助手 Cursor“示好”
知情人士告诉CNBC,去年OpenAI曾联系Cursor的销售商Anysphere,并在Cursor迎来新一轮热潮时再次接触了它。但谈判始终未能取得实质性进展。
4/19/2025 2:21:43 PM
清源
研究称生成式 AI 背后隐藏高昂水电消耗,直接影响数据中心周边生活成本
研究发现,AI 即便仅仅是在生成文本时,背后也需要消耗大量水资源用于服务器降温,此外还伴随着庞大的电力消耗。
4/19/2025 7:29:10 AM
清源
知识图谱与其它知识库的关系
知识图谱与传统知识库:解构数据连接的哲学传统企业数据库和知识库长期以来一直被当作信息的仓库,它们好比一个个分隔的抽屉,每个抽屉里都整齐地存放着特定类型的信息。 企业习惯了这种存储方式,却很少思考:我们真的需要将信息放在不同的抽屉里吗? 知识图谱打破了这种传统思维,它将信息视为一张巨大的网络——每条信息都是网络中的一个节点,节点之间通过各种关系连接起来。
4/18/2025 12:49:58 PM
大数据AI智能圈
工信部:已累计培育400余家人工智能领域国家级专精特新“小巨人”企业
工业和信息化部总工程师谢少锋表示,目前已累计培育 400 余家人工智能领域国家级专精特新“小巨人”企业。 下一步要引导耐心资本加大支持力度,加快培育一批行业龙头企业和专精特新中小企业。 建设人工智能开源社区,发挥人工智能标准化技术委员会作用,加快关键急需标准研制。
4/18/2025 11:01:48 AM
AI在线
AI 应用安全挑战与测评实践指南
作者 | 陈达在人工智能蓬勃发展的时代,AI应用广泛融入人们的生活与工作,从智能客服到智能推荐系统,从医疗影像诊断到金融风险预测,AI的身影无处不在。 然而,随着AI应用的普及,其潜在风险也逐渐凸显,AI风险测评成为保障应用可信的关键环节。 本文将围绕“AI风险测评助力应用可信”这一主题,深入探讨AI应用面临的风险、业界测评方法、实践思路及关键要点。
4/18/2025 9:45:47 AM
Thoughtworks洞见
字节 Seed 开源 UI-TARS-1.5:基于视觉-语言模型构建的多模态智能体
UI-TARS-1.5 昨日正式发布并开源。这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。
4/18/2025 7:48:14 AM
清源
谷歌也要“送 AI 进校园”:美国大学生可限时免费订阅 Google One AI Premium 计划
这一订阅方案不仅提供2TB云存储空间,还包含多项 AI 工具,帮助学生“更高效地学习”。其中,Gemini 2.5 Pro 驱动的 Gemini Advanced,是谷歌为对抗 ChatGPT Plus 推出的旗舰级产品。
4/18/2025 7:39:43 AM
清源
自主式AI对安全专家来说既是福音也是祸患
网络安全在自主式AI面前站在了一个十字路口,我们从未拥有过如此强大的工具,它可以在眨眼之间创建大量的代码,发现并解除威胁,并且可以被如此果断且防御性地使用,这已经被证明是一个巨大的力量倍增器和生产力红利。 但虽然功能强大,自主式AI却并不可靠,这就是目前的困境。 所创建的代码可能包含微妙的缺陷,并且最终可能会弊大于利,比如通过助长网络钓鱼诱饵和构建新型恶意软件。
4/18/2025 12:10:00 AM
David Strom
开发者,找找找丨千万粉丝女子电竞第一人同游GDC(限量粉丝福利)
女子电竞第一人Miss韩懿莹将参加2025全球开发者先锋大会! 2025全球开发者先锋大会马上要搞大事情啦! 女子电竞第一人Miss韩懿莹,居然要来参会啦!
4/17/2025 4:38:00 PM
陈淑瑜
上海人工智能实验室开源多模态大模型“书生・万象 3.0”:能同时处理文本和多模态输入
该团队提出了一种创新的原生多模态预训练方法,与传统的先优化大语言模型再添加视觉能力的方法不同,这种方法在模型的预训练阶段将文本数据与多模态数据无缝结合,让模型能够同时学习语言和视觉。
4/17/2025 12:39:41 PM
清源
智能体版《苦涩的教训》,图灵奖得主Sutton、谷歌RL大佬Silver新作:超人智能靠经验
人类生成的数据推动了人工智能的惊人进步,但接下来会怎样呢? 几天前,Google DeepMind 强化学习副总裁 David Silver 参与了一场播客访谈节目,探讨了如何从依赖人类数据的时代迈向自主学习的时代。 与此同时,David Silver 和他的老师、2024 年图灵奖得主 Richard Sutton 合作撰写的论文《Welcome to the Era of Experience》称人们正站在人工智能新时代的门槛上,并有望达到前所未有的水平;同时展望了新一代智能体,认为它们将主要通过经验来学习,获得超越人类的能力。
4/17/2025 9:10:00 AM
机器之心
揭秘大模型的魔法:从零开始你的AI冒险
你好,我是写代码的中年人! 你有没有想过,那些能写诗、答题、甚至帮你 debug 代码的 AI 到底是怎么回事? 它们其实是“大型语言模型”(Large Language Models,简称 LLM)的产物。
4/17/2025 9:00:00 AM
写代码的中年人
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
马斯克
智能体
AI创作
Anthropic
英伟达
论文
AI新词
代码
训练
算法
Stable Diffusion
LLM
芯片
蛋白质
腾讯
开发者
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
工具
华为
RAG
AI设计
大语言模型
搜索
字节跳动
具身智能
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
神器推荐
亚马逊
Copilot
特斯拉
应用
DeepMind