资讯列表
国内首创!夸克健康大模型通过12门副主任医师职称考试,4个学科达主任医师水平
夸克健康大模型近日创造了国内AI医疗领域的重要里程碑,在12门国家副主任医师职称考试中成绩全部超过合格线,成为国内首个成功跨越这一专业门槛的大模型。 这一突破标志着AI在医疗专业能力方面达到了新的高度,目前用户已可通过夸克搜索直接调用这一全新的大模型能力。 技术架构与创新突破夸克健康大模型以阿里巴巴的通义千问为技术基础,通过海量高质量数据构建和多阶段后训练策略实现了关键性突破。
谷歌发布开源 LMEval 框架:打破 AI 模型比较壁垒,降低评测成本和时间
谷歌推出开源框架LMEval,为大语言模型和多模态模型提供标准化评测工具。该框架支持文本、图像和代码等领域的基准测试,简化跨平台比较,还具备增量评估和可视化功能。#AI评测# #谷歌开源#
全球首个:OpenAI 免除 20 美元月费,阿联酋全民免费用 ChatGPT Plus 订阅
科技媒体 Axios 于 5 月 25 日报道称,阿拉伯联合酋长国(UAE)将成为全球首个为全体公民(citizens)和居民(residents)免费提供 ChatGPT Plus 服务的国家。
微软携手清华、北大推出奖励推理模型:根据 AI 任务复杂性动态分配计算资源
微软研究院联合清华大学、北京大学组建团队,推出奖励推理模型(Reward Reasoning Models,RRMs),通过显式推理过程动态分配计算资源,提升复杂任务评估效果。
QwenLong-L1-32B 模型登场:阿里通义千问首个强化学习训练的长文本推理 AI 模型
阿里通义千问 Qwen 团队昨日(5 月 26 日)发布 QwenLong-L1-32B 模型,是其首个通过强化学习训练的长文本情境推理模型(LRM)。
我国首个软件开发 AI 智能体标准发布,20 余家巨头联手参编
中国信息通信研究院联合中国工商银行、百度、腾讯、阿里、华为等二十余家头部企业,正式发布《面向软件工程智能体的技术和应用要求第 1 部分:开发智能体》(标准编号 AIIA / T 0219-2025)。
OpenAI 发布健康领域 AI 评估基准数据集HealthBench
OpenAI 正式发布了一个大型数据集,旨在评估大型语言模型在医疗健康领域回答问题的能力。 这一项目被命名为 HealthBench,专家们对这一开源数据和详细的评估标准给予了高度赞誉,称其在规模和广度上都是 “前所未有” 的。 图源备注:图片由AI生成,图片授权服务商MidjourneyHealthBench 项目标志着 OpenAI 在医疗健康领域的首次尝试,尤其是在不依赖外部合作伙伴的情况下进行的创新探索。
UAV-Flow项目突破无人机控制,语言指令实现精准飞行
无人机技术的飞速发展正在改变我们的生活方式,而语言指令控制无人机的研究无疑是这一领域的先锋。 一项名为UAV-Flow的创新研究项目正崭露头角,通过自然语言处理技术,让用户仅凭语音指令即可实现对无人机的精确控制。 这一技术突破有望大幅降低无人机操作门槛,推动其在消费、工业和救援等场景的广泛应用。
红帽联手谷歌、NVIDIA启动llm-d开源项目,破解大规模AI推理成本与延迟双重难题
全球开源解决方案领导者红帽公司近日宣布启动革命性开源项目llm-d,专门应对生成式AI大规模推理的迫切需求。 该项目汇聚了CoreWeave、Google Cloud、IBM Research和NVIDIA等行业巨头作为创始贡献者,旨在通过突破性技术让大语言模型推理云满足最严苛的生产服务级目标。 推理时代来临,挑战日益严峻根据Gartner最新数据预测,"到2028年,随着市场成熟,80%以上的数据中心工作负载加速器将专门部署用于推理,而非训练用途。
Claude即将大升级!百万字符上下文+记忆功能,AI交互要逆天了!
近日,关于 Anthropic 旗下 AI 模型 Claude 的功能改进建议引发广泛关注。 这些建议涵盖了上下文窗口扩展、记忆功能增强、文件格式支持扩展等多个方面,预示着 Claude 可能迎来重大升级。 AIbase 综合整理最新信息,为您深入解析 Claude 未来发展的潜力与方向。
GPT-4o 语音模式全新升级:唱歌功能上线,AI交互进入新境界
OpenAI 旗下 GPT-4o 的高级语音模式(Advanced Voice Mode)近期迎来重大更新,不仅能进行更自然的语音交互,还新增了令人瞩目的“唱歌”功能。 尽管当前唱歌表现尚显稚嫩,但这一突破无疑为 AI 的多模态交互能力开辟了新可能。 AIbase 综合整理最新信息,为您解析 GPT-4o 语音模式的最新进展及其潜力。
广汽集团新专利揭晓:智能座舱的 AI 计算装置亮相
广汽集团在智能汽车领域迈出了重要一步,申请了一项名为 “一种车辆智能座舱的 AI 计算装置及其初始化方法、协调控制方法、计算机程序产品” 的专利,该专利内容在天眼查平台上正式公布。 这项新技术将为车辆的智能座舱带来更强大的 AI 计算能力,进一步提升用户体验。 根据专利摘要,这种 AI 计算装置与智能座舱主机连接,协同工作,主要包括四个核心部分:AI 芯片、连接接口模块、电源管理模块和数据存储模块。
Github MCP被曝严重安全漏洞!一个恶意问题,让开发者私有仓库裸奔,Agent成内鬼!检测方法来了!提防中招!
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)MCP 虽然火,但安全问题其实一直不容忽视,就连大名鼎鼎的、与Claude 打得火热的 Github MCP 服务器也出事了! 刚刚得到消息, 昨天,一家名为Invariant 的安全的公司,突然披露了一个有关 GitHub MCP 集成(在 GitHub 上拥有 1.4 万星标)的严重漏洞。 图片这个漏洞允许攻击者通过精心构造的 GitHub Issue“劫持”开发者的智能代理(如 Claude Desktop 中的 Claude 4 Opus),并诱导它主动泄露私有仓库的数据。
OpenAI顶级工程师Philip Su:几个接地气的程序员职场发展经验
今天的文章发的有点晚,因为我又翻译了一期很长的优质内容。 现在每天信息真是太多了,我最近把一些群全部折叠,减少干扰。 要不然,每天开着微信,朋友圈、微信群、公众号、视频号,这些小红点把人的时间切的稀巴烂。
Meta Llama 创始团队被曝分崩离析:14 名 AI 核心人才中 11 人投奔竞争对手
科技媒体 Business Insider 昨日(5 月 26 日)发布博文,报道称 Meta 正面临严重的 AI 人才流失危机,其开源 AI 项目 Llama 的 14 名初始创作者中,已有 11 人离职,其中多人加入了竞争对手 Mistral AI。
OpenAI 在韩国设立分公司,掀起 AI 热潮
近日,OpenAI 公司宣布在韩国成立法律实体,这是该公司在美国之外的最大付费用户市场。 OpenAI 的首席战略官 Jason Kwon 于5月26日在首尔举行的新闻发布会上透露,未来几个月,OpenAI 将在首尔开设办公室,并正在招聘员工,以支持与公司和政策制定者的合作。 这标志着 OpenAI 与这个全球最具技术实力国家之一的关系将更加深入。
Kyutai Unmute 发布!10秒定制语音,AI对话进入超低延迟时代!
法国 AI 实验室 Kyutai 近日推出了一款革命性的语音 AI 系统 Unmute,为文本大语言模型(LLM)赋予了强大的语音交互能力。 这款高度模块化的语音模型以其智能对话、超低延迟和个性化定制功能引发业界热议。 AIbase 综合整理最新信息,带您深入了解 Unmute 的技术突破与应用前景。
这篇 AI Agent 漫游指南,带你建立全面的科技史观
作者 | kong以OpenAI o1与DeepSeek R1为代表的"类Agent"模型、OpenAI DeepResearch为代表的“真Agent”模型,正在重构AI Agent的技术范式。 Agentic Workflow的王座还没坐热,强化学习驱动的端到端Agent模型训练已呼啸而来。 未来趋势已指明:模型即产品,工程化Agent的命运将如何?