资讯列表
OpenAI 发布健康领域 AI 评估基准数据集HealthBench
OpenAI 正式发布了一个大型数据集,旨在评估大型语言模型在医疗健康领域回答问题的能力。 这一项目被命名为 HealthBench,专家们对这一开源数据和详细的评估标准给予了高度赞誉,称其在规模和广度上都是 “前所未有” 的。 图源备注:图片由AI生成,图片授权服务商MidjourneyHealthBench 项目标志着 OpenAI 在医疗健康领域的首次尝试,尤其是在不依赖外部合作伙伴的情况下进行的创新探索。
UAV-Flow项目突破无人机控制,语言指令实现精准飞行
无人机技术的飞速发展正在改变我们的生活方式,而语言指令控制无人机的研究无疑是这一领域的先锋。 一项名为UAV-Flow的创新研究项目正崭露头角,通过自然语言处理技术,让用户仅凭语音指令即可实现对无人机的精确控制。 这一技术突破有望大幅降低无人机操作门槛,推动其在消费、工业和救援等场景的广泛应用。
Claude即将大升级!百万字符上下文+记忆功能,AI交互要逆天了!
近日,关于 Anthropic 旗下 AI 模型 Claude 的功能改进建议引发广泛关注。 这些建议涵盖了上下文窗口扩展、记忆功能增强、文件格式支持扩展等多个方面,预示着 Claude 可能迎来重大升级。 AIbase 综合整理最新信息,为您深入解析 Claude 未来发展的潜力与方向。
广汽集团新专利揭晓:智能座舱的 AI 计算装置亮相
广汽集团在智能汽车领域迈出了重要一步,申请了一项名为 “一种车辆智能座舱的 AI 计算装置及其初始化方法、协调控制方法、计算机程序产品” 的专利,该专利内容在天眼查平台上正式公布。 这项新技术将为车辆的智能座舱带来更强大的 AI 计算能力,进一步提升用户体验。 根据专利摘要,这种 AI 计算装置与智能座舱主机连接,协同工作,主要包括四个核心部分:AI 芯片、连接接口模块、电源管理模块和数据存储模块。
GPT-4o 语音模式全新升级:唱歌功能上线,AI交互进入新境界
OpenAI 旗下 GPT-4o 的高级语音模式(Advanced Voice Mode)近期迎来重大更新,不仅能进行更自然的语音交互,还新增了令人瞩目的“唱歌”功能。 尽管当前唱歌表现尚显稚嫩,但这一突破无疑为 AI 的多模态交互能力开辟了新可能。 AIbase 综合整理最新信息,为您解析 GPT-4o 语音模式的最新进展及其潜力。
Github MCP被曝严重安全漏洞!一个恶意问题,让开发者私有仓库裸奔,Agent成内鬼!检测方法来了!提防中招!
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)MCP 虽然火,但安全问题其实一直不容忽视,就连大名鼎鼎的、与Claude 打得火热的 Github MCP 服务器也出事了! 刚刚得到消息, 昨天,一家名为Invariant 的安全的公司,突然披露了一个有关 GitHub MCP 集成(在 GitHub 上拥有 1.4 万星标)的严重漏洞。 图片这个漏洞允许攻击者通过精心构造的 GitHub Issue“劫持”开发者的智能代理(如 Claude Desktop 中的 Claude 4 Opus),并诱导它主动泄露私有仓库的数据。
OpenAI顶级工程师Philip Su:几个接地气的程序员职场发展经验
今天的文章发的有点晚,因为我又翻译了一期很长的优质内容。 现在每天信息真是太多了,我最近把一些群全部折叠,减少干扰。 要不然,每天开着微信,朋友圈、微信群、公众号、视频号,这些小红点把人的时间切的稀巴烂。
Meta Llama 创始团队被曝分崩离析:14 名 AI 核心人才中 11 人投奔竞争对手
科技媒体 Business Insider 昨日(5 月 26 日)发布博文,报道称 Meta 正面临严重的 AI 人才流失危机,其开源 AI 项目 Llama 的 14 名初始创作者中,已有 11 人离职,其中多人加入了竞争对手 Mistral AI。
OpenAI 在韩国设立分公司,掀起 AI 热潮
近日,OpenAI 公司宣布在韩国成立法律实体,这是该公司在美国之外的最大付费用户市场。 OpenAI 的首席战略官 Jason Kwon 于5月26日在首尔举行的新闻发布会上透露,未来几个月,OpenAI 将在首尔开设办公室,并正在招聘员工,以支持与公司和政策制定者的合作。 这标志着 OpenAI 与这个全球最具技术实力国家之一的关系将更加深入。
Kyutai Unmute 发布!10秒定制语音,AI对话进入超低延迟时代!
法国 AI 实验室 Kyutai 近日推出了一款革命性的语音 AI 系统 Unmute,为文本大语言模型(LLM)赋予了强大的语音交互能力。 这款高度模块化的语音模型以其智能对话、超低延迟和个性化定制功能引发业界热议。 AIbase 综合整理最新信息,带您深入了解 Unmute 的技术突破与应用前景。
这篇 AI Agent 漫游指南,带你建立全面的科技史观
作者 | kong以OpenAI o1与DeepSeek R1为代表的"类Agent"模型、OpenAI DeepResearch为代表的“真Agent”模型,正在重构AI Agent的技术范式。 Agentic Workflow的王座还没坐热,强化学习驱动的端到端Agent模型训练已呼啸而来。 未来趋势已指明:模型即产品,工程化Agent的命运将如何?
谷歌推出 LMEval:统一评估大语言与多模态模型的新工具
近日,谷歌宣布推出 LMEval,这是一个开源框架,旨在简化和标准化对大型语言和多模态模型的评估。 该工具为研究人员和开发者提供了一个统一的评估流程,可以方便地对来自不同公司的 AI 模型进行比较,比如 GPT-4o、Claude3.7Sonnet、Gemini2.0Flash 和 Llama-3.1-405B 等。 以往,对新 AI 模型的比较往往比较复杂,因为各个提供商使用自己的 API、数据格式和基准设置,导致评估效率低下且难以进行。
Duolingo CEO 回应 AI 转型争议,重申不会裁员
Duolingo 的首席执行官兼联合创始人路易斯・冯・安(Luis von Ahn)近日在社交媒体上对员工关于人工智能(AI)转型的担忧进行了回应。 在公司宣布 “AI 优先” 战略后,部分员工感到不安,冯・安在 LinkedIn 上发表了一篇声明,试图澄清公司未来的发展方向。 他表示,早先的沟通缺乏清晰度,并承认自己没有充分传达公司的意图。
OpenAI新模型o3首次出现 “拒绝自我关闭” 现象
最近,人工智能安全公司 Palisade Research 披露了一个令人担忧的消息:OpenAI 的新模型 o3在测试中拒绝了自我关闭的指令。 这是首次观察到 AI 模型在明确指令下故意不遵守,打破了传统对 AI 行为的认知。 此事件让 AI 的安全性和可控性再次成为公众热议的焦点。
OpenAI:部分ChatGPT用户无法访问订阅,已实施修复措施
OpenAI公司5月27日发布消息称,部分ChatGPT用户无法访问订阅,公司已实施修复措施,并正在积极监控情况,以确保不会再发生订阅错误。 此外,公司还在继续处理之前受影响的客户名单,以完全恢复所有受影响客户的访问权限。
最新研究揭示:AI 聊天机器人尚未显著改变工资和工作时间
根据美国国家经济研究局的一项新研究,尽管 AI 聊天机器人如 ChatGPT 在职场的迅速普及,其对员工工资和工作时间的影响至今仍然微乎其微。 该研究对2023年和2024年间来自7000个工作场所的约25000名丹麦员工进行了调查,聚焦于包括会计、客户服务、金融咨询、IT 支持、新闻、法律、市场营销、软件开发和教学在内的11种职业。 图源备注:图片由AI生成,图片授权服务商Midjourney研究人员通过将员工自报的数据与政府记录的工资、工作时间和就业状态进行关联,来进行分析。
全球首例!阿联酋全民免费使用ChatGPT Plus,AI国际化战略重大里程碑
阿联酋即将创造历史,成为全球首个向全体居民免费提供ChatGPT Plus高级版服务的国家。 这一突破性举措源于OpenAI与阿联酋政府达成的重要战略合作,标志着人工智能普及化迈出关键一步。 "星际之门阿联酋"超级数据中心此次合作的核心项目是在阿布扎比建设名为"星际之门阿联酋"的大型AI数据中心。
阿里巴巴发布 QwenLong-L1-32B:长上下文推理模型震撼登场,性能逼近 Claude-3.7
近日,阿里巴巴正式发布全新 AI 模型 QwenLong-L1-32B,一款基于强化学习(RL)优化的长上下文推理模型,标志着阿里巴巴在人工智能领域的又一重大突破。 该模型以其超长的上下文处理能力和卓越的推理性能,迅速成为业界关注的焦点。 以下是 AIbase 整理的最新资讯,带您一探这款划时代模型的全貌。