资讯列表
OpenAI推出Flex处理API,助力低成本 AI 应用
为应对日益激烈的人工智能市场竞争,OpenAI 近日推出了一种名为 Flex 处理的新型 API。 这一全新的选择将使得用户能够以更低的成本使用 AI 模型,尽管在响应速度和可用性上有所妥协。 Flex 处理旨在支持低优先级和非生产性的任务,例如模型评估、数据丰富以及异步工作负载。
4/18/2025 10:01:28 AM
AI在线
AI 应用安全挑战与测评实践指南
作者 | 陈达在人工智能蓬勃发展的时代,AI应用广泛融入人们的生活与工作,从智能客服到智能推荐系统,从医疗影像诊断到金融风险预测,AI的身影无处不在。 然而,随着AI应用的普及,其潜在风险也逐渐凸显,AI风险测评成为保障应用可信的关键环节。 本文将围绕“AI风险测评助力应用可信”这一主题,深入探讨AI应用面临的风险、业界测评方法、实践思路及关键要点。
4/18/2025 9:45:47 AM
Thoughtworks洞见
突发!特朗普禁止英伟达,向DeepSeek等提供AI芯片
华尔街日报消息,特朗普政府已禁止在无许可证的情况下,向中国出售H20等AI芯片。 未来的相关销售也将需要许可证,这是特朗普政府首次对半导体海外销售实施重大限制,强化了拜登政府此前制定的规则。 由于该政策的实施,英伟达股票遭遇重创下跌了5%左右,并且季度营收会因无法按原计划销售损失55亿美元。
4/18/2025 9:43:38 AM
AIGC开放社区
物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架
最近,来自大连理工和莫纳什大学的团队提出了物理真实的视频生成框架 VLIPP。 通过利用视觉语言模型来将物理规律注入到视频扩散模型的方法来提升视频生成中的物理真实性。 论文主页: : ,能够生成高度逼真的视频内容,其作为世界模拟器的潜力已引起学界广泛关注。
4/18/2025 9:25:00 AM
机器之心
OpenAI 上线 Flex 处理模式:API 费用减半,但牺牲响应速度及稳定性
OpenAI宣布推出“Flex处理模式”新的API服务——用户以接受响应速度变慢和“资源偶尔无法分配”为代价,换取更优惠的模型使用价格。
4/18/2025 9:13:06 AM
清源
最强o1也刚刚及格!中科大等团队测试视频CoT推理能力:多数模型不及格
视频理解的CoT推理能力,怎么评? 中科大等团队提出了评估基准——VCR-Bench,里面包含七个独立评估维度的任务框架,每个维度针对性地考察模型的不同能力(如时空推理、因果推断等)。 为确保评估的全面性和可靠性,每个维度都设计了100余条高质量样本。
4/18/2025 9:13:00 AM
量子位
异议!顶流AI决战「逆转裁判」:o1险胜Gemini 2.5登顶、Llama 4零分垫底
当谈到AI为何能从「预测下一个词」中诞生智慧时,Ilya Sutskever曾用一个生动的比喻来解释。 想象你在读一本悬疑小说,如果仅凭前面的线索就能在最后一页推断出罪犯是谁,那么你对这个故事的理解无疑是深刻的。 同样,AI通过学习海量文本,掌握了从字面到语义的「线索」,展现出惊人的智能。
4/18/2025 9:07:00 AM
新智元
谷歌推出全新 Gemini 2.5 Flash:智慧与速度兼具的 AI 助手
谷歌近日在其 Gemini 系列中推出了全新的 Gemini2.5Flash,这一版本正在进行预览,旨在为开发者提供更强大的推理能力。 借助 “思考” 过程,开发者可以根据需求灵活控制成本和延迟,打造更具性价比的解决方案。 与前一版本2.0Flash 相比,Gemini2.5Flash 的升级主要体现在推理能力上。
4/18/2025 9:01:28 AM
AI在线
Midjourney图像编辑器迎来重大更新:全新UI、图层功能与智能工具上线
全球领先的AI图像生成平台Midjourney于2025年4月17日宣布,其图像编辑器迎来了一次重要更新。 此次更新不仅优化了用户体验,还引入了多项创新功能,进一步巩固了Midjourney在AI创意工具领域的领先地位。 以下是AIbase为您整理的最新资讯,带您深入了解这一激动人心的升级。
4/18/2025 9:00:50 AM
AI在线
微软 BitNet b1.58 2B4T 登场:内存占用仅 0.4GB,20 亿参数模型颠覆 AI 计算
微软研究团队推出了一款开源大型语言模型 BitNet b1.58 2B4T,区别于传统训练后量化的方式,这款拥有 20 亿参数的大型语言模型(LLM)以 1.58 位低精度架构原生训练而成。
4/18/2025 8:54:22 AM
故渊
使用测试时间训练(TTT)生成一分钟视频
译者 | 布加迪审校 | 重楼从文本生成视频已取得了长足的进展,但在制作更长的多场景故事时仍然会遇到瓶颈。 虽然Sora、Veo和Movie Gen之类的扩散模型已提高了视觉质量的门槛,但它们通常仅限于 20秒以内的片段。 真正的挑战是什么?
4/18/2025 8:47:22 AM
布加迪
UC伯克利:让推理模型少思考,准确率反而更高了!
让推理模型不要思考,得到的结果反而更准确? UC伯克利新研究发现,强制要求模型跳过思考过程,推理能力却比正常思考还好。 例如在定理证明任务当中,“不思考”模式仅使用30%的Token,就能实现和完整思考一样的准确率。
4/18/2025 8:42:52 AM
量子位
OpenAI 最强推理模型 o3 / o4-mini 发布后,“照片查位置”成最新热门玩法
ChatGPT 已成为一种强大的“定位工具”。X上的用户很快发现,o3等新模型善于从各种细节中推断城市、地标,甚至具体的餐馆和酒吧。
4/18/2025 8:16:02 AM
清源
使用LangGraph构建你的第一个AI Agent-附完整代码
AI Agent 指的是有能力主动思考和行动的智能体,能够以类似人类的方式工作,通过大模型来“理解”用户需求,主动“规划”以达成目标,使用各种“工具”来完成任务,并最终“行动”执行这些任务。 从模型到 Agent在 Agent 出现之前,我们将 AI 模型建为独立且互不关联的组件——一个模型用于理解文本,一个模型用于生成代码,还有一个模型用于处理图像。 这种碎片化的方法迫使用户手动管理工作流程导致在不同系统之间切换时上下文信息消失需要为每个流程步骤集成 ai 模型Agent 的出现就是为了解决这一碎片问题。
4/18/2025 8:01:21 AM
wayn
通义万相2.1开源首尾帧生视频模型Wan2.1-FLF2V-14B
阿里通义宣布开源 Wan2.1系列模型,其中包括强大的首尾帧生视频模型。 这一模型采用了先进的 DiT 架构,在技术上实现了多项突破,显著降低了高清视频生成的运算成本,同时确保了生成视频在时间与空间上的高度一致性。 此次开源为开发者和创作者提供了强大的工具,推动视频生成技术的发展。
4/18/2025 8:01:08 AM
AI在线
字节 Seed 开源 UI-TARS-1.5:基于视觉-语言模型构建的多模态智能体
UI-TARS-1.5 昨日正式发布并开源。这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。
4/18/2025 7:48:14 AM
清源
谷歌也要“送 AI 进校园”:美国大学生可限时免费订阅 Google One AI Premium 计划
这一订阅方案不仅提供2TB云存储空间,还包含多项 AI 工具,帮助学生“更高效地学习”。其中,Gemini 2.5 Pro 驱动的 Gemini Advanced,是谷歌为对抗 ChatGPT Plus 推出的旗舰级产品。
4/18/2025 7:39:43 AM
清源
AI 与非结构化数据:简单 RAG 的局限及生产级解决方案全解析
非结构化数据涵盖了电子邮件、PDF 文件、会议记录等多种形式,它们充斥在各个角落,却由于缺乏固定的格式,给传统的数据处理工具带来了巨大的挑战。 而人工智能(AI)的出现,尤其是大型语言模型(LLMs),为解决非结构化数据的难题带来了新的希望。 但在实际应用中,简单的检索增强生成(RAG)方法却存在诸多不足,无法满足复杂的生产级场景需求。
4/18/2025 2:55:00 AM
大模型之路