资讯列表
小米再出AI黑马!开源多模态大模型 MiMo-VL-7B-2508 性能大幅跃升,支持思考模式切换
小米宣布开源全新版本的多模态大模型——Xiaomi MiMo-VL-7B-2508,并同步推出 SFT 和 RL 两个模型版本。 此次升级不仅优化了输出模式,还提升了 RL 训练的稳定性,在多项能力评测中取得了显著进步。 同时,用户还可以在“思考模式”和“非思考模式”之间灵活切换,以适应不同场景需求。
8/12/2025 9:41:47 AM
AI在线
韩国初创公司 Datumo 获 1550 万美元融资,助企业打造更安全的生成式 AI
麦肯锡最新报告显示,大多数企业仍未做好安全、负责任地应用生成式 AI 的准备。 其中一个主要担忧是可解释性——理解 AI 如何以及为何做出特定决策。 尽管有 40% 的受访者认为这是一大风险,但真正积极应对的企业仅占 17%。
8/12/2025 9:41:46 AM
AI在线
OpenAI 警告人工智能情感依赖风险,ChatGPT 更新故障引发新一轮担忧
【AIbase 报道】 近期,因 ChatGPT 更新故障,与人工智能聊天机器人相关的精神健康风险再次成为公众关注的焦点。 OpenAI 首席执行官萨姆·奥特曼(Sam Altman)公开警告了用户对这些系统产生强烈情感依赖的危险,同时,有研究表明,人工智能可能加剧用户的妄想倾向。 这一担忧并非空穴来风。
8/12/2025 9:41:46 AM
AI在线
苹果测试新一代 Siri:可直接用语音操控多款应用
2024年,苹果曾展示过一段全新智能版 Siri 的演示视频,称其能与多款应用连接,获取各种信息。 不过,这一版本至今尚未正式推出,似乎因尚未准备就绪而被推迟。 据彭博社最新报道,苹果目前正在测试一种全新版本的 Siri,它能够通过语音指令在不同应用中直接执行操作。
8/12/2025 9:41:41 AM
AI在线
英伟达发布全新 Cosmos Reason 模型,加速机器人与物理 AI 发展
英伟达周一在 SIGGRAPH 大会上发布了一系列面向机器人开发者的全新世界 AI 模型、库及基础设施,其中最引人关注的是参数规模达70亿的“推理型”视觉语言模型 Cosmos Reason,专为物理 AI 应用与机器人设计。 此次加入现有 Cosmos 系列的还包括 Cosmos Transfer-2,可基于3D 模拟场景或空间控制输入加速生成合成数据,以及一款更强调速度优化的精简版 Cosmos Transfer。 英伟达表示,这些模型可用于生成训练机器人和 AI 智能体所需的合成文本、图像和视频数据集。
8/12/2025 9:41:41 AM
AI在线
付费用户优先:Claude AI 推出历史对话记忆功能,支持多背景切换
Anthropic 日前宣布为其 Claude AI 聊天机器人推出备受期待的“记忆功能”,允许系统从历史对话中提取并保留用户背景信息,如工作、年龄、教育经历与交流风格等,从而在后续对话中无需重复说明,直接获得更贴合的回复。 该功能的推出意味着 Claude AI 不再“遗忘”用户的工作与项目进展,能在不同会话间无缝衔接,参考此前的讨论、延续思路并深化想法。 用户还可为不同项目设定独立背景,实现工作与生活的隔离,并灵活切换。
8/12/2025 9:41:41 AM
AI在线
苹果宣布 Apple Intelligence下月升级至 GPT-5:Siri、写作工具与视觉智能全面进化
苹果计划在下月发布的 iOS26、iPadOS26和 macOS Tahoe26系统更新中,将 Apple Intelligence 中的 ChatGPT 核心模型从 GPT-4o 升级至最新的 GPT-5。 此次升级将显著提升 Siri、系统级写作工具以及视觉智能的准确性、多模态理解能力和响应速度。 GPT-5的加入不仅带来性能优化,还将解锁多项新功能,包括支持多语言的实时对话翻译,以及能够理解和分析当前屏幕内容的视觉智能功能。
8/12/2025 9:41:41 AM
AI在线
基于 DiT 大模型与字体级分割的视频字幕无痕擦除方案,助力短剧出海
当短剧出海、跨境电商等新兴领域打造全球化内容时,面临着一个棘手的基础问题——原始视频的中文字幕。 原始字幕对于海外观众来说,不仅是无效信息,还严重干扰观看体验。 传统方案——直接添加对应外语字幕会导致画面杂乱,而使用马赛克或基于 GAN 的字幕擦除补全方案会导致画面模糊、帧间闪烁,都无法彻底解决这一挑战,使得优质内容的出海之路障碍重重。
8/12/2025 9:37:43 AM
孙康、丁杨
OpenAI夺金IOI,但输给3位中国高中生
西风 发自 凹非寺. 量子位 | 公众号 QbitAI刚刚,OpenAI官宣:IOI金牌收入囊中! 其推理模型在今年IOI线上竞赛中成绩刷新纪录:.
8/12/2025 9:29:16 AM
西风
Deep Agent 是如何让大模型更“聪明” ?
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的开源库 - “Deep Agent”。 众所周知,AI Agent 无疑是当下最激动人心的技术叙事之一。 它让我们看到了一个未来:AI不再仅仅是被动应答的工具,而是能够自主感知、推理并行动的“数字员工”。
8/12/2025 9:23:34 AM
Luga Lee
AI妄图替代程序员,这一次它踢到铁板了!
最近有个朋友说:“我有种不详的预感,AI编程按照现在这个速度迭代下去,程序员失业的日子就在未来几年。 ”我明白他说的意思,2025年,各个大厂、小厂的程序员们都在发疯似地推出自家的AI编程工具,有股不把自己干掉就誓不罢休的劲头儿。 AI编程工具效果也越来越好,尤其前端开发,那理解力和生成的效果让我惊叹,后端可能要更安全一些,但以后也不好说。
8/12/2025 9:21:28 AM
liuxin
免费使用GPT-5!一手实测案例,代码能力强的离谱
上周五OpenAI发布期待已久的GPT-5,并宣布会免费开放使用。 经过几天调试,从今天开始,免费版ChatGPT可以正式使用GPT-5了,下面「AIGC开放社区」就基于免费版为大家展示一下GPT-5强大的功能。 我们先试试GPT-5的拿手好戏代码能力,输入提示词:用 JavaScript 结合 HTML5 Canvas 开发一个打砖块网页游戏,要求,包含可移动的挡板,通过鼠标或左右键控制、随机位置生成的砖块矩阵,小球撞到挡板、砖块、上下左右边界时有正确的物理反弹效果,砖块被击中后消失,全部砖块消除则通关,小球掉落挡板下方则游戏结束。
8/12/2025 9:18:00 AM
软件开发成本归零倒计时:AI工具正在颠覆整个行业
想象一下这个场景:一个周末的下午,你打开电脑,输入一句话"帮我做一个在线任务管理应用",然后去泡了杯咖啡。 等你回来时,一个功能完整、界面精美的应用已经躺在那里,连数据库都配置好了。 这不是科幻电影的桥段,而是现在正在发生的现实。
8/12/2025 9:15:11 AM
阿丸笔记
2025全球大模型应用报告:红海混战「忠诚度」瓦解,用户脚踏4.7条船!
2025年上半年,大模型正在从技术边界走向生产现实。 横跨欧美亚上千家企业的最新调研揭示,生成式AI已不再只是研发试验品,45%的企业已将其部署到生产环境中。 工程研发、客户支持和营销成为AI最活跃的前线!
8/12/2025 9:15:00 AM
硅谷精英放弃生娃!MIT女记者揭秘:人类只是AI垫脚石,世界很快就毁灭
有人说,AI是人类的未来。 但是事实恰恰相反,AI正在奔向未来,留下的却是人类的裂缝。 它吞噬电力、污染水源、毁掉工作、扰乱情绪...它以「智能」的名义,接管人类的表达、判断与决策。
8/12/2025 9:13:00 AM
黄仁勋像押注OpenAI一样押注中国机器人,英伟达首批Jetson Thor芯片给了他
黄仁勋正在像押注OpenAI一样在中国押注未来的具身智能巨头。 英伟达给刚创办的OpenAI送超算这个事已经被大家津津乐道,现在他们正在把这个经验复用到机器人领域。 中国首批Jetson Thor芯片送到了银河通用手里,在机器人世界大会展示无人售货场景机器人的丝滑漂移、规划能力也明显提升,惊艳全场。
8/12/2025 9:08:00 AM
GPT-5数字母依然翻车!马库斯:泛化问题仍未解决,Scaling无法实现AGI
大模型好不容易学会数r,结果换个字母就翻车了? 而且还是最新的GPT-5。 杜克大学教授Kieran Healy表示,自己让GPT-5数了数blueberry里有几个b,结果GPT-5斩钉截铁地回答3个。
8/12/2025 9:06:00 AM