AI在线 AI在线

AI

问小白o4:AI的“头脑风暴”时代来了!

各位AI圈的朋友们,最近有没有被一个新名字刷屏? “问小白o4”,这个名字背后,可藏着一个颠覆性的概念——并行思考。 这不,国内首个打出这个旗号的模型,着实让大家眼前一亮。
8/27/2025 2:25:00 AM
墨风如雪

斯坦福的秘密武器:DSPy让程序员告别996

你有没有遇到过这样的情况:花了几周时间精心调试AI提示词,好不容易在GPT-4上达到理想效果,结果换到Claude或者国产大模型上就完全不行了? 然后又得重新开始漫长的提示词工程,一遍遍地调试、测试、优化...如果你正在被这种重复性工作折磨,今天要介绍的DSPy框架可能会彻底改变你的工作方式。 最近看到一个案例特别震撼:Llama 4 Scout从2/11的准确率提升到11/11的完美表现,而实现这个飞跃只需要一行代码的改动。
8/27/2025 1:00:00 AM
阿丸笔记

超简单!手把手教你玩转ClaudeCode,不会员!

如果我说 Claude Code 是目前世界上最强的 AI 生成工具,大家应该都没意见吧? 不是因为 Claude Code 牛逼,而是因为它底层使用了 Claude 4 Sonnet 满血模型,这是目前地表上生成代码最牛叉的模型,没有之一! 那问题来了,国内用户如何方便、低成本的使用 Claude Code 呢?
8/27/2025 12:00:00 AM
磊哥

​技术人才对 AI 招聘工具的不信任:68% 专业人士表示担忧

在如今的招聘过程中,人工智能(AI)工具被广泛应用,但求职者的怀疑情绪日益加剧。 根据最新发布的 Dice 报告,68% 的科技专业人士对 AI 驱动的招聘系统表示不信任,同时80% 的人更倾向于人类主导的招聘方法。 报告显示,近30% 的受访者考虑完全离开科技行业,因为他们对 AI 增强招聘过程的挫败感更为强烈,尤其是女性群体对此反应更为明显。
8/26/2025 11:30:58 AM
AI在线

从 “只会聊天” 到 “能办实事”:OpenAI Function Call 彻底重构 AI 交互逻辑(附完整接入指南)

在 AI 开发领域,有一个痛点几乎所有开发者都遇到过:当你用 OpenAI 的 API 开发聊天机器人时,它能侃侃而谈,但让它帮你查天气、订机票、调用公司内部接口时,它要么答非所问,要么直接 “瞎编” 一个结果。 这不是大模型不够聪明,而是传统的 LLM(大语言模型)本质上是 “文本生成器”—— 它擅长根据上下文生成连贯的文字,但缺乏与外部系统交互的能力。 直到Function Calling(函数调用)出现,这个局面才被彻底打破。
8/26/2025 9:17:02 AM

当AI成为预言家:大数据时代,我们正在失去理解世界的能力吗?

最近,我在斯坦福大学的一篇文章中读到了神经科学家Grace Huckins的观点,她提出了一个令人深思的问题:"虽然强大的AI工具和海量数据集正在推动实际进步,但它们可能没有深化我们对宇宙的理解。 "这句话像一记重锤,敲在了我的思考深处。 在这个AI大爆炸的时代,我们每天都在惊叹于技术的进步:AlphaFold预测蛋白质结构的准确性超越了实验方法,大型语言模型能够写出看似有深度的文章,AI系统可以识别出人类肉眼无法察觉的模式...但是,这些进步真的让我们更理解这个世界了吗?
8/26/2025 9:16:55 AM

ChatGPT到底学了多少「污言秽语」?清华团队首提大语言模型中文语料污染治理技术

本文第一作者是清华大学博士生张清杰,研究方向是大语言模型异常行为和可解释性;本文通讯作者是清华大学邱寒副教授;其他作者来自清华大学、南洋理工大学和蚂蚁集团。 如果我们的教科书里包含大量的污言秽语,那么我们能学好语言吗? 这种荒唐的问题却出现在最先进 ChatGPT 系列模型的学习过程中。
8/26/2025 9:15:00 AM

真实场景也能批量造「险」!VLM+扩散模型打造真实域自动驾驶极限测试

近期,懂车帝的《懂车智炼场》栏目对量产自动驾驶系统的NOA辅助驾驶功能进行了安全关键场景测试。 结果显示,在黑夜施工工地、高速公路前方车辆发生事故以及障碍物后突然驶出车辆等高风险场景中,目前尚无任何系统能够在测试中做到完全避免事故。 这类安全关键场景在真实道路上虽不常见,但一旦发生,可能导致人员伤亡或严重交通事故。
8/26/2025 9:10:00 AM

科学界论文高引第一人易主!AI站上历史巅峰

魔镜魔镜,谁是有史以来被引用次数最多的科学家? 答案:深度学习三巨头之一、图灵奖得主Yoshua Bengio。 如你所见,之所以提出这个问题,其实是因为相关消息正在引起热议ing。
8/26/2025 9:10:00 AM

最新智能体自动操作手机电脑,10个榜单开源SOTA全拿下|通义实验室

能自动操作手机、电脑的智能体新SOTA来了。 通义实验室推出Mobile-Agent-v3智能体框架,在手机端和电脑端的多个核心榜单上均取得开源最佳。 它不仅能做交互界面的问答、描述、定位,也能一条指令独立完成复杂任务,甚至可以在多智能体框架中无缝扮演不同角色。
8/26/2025 9:08:00 AM

为防AI刷题,Nature等顶刊最新封面被做成数据集,考验模型科学推理能力|上海交通大学

近年来,以GPT-4o、Gemini 2.5 Pro为代表的多模态大模型,在各大基准测试(如MMMU)中捷报频传,纷纷刷榜成功。 然而,这些令人瞩目的进展也带来了一个愈发严峻的问题:当现有的“题库”逐渐被提前预训练进模型,我们如何才能持续、准确地评估这些顶尖AI的真实能力? 为了应对这一挑战,上海交通大学王德泉教授课题组巧妙地将“动态基准”这一理念与不断更新的科学前沿相结合,提出了MAC(多模态学术封面)基准:既然科学知识本身在不断演进,为什么不用最新的科学内容来测试AI呢?
8/26/2025 9:07:00 AM

2025临界点:AI智商超越人类,经济规则即将改写

在人类经济活动数字化的浪潮中,互联网和移动互联网走完了前两步,正在浮现中的AI经济,可能带来更大的变化。 人类经济活动正在数字化:1946年,人类发明了计算机,这标志着人类的计算经过几千年的演化,从手动到机械,终于到了电子形式。 计算机的出现,把计算能力提高到了远超过人脑计算能力的程度。
8/26/2025 9:06:00 AM

刚刚,马斯克将OpenAI和苹果告上法庭:指控ChatGPT垄断iPhone,自家Grok被打压

当地时间周一,马斯克向 OpenAI 和苹果「开炮」了! 据多家外媒报道,马斯克旗下 xAI 一纸讼书,控告它们通过 ChatGPT 和苹果 App Store 进行非法垄断。 在一则推文中,马斯克表示,自家 Grok 有 100 万条评论,评论分高达 4.9,但苹果仍然拒绝在任何排名中将 Grok 列入其中。
8/26/2025 9:04:00 AM

Karpathy氛围编程最新指南!三层AI编程结构:顺境Cursor,逆境Claude,绝境GPT-5 Pro

刚刚,大神Karpathy发布全新Vibe Coding指南! 在这份指南中,Karpathy不死磕单一模型,而是集众模之所长,总结出了一套AI编程的三层结构:Cursor——主要负责自动补全与小范围代码修改,高效传达任务意图。 Claude Code/Codex——用于实现较大功能块,快速原型开发和跨领域代码尝试。
8/26/2025 9:00:00 AM

Java融合AI,手把手教你整合大语模型

人工智能(AI)正加速重构各行业发展模式,大型语言模型(LLM)无疑是这场技术革命的核心驱动力。 对于Java开发者而言,如何将LLM的强大能力融入现有应用,是拓展技术边界、提升产品价值的重要方向。 本文聚焦LLM与Java集成的核心流程,从实际操作步骤、工具选型到行业最佳实践展开讲解,为Java开发者提供清晰的入门路径,助力快速落地AI集成需求。
8/26/2025 1:32:00 AM
学研妹

FastAPI开发AI应用教程:新增用户历史消息

本文将深入介绍如何在 FastAPI AI 聊天应用中实现用户历史消息功能,当用户切换助手,刷新页面时,都可以保留当前会话历史消息。 图片本项目已经开源至 Github,项目地址::本文全文约一万字,看完约需 15 分钟。 文章概述重点讲解每个助手区分 sessionid、获取历史消息接口以及发送消息时携带上下文信息的核心技术实现。
8/26/2025 1:11:00 AM
wayn

AI正在颠覆DevOps生命周期的六种方式

AI重塑DevOps! 自动修复、预测性监控革新运维;GenAI驱动代码生成与优化,加速开发;智能测试自动化提升效率;AI优化基础设施和工具链(CI/CD),实现数据驱动的战略规划,速享AI红利! 译自:6 Ways AI Is Upending the DevOps Lifecycle[1]作者:Hannah CulverAI革命并非敲响DevOps的大门,而是已经在重新装修房子。
8/26/2025 1:10:00 AM
岱军

AI价格大战又来了!Google推250美元AI套餐,国产编码模型强势挑战

昨天收到一封Google的邮件,看到内容的时候我有点懵——AI Ultra套餐,249美元/月。 说实话,刚开始我以为是钓鱼邮件。 一个月249美元,这是要把AI变成奢侈品的节奏?
8/25/2025 2:07:47 PM
阿丸笔记