AI在线 AI在线

理论

OpenAI放王炸!GPT-5免费无限使用,产品矩阵大整合!

今天凌晨3点,OpenAI首席执行官Sam Altman公布了GPT-4.5和GPT-5的炸裂消息。 Altman表示,OpenAI很快发布GPT-4.5,就是传说中的猎户座模型(Orion),也是最后一个非思维链模型。 接着会整合GPT和O系列两大模型打造一个全新的系统,能自动选择思考和非思考功能,适用于多种任务。
2/13/2025 9:15:00 AM
AIGC开放社区

刚刚,奥特曼剧透GPT-4.5、GPT-5重大更新,o3取消独立发布

奥特曼深夜一则推文,在网络上掀起了讨论狂潮。 没有一点点预告,奥特曼亲自公布自家产品路线图,并承认公司最近发布的一些产品有些混乱。 推文透露,OpenAI 的下一步是发布 GPT-4.5,这是其最后一个非思维链 (CoT) 模型。
2/13/2025 9:10:47 AM
机器之心

OpenAI全新智能体评估报告:Operator在软件测试中表现如何?

译者 | 核子可乐审校 | 重楼OpenAI发布全新AI智能体Operator,本文带你一探如何用它简化软件测试、减少工作量并提高准确性。 测试是项既关键、又相当繁杂的过程。 保障每项功能、每个流程和每种极端情况都能按预期运作往往要占用大量时间和人力。
2/13/2025 9:09:58 AM
核子可乐

推荐一个企业级知识图谱增强的检索增强生成(RAG)的项目

介绍Microsoft GraphRAG 是一个开源项目,旨在利用 Microsoft Graph 的强大功能构建企业级的知识图谱增强的检索增强生成(RAG)方案。 简单来说,它将企业内部的各种数据源(如邮件、文档、日历、联系人等)通过 Microsoft Graph 连接起来,形成一个结构化的知识图谱,然后利用这个知识图谱来增强 RAG 系统的检索能力,从而提升大语言模型(LLM)在企业应用中的问答和生成效果。 项目架构GraphRAG 的架构设计清晰且模块化,主要包含以下几个核心组件:(1) 数据连接器(Data Connectors):负责从各种企业数据源(如 Microsoft 365 服务,包括 Exchange Online、SharePoint Online、OneDrive、Teams 等)提取数据。
2/13/2025 9:01:03 AM
IT运维技术圈

DeepSeek-R1技术解码:如何实现大模型推理能力的提升?

1月20日,幻方量化旗下AI公司深度求索(DeepSeek)发布了新一代开源大模型DeepSeek-R1。 作为一款专注于推理能力的AI大模型,DeepSeek-R1凭借着成本低、推理能力强等优势,在人工智能领域掀起了千层巨浪,引起了人们的广泛关注与讨论。 DeepSeek-R1的成功,让我们更加清晰地认识到推理能力在当下人工智能发展中的重要地位。
2/13/2025 8:51:23 AM
Yu

NLLB 与 ChatGPT 双向优化:探索翻译模型与语言模型在小语种应用的融合策略

本文探讨了 NLLB 翻译模型与 ChatGPT 在小语种应用中的双向优化策略。 首先介绍了 NLLB-200 的背景、数据、分词器和模型,以及其与 LLM(Large Language Model)的异同和协同关系。 接着列举了实战与应用的案例,包括使用 ChatGPT 生成的样本微调 NLLB-200 和使用 NLLB-200 的翻译结果作为 LLM 的 prompt 等。
2/13/2025 8:44:56 AM
Huang Minghui

干货:DeepSeek+SpringAI实现流式对话!

前一篇文章我们实现了《SpringAI集成满血版DeepSeek》,但是大模型的响应速度通常是很慢的,为了避免用户用户能够耐心等待输出的结果,我们通常会使用流式输出一点点将结果输出给用户。 那么问题来了,想要实现流式结果输出,后端和前端要如何配合? 后端要使用什么技术实现流式输出呢?
2/13/2025 8:06:40 AM
磊哥

DeepSeek 会是个好DBA吗?

作为近期作为大火的 AI 产品,Deepseek(简称DS) 已经成为现象级的爆款,朋友圈几乎都被刷屏,大家都在探索将 DS 深入千行百业,看如何能发挥出更大价值。 作为数据库从业者,我也在思考这个问题,看 DS 能做点啥。 圈里已经有几位朋友做了分享,我将从使用者的角度来谈谈对 DS 的使用印象。
2/13/2025 7:36:41 AM
韩锋

几个免费使用 DeepSeek 的渠道,告别「服务器繁忙,请稍后再试」

在眼下这个时间点,AI 已经不是什么稀缺资源了,这当然和最近爆火的 DeepSeek 有很大关系,尤其春节那几天,无论是北上广还是小县城甚至农村,无论是985高材生还是村里的叔叔大爷,都用上了 AI 大模型,而且是能力排在第一梯队的大模型,也就是 DeepSeek-R1。 之所以说在这以前,AI 还是稀缺资源,那是因为公认的第一梯队的大模型产品基本上都是国外的,而想要使用国外的产品,对于普通人来说,门槛还是非常高的。 而国内虽然也有不少免费的产品,但是整体来说,还是差点意思的。
2/13/2025 12:10:00 AM
风筝

神奇!DeepSeek一键接入WPS和Office,效率提升300%,无需任何编程(附保姆级教程)

大家好,我是岳哥。 DeepSeek最近爆火,各种玩法层出不穷,但跟咱们工作相关的除了一些AI指令,似乎没有其它新的玩法。 但我们工作中有大量需要使用Office或WPS等办公软件,那有没有什么办法在上面集成DeepSeek呢?
2/13/2025 12:00:02 AM
丶平凡世界

轻量开源!微软基础模型LLaVA-Rad:自动生成高质量放射学报告

编辑丨coisini多模态生成式人工智能的最新进展已将生物医学应用扩展到同时处理文本和图像,在视觉问答和放射学报告生成等任务中展现出潜力。 然而,这些模型在临床实现中面临挑战,特别是大型模型在计算成本等方面带来了部署难题。 小型多模态模型(SMM)虽然更高效,但与大型模型相比仍存在显著性能差距。
2/12/2025 5:42:00 PM
ScienceAI

DeepSeek爆火!我们整理了80余页宝典,带你从入门到精通!文末免费领取

出品 | 51CTO技术栈(微信号:blog51cto)新年伊始,DeepSeek的爆火席卷了全球。 更为难得地是,这款十分优秀的模型变得人人可以免费拥有。 在生成式AI大行其道的今天,DeepSeek正在凭借其开源、高效、多场景适应等优势,成为开发者、行业从业者以及个人用户的必备利器。
2/12/2025 4:13:34 PM

如何利用 DeepSeek-R1 本地部署强大的推理模型:从 ChatGPT 风格界面到 API 集成

01、概述随着开源推理模型如 DeepSeek-R1 的崛起,开发者可以在本地运行强大的 AI,而不再依赖于云服务。 这一技术的出现引发了不小的网络热议,或许你也在好奇如何利用这一模型在本地搭建自己的 AI 系统。 本指南将带你了解两种关键的使用场景:普通用户:创建一个 ChatGPT 风格的界面开发者:通过 API 集成模型到应用中在开始之前,如果你有兴趣深入了解 DeepSeek-R1 的背景,以便更好地理解接下来的过程,可以参考我的文章《DeepSeek-R1 理论简介(适合初学者)》。
2/12/2025 2:09:31 PM
基咯咯

AMD开源科研AI Agent,一站式自动写论文

科学研究的漫长历程中,受限于时间和资源,许多高质量的研究想法未能得到充分探索。 如果能够减少探索想法的限制,研究人员将能够同时研究多个概念,增加科学发现的效率。 所以,为了帮助科研人员节省时间快速撰写论文,AMD和约翰·霍普金斯大学的研究人员联合开源了一个专用于科研的AI Agent——Agent Laboratory。
2/12/2025 1:44:12 PM
AIGC开放社区

DeepSeek并非完美,训练过程存在“深度诅咒”

高性能大模型在训练的过程中通常需要数千个GPU,耗费数月甚至更长时间才能完成一次训练。 这种巨大的资源投入使得模型的每一层都必须高效训练,才能确保算力资源最大化利用。 但大连理工、西湖大学、牛津大学等研究人员对DeepSeek、Qwen、Llama和Mistral研究发现,这些模型的深层在训练过程中表现并不好,甚至可以被完全剪枝而不会影响模型性能。
2/12/2025 1:42:25 PM
AIGC开放社区

AI太强,验证码全失效?新南威尔士全新设计:GPT傻傻认不出,人类一致好评

验证码通过利用人类与机器的认知差异实现身份验证。 传统的验证码方案主要依赖文本扭曲[1]、图像分类[2,3]或逻辑推理[4]来区分人类与机器,但随着多模态LLMs(Large Language Model)的发展[5],这些方法逐渐失效,机器也能达到人类水平的认知。 GPT-4o对简单「文本验证码」的破解成功率超过90%,Gemini 1.5 Pro 2.0[6]能识别带噪声的「reCAPTCHA图像」(成功率50%);LLMs在「推理验证码」上的表现较差(平均成功率20%),但人类用户的失败率也同样很高。
2/12/2025 1:37:56 PM
新智元

如何训练最强代码大模型?北大aiXcoder-7B贡献前沿实践

本文的通讯作者是北京大学计算机学院长聘教授李戈。 本文一作是 aiXcoder 蒋思源和北大李戈教授课题组博士生李佳,团队重点关注融合深度学习与软件工程的代码建模方法。 如何训练一个代码大模型?
2/12/2025 1:34:40 PM
机器之心

统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA

在最近的一篇论文中,来自字节跳动、北京大学等机构的研究者提出了 Sa2VA。 市面上第一个结合 SAM-2 和 LLaVA-like 的视频多模态大模型,结合了 SAM-2 和 LLaVA 的优势,实现了时空细粒度的理解。 论文地址:: 地址:,研究者设计了一套统一的指令微调格式 (Instruction Tuning Pipeline),整合了五种不同的任务,超过 20 个数据集一起进行联合训练。
2/12/2025 1:31:33 PM
机器之心