资讯列表
CoAT: 基于蒙特卡洛树搜索和关联记忆的大模型推理能力优化框架
研究者提出了一种新的关联思维链(Chain-of-Associated-Thoughts, CoAT)方法,该方法通过整合蒙特卡洛树搜索(Monte Carlo Tree Search, MCTS)和关联记忆机制来提升大语言模型(LLMs)的推理能力。 区别于传统的单步推理方法,CoAT致力于增强LLM的结构化推理能力和自适应优化能力,实现动态知识整合。
2/13/2025 9:34:13 AM
佚名
奥特曼再谈DeepSeek:每天醒来都有压力
关乎当红炸子鸡DeepSeek,奥特曼最新观点出炉:对DeepSeek的出现并不意外,而且类似的情况会越来越多。 这就是奥特曼在最新一期《泰晤士报》科技播客节目中所提及的内容之一。 并且在被问及是否担心OpenAI会成为AI界的Napster(首个P2P音乐共享平台,后因商业压力以失败告终)时,他表示:唯一不让这种事发生的方法就是每天都为此担心。
2/13/2025 9:30:00 AM
量子位
科大国创星云大模型全面升级,集成适配DeepSeek-R1/V3模型
近日,科大国创在互动平台上宣布,随着人工智能技术的迅猛发展,公司推出的 “星云大模型” 已全面集成适配了 DeepSeek-R1和 V3模型。 这一举措标志着科大国创在行业和垂直领域大模型的探索上取得了重要进展,并在多个行业场景中实现了落地应用。 科大国创的星云大模型不仅仅是技术上的升级,还通过整合 DeepSeek、通义千问等多款国内开源大模型,为用户提供了更为灵活的 AI 能力。
2/13/2025 9:25:00 AM
AI在线
Kakao计划与OpenAI合作推出新AI服务Kanana,净亏损显著收窄
韩国互联网巨头 Kakao 近日公布了其2022年第四季度的财务报告,显示出显著改善的迹象。 由于内容部门的资产减值损失减少,Kakao 的净亏损大幅收窄。 根据公司提交给监管机构的文件,Kakao 在去年第四季度的合并净亏损为2769亿韩元(约合1.901亿美元),而上年同期的净亏损高达1.91万亿韩元,减少幅度相当可观。
2/13/2025 9:23:00 AM
AI在线
o3拿下IOI 2024金牌!新论文公布RL秘诀:AI自己设计测试时推理策略,无需人类干预
IOI 2024金牌,OpenAI o3轻松高分拿下! 刚刚,OpenAI发布了关于推理模型在竞技编程中应用的研究论文报告,论文中放出了OpenAI家推理模型三兄弟在IOI和CodeForce上的具体成绩。 三兄弟分别是OpenAI o1、o1-ioi(以o1为基础微调等改进而来)、o3,三者成绩如下。
2/13/2025 9:20:00 AM
量子位
OpenAI 发布新模型规范 重新思考处理有争议话题
近日,OpenAI 宣布将推出其大幅扩展的模型规范文件,这一文件明确了 AI 模型的行为标准。 新的模型规范从原来的约10页扩展至63页,内容涵盖了 AI 如何处理有争议话题以及用户定制化的各个方面。 OpenAI 的目标是让用户和 AI 模型能够 “共同追求真理”。
2/13/2025 9:19:00 AM
AI在线
OpenAI放王炸!GPT-5免费无限使用,产品矩阵大整合!
今天凌晨3点,OpenAI首席执行官Sam Altman公布了GPT-4.5和GPT-5的炸裂消息。 Altman表示,OpenAI很快发布GPT-4.5,就是传说中的猎户座模型(Orion),也是最后一个非思维链模型。 接着会整合GPT和O系列两大模型打造一个全新的系统,能自动选择思考和非思考功能,适用于多种任务。
2/13/2025 9:15:00 AM
AIGC开放社区
苹果秘密探索人形与非人形机器人,预计2028年量产
近日,知名苹果分析师郭明池透露,苹果正在积极探索人形与非人形机器人的研发,并将其视为未来智能家居生态系统的重要组成部分。 这一消息紧随苹果发布的一篇研究论文,该论文探讨了人类与“非拟人化”机器人(如皮克斯风格台灯)的互动方式。 尽管苹果的研究仍处于早期概念验证阶段,但郭明池指出,这项研究为未来的消费机器人提供了重要技术参考。
2/13/2025 9:12:00 AM
AI在线
刚刚,奥特曼剧透GPT-4.5、GPT-5重大更新,o3取消独立发布
奥特曼深夜一则推文,在网络上掀起了讨论狂潮。 没有一点点预告,奥特曼亲自公布自家产品路线图,并承认公司最近发布的一些产品有些混乱。 推文透露,OpenAI 的下一步是发布 GPT-4.5,这是其最后一个非思维链 (CoT) 模型。
2/13/2025 9:10:47 AM
机器之心
OpenAI全新智能体评估报告:Operator在软件测试中表现如何?
译者 | 核子可乐审校 | 重楼OpenAI发布全新AI智能体Operator,本文带你一探如何用它简化软件测试、减少工作量并提高准确性。 测试是项既关键、又相当繁杂的过程。 保障每项功能、每个流程和每种极端情况都能按预期运作往往要占用大量时间和人力。
2/13/2025 9:09:58 AM
核子可乐
Adobe Firefly AI视频生成工具公测:轻松将文字与图像转化为短视频
近日,Adobe 正式推出其 AI 视频生成工具 Firefly Video 的公开测试版本,允许用户将文本和图像转化为时长最长5秒的短视频,视频分辨率为1080p,帧率为每秒24帧。 该工具的推出,标志着 Adobe 在视频生成领域迈出了重要一步,用户可以通过简单的文字指令或者上传图片,快速生成精美的视频内容。 Firefly Video 的用户界面友好,允许用户对生成的视频进行多项调整。
2/13/2025 9:07:00 AM
AI在线
推荐一个企业级知识图谱增强的检索增强生成(RAG)的项目
介绍Microsoft GraphRAG 是一个开源项目,旨在利用 Microsoft Graph 的强大功能构建企业级的知识图谱增强的检索增强生成(RAG)方案。 简单来说,它将企业内部的各种数据源(如邮件、文档、日历、联系人等)通过 Microsoft Graph 连接起来,形成一个结构化的知识图谱,然后利用这个知识图谱来增强 RAG 系统的检索能力,从而提升大语言模型(LLM)在企业应用中的问答和生成效果。 项目架构GraphRAG 的架构设计清晰且模块化,主要包含以下几个核心组件:(1) 数据连接器(Data Connectors):负责从各种企业数据源(如 Microsoft 365 服务,包括 Exchange Online、SharePoint Online、OneDrive、Teams 等)提取数据。
2/13/2025 9:01:03 AM
IT运维技术圈
Reddit 计划 2025 年推出 AI 驱动的全新搜索工具
Reddit 首席执行官 Steve Huffman 在最近的财报会议上宣布,该社交网络计划在2025年推出一款全新升级的搜索工具,旨在帮助用户更方便地浏览平台内容,同时回答一些 “主观、复杂和有趣的问题”。 这一新工具将整合 Reddit Answers 功能,用户可以在此提出问题,并获得针对相关回复和主题的精炼总结。 Huffman 表示,Reddit 的用户在过去20年中留下了大量的讨论信息,而这正是 Reddit Answers 想要解锁的潜在价值。
2/13/2025 9:00:00 AM
AI在线
前 DeepMind 科学家创办人工智能药物发现公司
近日,前 DeepMind 科学家西蒙・科尔(Simon Kohl)宣布成立一家新的人工智能药物发现公司,旨在利用其在蛋白质预测领域的丰富经验,尤其是与获得诺贝尔奖的 AlphaFold 系统相关的经验。 AlphaFold 是一个革命性的人工智能工具,能够准确预测蛋白质的三维结构,这一突破在生物医学研究中引起了广泛关注。 图源备注:图片由AI生成,图片授权服务商Midjourney科尔在 DeepMind 的工作经历使他对蛋白质折叠的复杂性有了深刻理解,而这一理解正是药物发现过程中至关重要的部分。
2/13/2025 8:58:00 AM
AI在线
DeepSeek-R1技术解码:如何实现大模型推理能力的提升?
1月20日,幻方量化旗下AI公司深度求索(DeepSeek)发布了新一代开源大模型DeepSeek-R1。 作为一款专注于推理能力的AI大模型,DeepSeek-R1凭借着成本低、推理能力强等优势,在人工智能领域掀起了千层巨浪,引起了人们的广泛关注与讨论。 DeepSeek-R1的成功,让我们更加清晰地认识到推理能力在当下人工智能发展中的重要地位。
2/13/2025 8:51:23 AM
Yu
NLLB 与 ChatGPT 双向优化:探索翻译模型与语言模型在小语种应用的融合策略
本文探讨了 NLLB 翻译模型与 ChatGPT 在小语种应用中的双向优化策略。 首先介绍了 NLLB-200 的背景、数据、分词器和模型,以及其与 LLM(Large Language Model)的异同和协同关系。 接着列举了实战与应用的案例,包括使用 ChatGPT 生成的样本微调 NLLB-200 和使用 NLLB-200 的翻译结果作为 LLM 的 prompt 等。
2/13/2025 8:44:56 AM
Huang Minghui
雷军:钦佩 DeepSeek 所取得的成就,每个人可能都要学习 AI 知识、使用 AI 工具
雷军表示,自己曾在两年前就建议年轻人学习AI,“已经进入了AI时代,每个人可能都要学习AI方面的知识,学会使用AI的各种工具,这会大幅度提高整个工作效率,也会给生活带来很多便利。”
2/13/2025 8:10:10 AM
清源
干货:DeepSeek+SpringAI实现流式对话!
前一篇文章我们实现了《SpringAI集成满血版DeepSeek》,但是大模型的响应速度通常是很慢的,为了避免用户用户能够耐心等待输出的结果,我们通常会使用流式输出一点点将结果输出给用户。 那么问题来了,想要实现流式结果输出,后端和前端要如何配合? 后端要使用什么技术实现流式输出呢?
2/13/2025 8:06:40 AM
磊哥