AI在线 AI在线

资讯列表

DeepSeek 等模型训练所依赖的合成数据,BARE 提出了新思路

大家好,我是肆〇柒,在AI圈,大型语言模型(LLM)的训练对高质量、多样化数据的需求日益增长。 从去年到现在,一些模型在发布的时候,会有论文或者技术报告,里面多多少少都会提及合成数据,并且在多数情况下,合成数据的效果并不差。 比如,我所看到的报告中,使用了合成数据的模型如下盘点(应该会有遗漏,它并不完整)。
6/4/2025 9:15:16 AM
肆零柒

GPT-5七月上线?内部爆料+奥特曼疯狂暗示,自曝前方时刻「令人恐惧」

GPT-5,真要来了? 最近,关于GPT-5发布时间的消息,闹得是满城风雨。 多项信息来源显示,GPT-5上线的时间,就在今年7月!
6/4/2025 9:06:00 AM

超越GPT-4o!华人团队新框架让Qwen跨领域推理提升10%,刷新12项基准测试

一项新的强化学习方法,直接让Qwen性能大增,GPT-4o被赶超! 来自加拿大滑铁卢大学与TikTok新加坡,M-A-P的华人团队提出了一种全新训练框架:General-Reasoner。 结果直接让Qwen系列大模型的跨领域推理准确率提升近10%,在多个基准测试中甚至超越GPT-4o。
6/4/2025 9:05:18 AM

ChatGPT普通会员能用编程神器Codex了!支持联网,奥特曼:更多更新在路上

一觉醒来,ChatGPT又完成了一些“小”更新! 总结起来就是等等党胜利。 首先,刚发没多久的AI编程神器CodeX,现在可使用的用户群体扩展至了Plus用户。
6/4/2025 9:03:40 AM

论文秒变海报!开源框架PosterAgent一键生成顶会级学术Poster

你好研究僧,听说刚刚中了顶会,却还在愁怎么做Poster(学术海报)? 别急,容在下为你推荐一款新时代科研党神器——PosterAgent,帮你一键从paper.pdf跳转poster.pptx。 相比GPT-4o,PosterAgent生成指标更优,同时token使用量减少87%,还只需要0.0045美元,就可将22页的论文转化为可编辑的 “.pptx” 终稿海报。
6/4/2025 9:03:00 AM

中国知网推出CNKI AI 具备四大核心能力

近日,中国知网全面拥抱人工智能技术,推出全新探索成果——CNKI AI,此举旨在赋能知识服务,推进问答式增强检索和生成式知识服务的场景实践。 CNKI AI平台依托AI技术驱动,融合专业知识与深度思考,提供可信增强与可控生成的智能化服务。 它将AI学术研究助手与AI增强检索全面整合,使理解更为精准全面,解答更具专业深度,致力于构建人工智能时代学术研究、科技创新、科学决策、全民阅读和人才培养的新模式。
6/4/2025 9:01:04 AM
AI在线

谷歌 DeepMind 推出新技术:无 3D 模型也能生成真实运动视频

近日,谷歌 DeepMind 团队与布朗大学合作,开发了一项名为 “力提示”(force prompting)的新技术。 这项技术能够在没有3D 模型和物理引擎的情况下,生成逼真的运动效果,标志着人工智能视频生成领域的一大突破。 使用这项技术,用户只需简单地指定力的方向和强度,就可以操控 AI 生成的视频内容。
6/4/2025 9:01:04 AM
AI在线

OpenAI重磅升级Agents SDK:支持TypeScript和语音打断,2026年将淘汰Assistants API

OpenAI近日宣布对其Agents SDK进行全面升级,为开发者带来多项重要功能更新。 此次升级不仅扩展了编程语言支持,还引入了突破性的语音交互技术。 Agents SDK现已正式支持TypeScript,功能与Python版本完全一致。
6/4/2025 9:01:04 AM
AI在线

Anthropic 推出​Claude Explains 博客项目,探索 AI 与人类专家协作新模式

科技公司 Anthropic 悄然推出了名为 “Claude Explains” 的博客项目,旨在展示其人工智能(AI)模型 Claude 在内容创作中的能力。 该博客的内容主要由 Claude AI 生成,并经过人类专家团队的编辑和增强,涵盖了多种技术主题。 据悉,Claude Explains 博客的内容不仅仅是 AI 的自动生成,而是经过了一系列严格的编辑流程。
6/4/2025 9:01:04 AM
AI在线

Claude Pro升级重磅功能:研究模式与远程MCP整合全面开放!

Anthropic宣布其AI助手Claude的Pro订阅计划迎来重大升级,新增了备受期待的“研究模式”(Research)和远程模型上下文协议(MCP)整合功能。 这两大功能此前仅限于Max、Team和Enterprise高级计划用户,如今向更广泛的Pro用户开放,标志着Claude在功能扩展和用户体验上的又一大步。 研究模式:从小时级研究压缩到分钟级Claude的“研究模式”是一项强大的AI功能,允许模型自主搜索数百个来源,生成包含准确引文的综合报告。
6/4/2025 9:01:04 AM
AI在线

400+AI模型解锁网络搜索!Exa联手OpenRouter引爆RAG革命

Exa与OpenRouter宣布达成合作,为超过400种大语言模型(LLMs)提供实时网络搜索功能。 这一突破性进展将显著提升AI模型的实用性和信息获取能力,为开发者、研究人员以及普通用户带来全新的交互体验。 以下是AIbase对这一合作的深度解读与分析。
6/4/2025 9:01:04 AM
AI在线

谷歌 DeepMind 负责人:AI 变革邮箱管理、对抗内容算法推荐,通用人工智能未来 5~10 年实现

在 SXSW 伦敦站活动中,谷歌 DeepMind 首席执行官戴密斯・哈萨比斯(Demis Hassabis)表示,人工智能(AI)在迅猛发展下,其引发的巨大变革,不亚于互联网诞生或工业革命。
6/4/2025 8:48:37 AM
故渊

视觉感知驱动的多模态推理,阿里通义提出VRAG,定义下一代检索增强生成

在数字化时代,视觉信息在知识传递和决策支持中的重要性日益凸显。 然而,传统的检索增强型生成(RAG)方法在处理视觉丰富信息时面临着诸多挑战。 一方面,传统的基于文本的方法无法处理视觉相关数据;另一方面,现有的视觉 RAG 方法受限于定义的固定流程,难以有效激活模型的推理能力。
6/4/2025 8:42:00 AM

真实评估!北理发布全球首个「全场景教育」基准,支持4000+情境

为什么发展教育大模型需要新的数据和Eval体系? AI赋能教育教学,需要从「经验导向」迈向「证据导向」,真正将AI数据驱动思想赋能到教育场景中,这是核心动力。 教育场景复杂不仅涉及知识深度(基础教育到高等教育)、知识广度(涵盖不同学科),还涉及认知水平不同、个性化需求多样、教学决策性要求等。
6/4/2025 8:40:00 AM

ACL2025 | 传统符号语言传递知识太低效?探索LLM高效参数迁移可行性

论文第一作者谭宇乔来自中国科学院自动化研究所的自然语言处理和知识工程研究组,导师为何世柱老师。 目前研究方向主要在利用大语言模型参数知识增强大模型能力。 1 跨规模参数知识迁移 PKT 的全面分析人类的思维是非透明的,没有继承的记忆,因此需要通过语言交流的环境来学习。
6/4/2025 8:35:00 AM

思维链也会「跳帧」?浙大团队提出CoT-Bridge,显著提升数学推理性能

本文的共同第一作者是徐皓雷和颜聿辰。 徐皓雷是浙江大学的一年级硕士生,主要研究兴趣集中在大模型推理和可解释性研究;颜聿辰是浙江大学博士三年级研究生,主要研究兴趣集中在大模型推理和智能体。 本文通讯作者是浙江大学鲁伟明教授和沈永亮研究员。
6/4/2025 8:35:00 AM

IT技术人必知的八大专业AI模型

译者 | 涂承烨审校 | 重楼不到十年前,能与计算机进行有意义的对话的想法还只是科幻小说。 但今天,数以百万计的人与AI助手聊天,根据文本描述创作令人惊叹的艺术作品,并每天使用这些AI工具/系统来理解图像和执行高级任务。 这一进步由许多专业AI模型驱动,每个模型都有其独特的功能和应用。
6/4/2025 8:31:48 AM
涂承烨

无需 3D 模型 / 物理引擎:谷歌 DeepMind 联合开发力提示技术,AI 生成视频可模拟真实运动

谷歌 DeepMind 团队携手布朗大学,为视频生成模型开发“力提示”(force prompting)技术,可以在无需 3D 模型或物理引擎的情况下,生成逼真的运动效果。
6/4/2025 8:30:08 AM
故渊