理论
被AI追杀,还要解谜逃生!UCSD等发布LLM测试神器,边玩游戏边评估
你以为你在打游戏,其实是在给模型做评测! 就在两天前,由UCSD、UC伯克利等机构联合组建的GameArena团队开发了一个实时Roblox游戏「AI Space Escape」(AI空间逃脱),提供了一种与AI互动的独特体验。 现在,你想要测试不同模型的性能对比,打着游戏就能把活儿给干了。
2/13/2025 10:00:00 AM
新智元
没有数据、没有GPU的情况下怎么训练DeepSeek
春节期间,AI 界热闹非凡,到处都是关于 DeepSeek 的报道。 大家都知道,训练好的模型通常需要昂贵的专用 GPU,这对很多想试试微调技术的人来说,真是一道门槛。 好消息来了:你完全可以用免费的 Google Colab Notebook 来实现微调。
2/13/2025 9:45:31 AM
MobotStone
小红书&上交多模态大模型新基准,Gemini 1.5 Pro准确率仅48%
多模态大模型理解真实世界的水平到底如何? 有新基准来衡量了。 就在最近,小红书和上海交通大学联合提出WorldSense,一个全新的基准测试,用来评估多模态大模型(MLLMs)的多模态真实场景理解能力。
2/13/2025 9:40:00 AM
量子位
CoAT: 基于蒙特卡洛树搜索和关联记忆的大模型推理能力优化框架
研究者提出了一种新的关联思维链(Chain-of-Associated-Thoughts, CoAT)方法,该方法通过整合蒙特卡洛树搜索(Monte Carlo Tree Search, MCTS)和关联记忆机制来提升大语言模型(LLMs)的推理能力。 区别于传统的单步推理方法,CoAT致力于增强LLM的结构化推理能力和自适应优化能力,实现动态知识整合。
2/13/2025 9:34:13 AM
佚名
奥特曼再谈DeepSeek:每天醒来都有压力
关乎当红炸子鸡DeepSeek,奥特曼最新观点出炉:对DeepSeek的出现并不意外,而且类似的情况会越来越多。 这就是奥特曼在最新一期《泰晤士报》科技播客节目中所提及的内容之一。 并且在被问及是否担心OpenAI会成为AI界的Napster(首个P2P音乐共享平台,后因商业压力以失败告终)时,他表示:唯一不让这种事发生的方法就是每天都为此担心。
2/13/2025 9:30:00 AM
量子位
o3拿下IOI 2024金牌!新论文公布RL秘诀:AI自己设计测试时推理策略,无需人类干预
IOI 2024金牌,OpenAI o3轻松高分拿下! 刚刚,OpenAI发布了关于推理模型在竞技编程中应用的研究论文报告,论文中放出了OpenAI家推理模型三兄弟在IOI和CodeForce上的具体成绩。 三兄弟分别是OpenAI o1、o1-ioi(以o1为基础微调等改进而来)、o3,三者成绩如下。
2/13/2025 9:20:00 AM
量子位
OpenAI放王炸!GPT-5免费无限使用,产品矩阵大整合!
今天凌晨3点,OpenAI首席执行官Sam Altman公布了GPT-4.5和GPT-5的炸裂消息。 Altman表示,OpenAI很快发布GPT-4.5,就是传说中的猎户座模型(Orion),也是最后一个非思维链模型。 接着会整合GPT和O系列两大模型打造一个全新的系统,能自动选择思考和非思考功能,适用于多种任务。
2/13/2025 9:15:00 AM
AIGC开放社区
刚刚,奥特曼剧透GPT-4.5、GPT-5重大更新,o3取消独立发布
奥特曼深夜一则推文,在网络上掀起了讨论狂潮。 没有一点点预告,奥特曼亲自公布自家产品路线图,并承认公司最近发布的一些产品有些混乱。 推文透露,OpenAI 的下一步是发布 GPT-4.5,这是其最后一个非思维链 (CoT) 模型。
2/13/2025 9:10:47 AM
机器之心
OpenAI全新智能体评估报告:Operator在软件测试中表现如何?
译者 | 核子可乐审校 | 重楼OpenAI发布全新AI智能体Operator,本文带你一探如何用它简化软件测试、减少工作量并提高准确性。 测试是项既关键、又相当繁杂的过程。 保障每项功能、每个流程和每种极端情况都能按预期运作往往要占用大量时间和人力。
2/13/2025 9:09:58 AM
核子可乐
推荐一个企业级知识图谱增强的检索增强生成(RAG)的项目
介绍Microsoft GraphRAG 是一个开源项目,旨在利用 Microsoft Graph 的强大功能构建企业级的知识图谱增强的检索增强生成(RAG)方案。 简单来说,它将企业内部的各种数据源(如邮件、文档、日历、联系人等)通过 Microsoft Graph 连接起来,形成一个结构化的知识图谱,然后利用这个知识图谱来增强 RAG 系统的检索能力,从而提升大语言模型(LLM)在企业应用中的问答和生成效果。 项目架构GraphRAG 的架构设计清晰且模块化,主要包含以下几个核心组件:(1) 数据连接器(Data Connectors):负责从各种企业数据源(如 Microsoft 365 服务,包括 Exchange Online、SharePoint Online、OneDrive、Teams 等)提取数据。
2/13/2025 9:01:03 AM
IT运维技术圈
DeepSeek-R1技术解码:如何实现大模型推理能力的提升?
1月20日,幻方量化旗下AI公司深度求索(DeepSeek)发布了新一代开源大模型DeepSeek-R1。 作为一款专注于推理能力的AI大模型,DeepSeek-R1凭借着成本低、推理能力强等优势,在人工智能领域掀起了千层巨浪,引起了人们的广泛关注与讨论。 DeepSeek-R1的成功,让我们更加清晰地认识到推理能力在当下人工智能发展中的重要地位。
2/13/2025 8:51:23 AM
Yu
NLLB 与 ChatGPT 双向优化:探索翻译模型与语言模型在小语种应用的融合策略
本文探讨了 NLLB 翻译模型与 ChatGPT 在小语种应用中的双向优化策略。 首先介绍了 NLLB-200 的背景、数据、分词器和模型,以及其与 LLM(Large Language Model)的异同和协同关系。 接着列举了实战与应用的案例,包括使用 ChatGPT 生成的样本微调 NLLB-200 和使用 NLLB-200 的翻译结果作为 LLM 的 prompt 等。
2/13/2025 8:44:56 AM
Huang Minghui
干货:DeepSeek+SpringAI实现流式对话!
前一篇文章我们实现了《SpringAI集成满血版DeepSeek》,但是大模型的响应速度通常是很慢的,为了避免用户用户能够耐心等待输出的结果,我们通常会使用流式输出一点点将结果输出给用户。 那么问题来了,想要实现流式结果输出,后端和前端要如何配合? 后端要使用什么技术实现流式输出呢?
2/13/2025 8:06:40 AM
磊哥
DeepSeek 会是个好DBA吗?
作为近期作为大火的 AI 产品,Deepseek(简称DS) 已经成为现象级的爆款,朋友圈几乎都被刷屏,大家都在探索将 DS 深入千行百业,看如何能发挥出更大价值。 作为数据库从业者,我也在思考这个问题,看 DS 能做点啥。 圈里已经有几位朋友做了分享,我将从使用者的角度来谈谈对 DS 的使用印象。
2/13/2025 7:36:41 AM
韩锋
几个免费使用 DeepSeek 的渠道,告别「服务器繁忙,请稍后再试」
在眼下这个时间点,AI 已经不是什么稀缺资源了,这当然和最近爆火的 DeepSeek 有很大关系,尤其春节那几天,无论是北上广还是小县城甚至农村,无论是985高材生还是村里的叔叔大爷,都用上了 AI 大模型,而且是能力排在第一梯队的大模型,也就是 DeepSeek-R1。 之所以说在这以前,AI 还是稀缺资源,那是因为公认的第一梯队的大模型产品基本上都是国外的,而想要使用国外的产品,对于普通人来说,门槛还是非常高的。 而国内虽然也有不少免费的产品,但是整体来说,还是差点意思的。
2/13/2025 12:10:00 AM
风筝
神奇!DeepSeek一键接入WPS和Office,效率提升300%,无需任何编程(附保姆级教程)
大家好,我是岳哥。 DeepSeek最近爆火,各种玩法层出不穷,但跟咱们工作相关的除了一些AI指令,似乎没有其它新的玩法。 但我们工作中有大量需要使用Office或WPS等办公软件,那有没有什么办法在上面集成DeepSeek呢?
2/13/2025 12:00:02 AM
丶平凡世界
轻量开源!微软基础模型LLaVA-Rad:自动生成高质量放射学报告
编辑丨coisini多模态生成式人工智能的最新进展已将生物医学应用扩展到同时处理文本和图像,在视觉问答和放射学报告生成等任务中展现出潜力。 然而,这些模型在临床实现中面临挑战,特别是大型模型在计算成本等方面带来了部署难题。 小型多模态模型(SMM)虽然更高效,但与大型模型相比仍存在显著性能差距。
2/12/2025 5:42:00 PM
ScienceAI
DeepSeek爆火!我们整理了80余页宝典,带你从入门到精通!文末免费领取
出品 | 51CTO技术栈(微信号:blog51cto)新年伊始,DeepSeek的爆火席卷了全球。 更为难得地是,这款十分优秀的模型变得人人可以免费拥有。 在生成式AI大行其道的今天,DeepSeek正在凭借其开源、高效、多场景适应等优势,成为开发者、行业从业者以及个人用户的必备利器。
2/12/2025 4:13:34 PM
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
ChatGPT
模型
DeepSeek
AI绘画
机器人
数据
谷歌
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
芯片
英伟达
生成式
蛋白质
开发者
Anthropic
腾讯
研究
神经网络
3D
计算
生成
Sora
机器学习
AI设计
AI for Science
苹果
GPU
训练
AI视频
华为
搜索
Claude
场景
人形机器人
百度
智能体
xAI
预测
伟达
大语言模型
深度学习
Transformer
字节跳动
模态
LLaMA
文本
具身智能
神器推荐
Copilot
视觉
驾驶
API
应用
Agent
算力
大型语言模型
工具
安全
干货合集
视频生成