资讯列表
DeepSeek 更新 R1 推理 AI 模型:代码生成与复杂推理性能大幅提升 推理能力比肩 o1
DeepSeek 公司近日对其高性能推理 AI 模型 DeepSeek-R1进行了重大更新,显著提升了模型在代码生成和复杂推理任务中的表现,引发人工智能领域的广泛关注。 以下基于公开信息和最新动态,全面解析此次更新的关键亮点。 R1模型更新:代码能力大幅提升DeepSeek-R1的最新更新在代码生成能力上取得了显著突破。
5/29/2025 10:01:21 AM
AI在线
开源+低成本!Paper2Poster让学术论文秒变学术海报
一款名为Paper2Poster的论文转多模态海报工具在学术圈和AI社区引发热烈讨论。 这款工具通过自动化技术,将复杂的学术论文转化为视觉清晰、信息高效的多模态海报,为研究人员节省了大量时间和精力。 从论文到海报:自动化新体验Paper2Poster的核心功能是将PDF格式的学术论文(包含文字、图表等复杂内容)自动转化为结构清晰、视觉友好的学术海报。
5/29/2025 10:01:21 AM
AI在线
正式开源!DeepSeek-R1-0528震撼发布,性能直逼OpenAI o3,免费API已上线
近日,AI领域迎来重磅消息!中国AI初创公司DeepSeek正式发布了其开源大语言模型 DeepSeek-R1-0528的最新版本。 这一更新不仅在性能上实现了重大突破,还通过免费API的提供进一步推动了AI技术的普及与应用。 以下,AIbase将为您详细解析此次更新的亮点与意义。
5/29/2025 10:01:21 AM
AI在线
Meta AI 用户突破10亿,扎克伯格透露未来付费服务计划
在日前举行的 Meta 公司年度股东大会上,首席执行官马克・扎克伯格公布了一个振奋人心的消息:Meta 的人工智能助手现已吸引超过10亿的月活跃用户。 扎克伯格在大会上表示,Meta 今年的核心战略是深化用户体验,致力于将 Meta AI 发展成为行业内领先的个性化人工智能助手。 他提到,个性化、语音对话和娱乐将是今年的主要发展方向,Meta 希望通过技术创新进一步提升用户交互体验。
5/29/2025 10:01:21 AM
AI在线
DeepSeek悄然发布R1最新版本,性能直逼OpenAI o3引发业界震动
开源大模型领域再次迎来重磅消息。 DeepSeek平台近日低调发布了R1模型的最新0528版本,这一举动在AI开发者社区引起了广泛关注。 值得注意的是,DeepSeek此次采用了相当低调的发布策略,既没有发布详细的技术说明文档,也没有举行任何形式的发布活动,而是选择"悄悄"开放模型下载。
5/29/2025 10:01:21 AM
AI在线
慕尼黑初创公司 Spaitial:用生成 AI 重塑 3D 空间的未来
慕尼黑的初创公司 Spaitial 正在开发一种全新的生成 AI 技术,旨在创建和理解三维环境。 这种技术被称为空间基础模型(SFM),它能够从文本或图像中生成真实和想象的3D 场景。 Spaitial 的目标是让 AI 具备对空间的物理理解,这一能力在现有的 AI 模型中存在显著不足。
5/29/2025 10:01:21 AM
AI在线
新神器LocAgent发布,代码定位准确率高达92.7%,程序员的福音!
程序员们又有新工具可以欢呼了!由 OpenHands、耶鲁大学、南加州大学和斯坦福大学的研究团队联手推出的 LocAgent,正是一个专门为代码定位而设计的图索引大语言模型(LLM)代理框架。 令人振奋的是,LocAgent 的代码定位准确率达到了92.7%,这一新高度将在2025年 ACL 会议上正式亮相。 程序员在工作中常常会遇到难以定位代码问题的困扰。
5/29/2025 10:01:21 AM
AI在线
模型吞噬代码,Agent重构世界:当AI Agent与模型协同进化
大家好,我是肆〇柒。 AI 圈的进化速度之快,已是不争的事实。 去年,MCP(模型上下文协议)发布,随后 AI Coding 赛道愈发热闹,Cursor、Cline、Devin、MGX 等产品层出不穷。
5/29/2025 9:57:38 AM
肆零柒
英伟达 CEO 黄仁勋:未来每个制造业工厂都会有匹配的“AI 工厂”
英伟达CEO黄仁勋表示,未来每个制造业工厂都将配备AI工厂,推动AI技术在各行业的应用。目前AI技术仍处于早期阶段。#AI工厂##制造业未来#
5/29/2025 9:55:54 AM
浩渺
如何使用 LLM实现电子表格规范化
一、如何使用 LLM实现电子表格规范化请观察以下电子表格:图片从“为什么”开始图片让我们看一下这个Excel电子表格,其中包含电影奖项的信息。 这是一个典型的、常见的电子表格,每个人都可能在日常工作中使用它。 但它有什么问题呢?
5/29/2025 9:48:22 AM
晓晓
CVPR 2025 | 字节提出个性化多人图像生成新方法ID-Patch,可生成多人合影、姿势可控
相信扩散模型(DMs)大家一定都不陌生了,目前已经成为文本生成图像的核心方法,凭借强大的图像生成能力,正重塑艺术创作、广告设计、社交媒体内容生产格局。 现在,用一段文字生成个性化头像都不算啥新鲜事儿了。 不过仍然会有这样一个问题,目前我们看到的基于人物的文生图大多还是生成一个人的,对于多人同时生成的目前还没有很好的样例。
5/29/2025 9:34:14 AM
AIGC Studio
搜索Agent最新高效推理框架:吞吐量翻3倍、延迟降至1/5,还不牺牲答案质量丨南开& UIUC研究
AI越来越聪明,但如果它们反应慢,效率低,也难以满足我们的需求。 大语言模型(LLM)驱动的搜索智能体,通过动态拆解问题、交错执行“思考”(推理)和“查找”(检索)来解决复杂任务,展现了惊人能力。 然而,这种深度交互的背后,也隐藏着显著的效率痛点。
5/29/2025 9:21:28 AM
港科大Apple新研究:Tokens使用量减少,模型推理还更强了
1 1等于几? 现在的大推理模型(LRMs)已经展现出了非凡的推理能力。 但是面对这样最简单的数学问题,现有的LRMs仍需要花费1400 的tokens来思考。
5/29/2025 9:20:00 AM
准确率92.7%逼近Claude 3.5、成本降低86%,开源代码定位新神器LocAgent来了
又是一个让程序员狂欢的研究! 来自 OpenHands、耶鲁、南加大和斯坦福的研究团队刚刚发布了 LocAgent—— 一个专门用于代码定位的图索引 LLM Agent 框架,直接把代码定位准确率拉到了 92.7% 的新高度。 该研究已被 ACL 2025 录用。
5/29/2025 9:18:20 AM
初探 Deepseek R1-0528 开源模型:AI 编程能力跃升,媲美 OpenAI o3 和 o4-mini
深度求索(Deepseek)昨日通过官方交流群,邀请用户测试 DeepSeek-R1-0528 模型小版本,初步测试结果表明,R1-0528 在编程能力、审美设计和代码补全等方面表现出色,尤其在复杂指令处理和前端页面生成上展现了高精度和高效能。
5/29/2025 9:16:36 AM
故渊
爆火论文颠覆RL认知!「错误奖励」让LLM推理暴涨24.6%,学界惊了
今早的一篇爆火论文,彻底颠覆了人们对「强化学习」的传统认知。 仅用随机奖励,甚至是错误答案,也能让AI在数学推理中性能暴涨! 来自华盛顿大学、AI2、UC伯克利研究团队证实,「伪奖励」(Spurious Rewards)也能带来LLM推理能力提升的惊喜。
5/29/2025 9:14:17 AM
阿里通义发布并行计算新策略:1.6B等效4.4B,内存消耗骤降95%
既能提升模型能力,又不显著增加内存和时间成本,LLM第三种Scaling Law被提出了。 对于1.6B模型,能实现性能接近4.4B模型,内存占用仅为后者的1/22,延迟增加量为1/6。 并且可直接应用于现有模型(如Qwen-2.5),无需从头训练。
5/29/2025 9:14:00 AM
19岁少年用计算机炼出「神药」,斩获全球大奖!大厂看了都沉默
「少年药神」来了! 来自斯洛伐克的19岁少年Adam Kovalčík,凭借计算机模拟设计的新分子,一举夺得全球顶级大奖! 这些分子有望像广谱抗病毒药物Galidesivir一样有效阻止病毒复制。
5/29/2025 9:10:18 AM