AI在线 AI在线

AI

如何使用 LLM实现电子表格规范化

一、如何使用 LLM实现电子表格规范化请观察以下电子表格:图片从“为什么”开始图片让我们看一下这个Excel电子表格,其中包含电影奖项的信息。 这是一个典型的、常见的电子表格,每个人都可能在日常工作中使用它。 但它有什么问题呢?
5/29/2025 9:48:22 AM
晓晓

CVPR 2025 | 字节提出个性化多人图像生成新方法ID-Patch,可生成多人合影、姿势可控

相信扩散模型(DMs)大家一定都不陌生了,目前已经成为文本生成图像的核心方法,凭借强大的图像生成能力,正重塑艺术创作、广告设计、社交媒体内容生产格局。 现在,用一段文字生成个性化头像都不算啥新鲜事儿了。 不过仍然会有这样一个问题,目前我们看到的基于人物的文生图大多还是生成一个人的,对于多人同时生成的目前还没有很好的样例。
5/29/2025 9:34:14 AM
AIGC Studio

搜索Agent最新高效推理框架:吞吐量翻3倍、延迟降至1/5,还不牺牲答案质量丨南开& UIUC研究

AI越来越聪明,但如果它们反应慢,效率低,也难以满足我们的需求。 大语言模型(LLM)驱动的搜索智能体,通过动态拆解问题、交错执行“思考”(推理)和“查找”(检索)来解决复杂任务,展现了惊人能力。 然而,这种深度交互的背后,也隐藏着显著的效率痛点。
5/29/2025 9:21:28 AM

初探 Deepseek R1-0528 开源模型:AI 编程能力跃升,媲美 OpenAI o3 和 o4-mini

深度求索(Deepseek)昨日通过官方交流群,邀请用户测试 DeepSeek-R1-0528 模型小版本,初步测试结果表明,R1-0528 在编程能力、审美设计和代码补全等方面表现出色,尤其在复杂指令处理和前端页面生成上展现了高精度和高效能。
5/29/2025 9:16:36 AM
故渊

爆火论文颠覆RL认知!「错误奖励」让LLM推理暴涨24.6%,学界惊了

今早的一篇爆火论文,彻底颠覆了人们对「强化学习」的传统认知。 仅用随机奖励,甚至是错误答案,也能让AI在数学推理中性能暴涨! 来自华盛顿大学、AI2、UC伯克利研究团队证实,「伪奖励」(Spurious Rewards)也能带来LLM推理能力提升的惊喜。
5/29/2025 9:14:17 AM

阿里通义发布并行计算新策略:1.6B等效4.4B,内存消耗骤降95%

既能提升模型能力,又不显著增加内存和时间成本,LLM第三种Scaling Law被提出了。 对于1.6B模型,能实现性能接近4.4B模型,内存占用仅为后者的1/22,延迟增加量为1/6。 并且可直接应用于现有模型(如Qwen-2.5),无需从头训练。
5/29/2025 9:14:00 AM

19岁少年用计算机炼出「神药」,斩获全球大奖!大厂看了都沉默

「少年药神」来了! 来自斯洛伐克的19岁少年Adam Kovalčík,凭借计算机模拟设计的新分子,一举夺得全球顶级大奖! 这些分子有望像广谱抗病毒药物Galidesivir一样有效阻止病毒复制。
5/29/2025 9:10:18 AM

一个省略号提示+强化学习搞定大模型“过度思考”,中科院自动化所新方法:从强制推理到自主选择

在日益强调“思维能力”的大语言模型时代,如何让模型在“难”的问题上展开推理,而不是无差别地“想个不停”,成为当前智能推理研究的重要课题。 中国科学院自动化研究所联合鹏城实验室提出了一种高效的推理策略,赋予推理大模型根据题目难度自主切换思考模式的能力:通过一个小小的省略号作为提示词 多阶段强化学习,引导大模型自主决定是否深度思考、思考多少。 研究背景:大模型“想太多”,是优点还是负担?
5/29/2025 9:08:00 AM

开源AI开发生态大洗牌:低代码平台逆袭,传统LLM框架日渐式微

当前的大模型开发生态,被一份报告、完整全景图谱讲清楚了。 就在第十届527蚂蚁技术日上,蚂蚁通过Coding范式、数据、模型部署等角度,对现有开源生态进行了全面完整的大剖析,从数据的视角揭示了大模型开源生态的演进规律,如果你是大模型开发者或者潜在的开发者,几乎研究好这份报告可能就够了。 但这还不够,在报告出炉之前的周末,蚂蚁还发布了2025大模型开源生态全景图,涵盖19个技术领域、135个项目,进一步给出了大模型开发生态的参考系。
5/29/2025 8:58:08 AM

快速理解热门 LLM 大语言模型

作者 | masonpy本文尽量用最简单的方式, 帮读者理解 LLM,Transformer, Prompt, Function calling, MCP, Agent, A2A 等这些基本概念。 表述时不追求绝对准确,尽量通俗易懂,部分内容有个人理解的成份,内容难免疏漏, 欢迎指正。 注意:本文需要你有基本的代码阅读能力,当然非开发阅读也不会很困难。
5/29/2025 8:30:00 AM
腾讯技术工程

单人公司能否纯凭AI智能体发育成独角兽?有戏!

译者 | 核子可乐审校 | 重楼如果你正在寻找一种替代打工生活的选择,那么自营职业——也被称为“个体创业”(solopreneuring)——可能是个好思路。 你可以凭借自己的软件开发、设计或商业技能作为独立承包商谋求发展。 或者,大家甚至可以独立创办一家公司以获得更大的回报。
5/29/2025 8:13:35 AM
核子可乐

马斯克新推出的 AI 编程助手速度是高级工程师的 10 倍,整个技术团队都面临挑战

从特斯拉的自动驾驶技术,到 Neuralink 的脑机接口,马斯克旗下的 AI 项目一直在推动技术边界。 最新发布的 AI 编程助手——xAI CodeGen,声称其开发速度是资深开发者的十倍以上。 图片作为一款先进的 AI 工具,xAI CodeGen 是否真的能够理解复杂逻辑、准确调试,并生成结构清晰、适合生产环境的代码,成为业界关注的焦点。
5/29/2025 8:10:51 AM
前端小智

AI 搜索“毒化”现实:模型崩溃隐忧,从神器到“垃圾输出”

报道称以 Perplexity 为代表的 AI 搜索工具虽然表现要优于谷歌等传统搜索引擎,但在不断地版本更迭后,搜索结果质量不升反降,AI 模型崩溃(model collapse)现象正在显现。
5/29/2025 6:26:50 AM
故渊

告别手写代码!十款开源 AI 工具,截图秒变可运行代码(附 GitHub 地址)

今年一直在学习和研究AI,也做了很多高价值AI开源项目的总结,今天就和大家分享11款通过截图(图片)生成代码的开源项目和工具,帮助大家提高编码效率。 Screenshot to Code图片它能够将设计图中的截图自动转化为代码片段,主要用于网页和应用界面的开发。 支持的技术栈包括 HTML Tailwind、React Tailwind、Vue Tailwind、Bootstrap、Ionic Tailwind、SVG 等。
5/29/2025 5:00:10 AM
趣谈AI

第二次Sora时刻来了!全球首款实时摄像头诞生,真人感拉满颠覆全行业

就在今天,AI视频领域,再次迎来了高能时刻! 硅谷新锐公司AKOOL正式发布的全球首款实时摄像头——AKOOL Live Camera,一举点燃了全行业的热情! 它不仅能秒变虚拟数字人、实时翻译多语言、无缝替换人脸,还能动态生成影视级画质的视频画面,将四大功能集于一身。
5/29/2025 4:15:00 AM
新智元

混合推理模型(LHRM):平衡效率与推理能力的新范式

大家好,我是肆〇柒。 今天,我们来探讨一下大型混合推理模型(LHRM)。 在人工智能领域,大型推理模型(LRM)能够自如的完成比如编程、数学和常识推理等任务。
5/29/2025 3:00:00 AM
肆零柒

如何通过 OpenMemory MCP 增强客户端的上下文感知能力

人工智能(AI)技术发展迅速,大型语言模型(LLMs)极大地简化了许多任务。 然而,它们面临一个基本限制:会话之间无法保留记忆。 图片如果能够拥有一个本地的、便携的 LLM “记忆层”,完全掌控您的数据,会怎样呢?
5/29/2025 2:11:00 AM
AI研究生

基于四大AI交互协议的AI测试平台架构

在IT互联网技术领域,一个APP或系统背后的技术架构,有web层、server层、中间件、数据库和底层的操作系统,看起来很复杂。 后来大家逐渐形成了较为统一的标准,即通过API接口将不同层级之间串联起来,最终才能形成一个能提供完善服务的APP应用。 AI领域目前也出现了类似的统一标准或者机制,来实现大模型、智能体等AI工具之间的协作通信。
5/29/2025 1:45:00 AM
写文章的老张