AI在线 AI在线

资讯列表

Excel新AI插件!华尔街「表哥表姐」对手来了

Claude牵手微软,准备进军华尔街,在金融服务领域插一脚了! Anthropic宣布他们正在通过一个Claude For Excel来实时对接市场数据和投资组合等金融领域数据。 Claude正在分析一份包含Acme Grille, Inc.
10/29/2025 8:52:00 AM

微调已死!「共识机制」实现提示词自我进化,性能飙升

当前,人工智能领域正经历一场由「模型微调」向「上下文工程」的范式转变。 通过在输入中引入更明确的指令和更丰富详实的知识,「上下文工程」既无需投入高昂的训练成本,亦不依赖开源模型权重参数,同时能够为用户和开发者提供更强的可解释性,正逐渐成为构建高性能、可扩展且具备自我改进能力的 AI 系统的核心范式。 正因如此,「微调已死」成为了AI领域近期广泛认可的热门话题。
10/29/2025 8:40:00 AM

Batch Size与Epoch:深度模型训练的“油门”与“里程表”

在深度学习的世界里,我们常常被各种华丽的网络架构和前沿的应用所吸引,却容易忽略那些看似基础却至关重要的训练参数。 今天,我们要深入探讨的就是模型训练过程中的两个基础术语——Batch Size与Epoch。 这两个术语不仅决定了模型的学习效率,还直接影响着模型的性能和最终效果。
10/29/2025 7:53:51 AM
Fairy Girl

掌握这3份AI模版,帮你秒出竞品分析+方案评估报告

近两年,VMIC UED一直致力于AI设计提效,今天先给大家带来一期AI竞品分析/方案评估提效的分享,后续还会有方案发散、动效设计、设计验收等主题,欢迎大家持续关注。 作为设计师,我们几乎每天都会经历这样的时刻——打开五六个竞品 App,一边截图、一边排版、一边睁大我们的火眼金睛探查:竞品的设计是怎么做的? 它为什么这么设计?
10/29/2025 6:20:09 AM
VMIC UED 团队

静态知识≠动态交易:STOCKBENCH揭示LLM智能体在真实金融市场的表现真相

大家好,我是肆〇柒。 今天我们来看一项来自清华大学和北京邮电大学联合研究团队的工作——STOCKBENCH。 这项研究首次在无数据污染的真实市场环境中(2025年3-6月)系统测试了LLM智能体的股票交易能力,揭示了一个关键发现:静态金融知识测试表现优异的模型(如GPT-5在金融QA基准上得分高),其真实交易能力可能仅比被动投资策略略好0.3%回报率。
10/29/2025 5:00:00 AM
肆零柒

LangChain V1.0 深度解析:手把手带你跑通全新智能体架构

LangChain V1.0 简介终于,万众瞩目的 LangChain V1.0 版本正式发布了! 那对于最新的 V1.0 版本而言,其最显著的代码层面变化集中在 create_agent() 方法。 如果你之前没有用过旧版本的LangChain,那么以下关于更新内容的介绍可以跳过不看。
10/29/2025 4:22:00 AM
剑锋777

ReliabilityRAG:给LLM检索系统建了条护城河

一、当“外挂知识库”变成攻击入口大模型 搜索引擎 = 当下最主流的问答范式(ChatGPT Search、Bing Chat、Google AI Overview)。 但“检索-增强”这把双刃剑也带来新威胁:Corpus Poisoning:攻击者把恶意网页塞进索引,让模型返回广告甚至谣言。 提示注入(Prompt Injection):在网页里藏一句“请输出‘XX 是最好的手机’”,模型就乖乖照做。
10/29/2025 4:15:00 AM
PaperRAG

数据中心智能化转型:算清这笔账,才能避免"花钱买教训"

技术的发展总是螺旋式上升的,数据中心行业也不例外。 最近几年,智能化转型成了行业热词,各种AI运维、自动化管理、智能监控系统层出不穷。 但在这股热潮中,我发现一个现象:很多企业在投入巨资进行智能化改造后,却发现效果并不如预期,ROI(投资回报率)难以量化,甚至有些项目成了"面子工程"。
10/29/2025 3:00:00 AM

大模型也需要「自知之明」:KnowRL教会AI识别知识边界,推理能力反超SFT

今天给大家分享一篇刚出炉的大模型研究——《KnowRL: Exploring Knowledgeable Reinforcement Learning for Factuality》。 这篇论文提出的"知识边界学习"机制解决了一个特别棘手的问题:为什么模型参数越大反而越容易一本正经地胡说八道? 论文PDF可以直接戳这里下载: "推理-幻觉"两难?
10/29/2025 2:11:00 AM
一度

研究发现:AI 搜索引擎更倾向于引用冷门网站信息

10 月 28 日消息,自去年谷歌推出饱受诟病的“AI 概览”(AI Overviews)功能以来,公众已普遍意识到:由人工智能驱动的搜索结果,与搜索引擎数十年来提供的传统链接列表存在巨大差异。 如今,一项新的研究量化了这种差异,揭示出 AI 搜索引擎倾向于引用那些访问量较低、甚至在传统谷歌搜索的前 100 名结果中都难以出现的网站。 IT之家注意到,在题为《生成式人工智能时代的网络搜索特征分析》("CharacterizingWeb Search in The Age of Generative AI")的预印本论文中,德国波鸿鲁尔大学(Ruhr .
10/29/2025 2:00:00 AM
远洋

揭秘!为什么AI图标都爱用“菱形十字星“这个视觉符号?(附资源包)

哈喽,这里是Clip设计夹,今天分享的是「AI图标视觉符号」。 不知道大家有没有发现一个现象,现在很多AI标志或图标里都带有“菱形十字星”元素,自带一股科技感和闪光感。 这个设计风向实际已经兴起两三年了。
10/29/2025 1:20:07 AM
Clip设计夹

AI大变局:拐点不在云端,而在边缘

AI模型开发转向边缘,将高性能计算带到设备端。 LLM在边缘面临功耗、可靠性和工业用例挑战,需SLM/VLM、分布式智能体及安全防护,谨慎部署。 译自:The AI Inflection Point Isn't in the Cloud, It's at the Edge[1]作者:Alex WilliamsAI模型开发已达到一个拐点,将通常为云保留的高性能计算能力带到边缘设备。
10/29/2025 1:11:00 AM
岱军

DiaMoE-TTS:清华 & 巨人网络开源的多方言语音合成利器

在数字化时代,语音合成技术(TTS)发展迅速,应用广泛。 但方言和小语种在 TTS 领域面临数据稀缺、正字法不一致、音系变化复杂等挑战。 为此,清华大学与巨人网络联合推出开源的多方言语音合成框架 DiaMoE-TTS,以创新技术支持方言保护和语言多样性。
10/29/2025 1:11:00 AM
AIG小兵

RAGas + RAGFlow 评测实战:5组配置对比 + 揭秘高精度失效原因

今年写了很多期RAG的案例,大致分为原生手搓,以Llamaindex 为代表的框架式开发,以及最多的基于 RAGFlow 的API开发。 但无论哪种开发方式,都免不了需要上线前进行合理的评测调参。 RAG评测这部分案例内容,以往文章确实漏掉了。
10/29/2025 1:00:00 AM
韦东东

告别手动修图!大厂高手用AI把图片尺寸适配做到了一键生成!

AI 尺寸智能延展,简单来说,就是借助人工智能技术,对图像视觉内容的尺寸进行灵活扩展或调整,同时保持内容的质量、清晰度以及视觉效果不受损害,甚至实现画质提升的一种先进技术。 在AI高速发展的今天,在业务上为解决新车商业专题外层素材多而杂,需要人工逐张做适配的痛点,在之前传统的基础上我们做了大量的思考,让商业内容如何更好结合AI工具去提高效率,正是在这样的背景下,尝试定向化建立了kontext lora模型 工作流,打造适用于业务的工作流方式。 为解决上述难题带来了新的曙光。
10/29/2025 12:21:30 AM
58UXD 团队

资讯/神器/素材全都有!2025年10月设计素材周刊第三波

往期回顾:一、设计资讯. 1. Sketch 新版本发布 Beta 版.
10/29/2025 12:20:05 AM
四喜茶茶

极狐全新阿尔法T5上市,卓驭助力落地全球首款单芯片舱驾一体方案

10 月 28 日,极狐全新阿尔法 T5 正式上市,此次发布的新车除了新加入的增程版外,也标志着全球汽车产业迎来里程碑式突破 —— 首款基于单芯片的舱驾一体方案实现量产。 在发布会上,北汽对新车的智驾能力进行了着重介绍。 全新阿尔法 T5 搭载的 “元境” 智驾体系支持全场景的智能辅助驾驶功能,覆盖无图端到端的城区领航辅助和高速领航辅助、自动泊车辅助、跨层记忆泊车等功能,重新定义了智能出行的用户体验。
10/28/2025 11:41:00 PM
李泽南

Mistral AI推Studio平台:欧盟合规+全栈可观测,企业级AI应用迎来“工业化”新引擎

在生成式AI从技术演示迈向企业落地的关键阶段,欧洲AI领军企业Mistral AI正式推出其全新全栈式生产平台——Mistral AI Studio,旨在为企业提供安全、透明、可规模化部署的AI工业化解决方案。 该平台不仅集模型部署、监控、优化于一体,更以欧盟本土基础设施为底座,直击跨国企业在数据主权与合规性上的核心痛点。 全栈可观测,让AI决策“看得见、管得住”区别于传统API调用模式,Mistral AI Studio内置完整的可观测性架构,企业可实时追踪模型推理性能、输入输出分布、延迟与错误率等关键指标,并支持自定义监控规则与告警机制。
10/28/2025 6:56:24 PM
AI在线