AI在线 AI在线

大型语言模型

应对模型推理缺陷:苹果MIND团队加紧招聘AI人才

在苹果公司最近发布一项引发广泛讨论的研究,揭示当前大型推理模型存在重大缺陷之后,该公司正迅速行动,加紧招聘该领域的高级人才。 苹果西雅图的MIND(机器学习与人工智能研究)团队正在招募一名专家,旨在培养在**推理、规划、工具使用和基于代理的LLM(大型语言模型)**方面拥有深厚专业知识的人才。 招聘核心要求:开发更准确高效的新型架构该职位的核心目标是开发更准确、更高效的新型LLM和VLM(视觉语言模型)架构。
10/23/2025 9:42:21 AM
AI在线

AI 驱动的“数字孪生”解放工作效率:初创公司 Viven 获3500万美元种子轮融资,解决员工“不在场”痛点

内部沟通和信息协调是项目推进的常态,然而,当掌握关键信息的员工因休假或时区差异而无法及时回复时,项目进度往往被迫停滞,造成高昂的时间成本。 人工智能招聘初创公司 Eightfold 的联合创始人 Ashutosh Garg 和 Varun Kacholia 认为,利用先进的 大型语言模型 (LLM) 和 数据隐私技术 可以解决这一难题。 两人于今年早些时候创立了 Viven。
10/16/2025 10:12:01 AM
AI在线

思考不是免费的,大型语言模型推理的收益与代价

对于人工智能智能体,谈判是一场最接近人类智慧的“角斗”,它不仅仅是语言的堆砌,更是策略的博弈、心理的揣摩和利益的权衡。 人类社会和经济活动中,谈判无处不在,从商场里的价格讨价还价,到国际政治的桌面博弈,都是智慧与策略的交锋。 对于AI代理来说,能否在谈判中表现出色,直接决定了它们能否真正走向自主决策的未来。
10/14/2025 1:00:00 AM
波动智能

Anthropic 突破性发现:仅250份中毒文件即可攻破大型 AI 模型

Anthropic 联合英国人工智能安全研究所和艾伦图灵研究所发布的一项关键研究表明,只需250份被“投毒”的文件,就能成功在大型语言模型(LLM)中植入后门,且这种攻击的有效性与模型的大小无关。 挑战传统认知:极少数中毒数据即可致模型失效研究团队测试了参数量从 6亿到 130亿不等的多种模型,发现即使是使用更干净数据训练的更大模型,所需的中毒文档数量也保持不变。 这一发现颠覆了长期以来的假设——即攻击者需要控制训练数据的特定比例才能破坏模型。
10/12/2025 9:23:39 AM
AI在线

​Anthropic研究:仅需 250 份中毒文件即可轻易攻破大型 AI 模型

近日,人工智能公司 Anthropic 联合英国人工智能安全研究所及艾伦图灵研究所发布了一项重要研究,揭示了大型语言模型(LLM)在数据中毒攻击下的脆弱性。 研究表明,只需250份被 “投毒” 的文件,便能够在多种规模的 AI 模型中植入后门,而这一攻击手段的有效性与模型的大小并无直接关系。 在这项研究中,科研团队对参数量从6亿到130亿的多种模型进行了测试。
10/12/2025 9:23:24 AM
AI在线

新工具来袭!BentoML发布llm-optimizer,助你轻松优化LLM推理性能

近日,知名开源项目 BentoML 推出了一款名为 llm-optimizer 的全新工具,旨在为开发者提供一种简单而高效的方法来优化大型语言模型(LLM)的推理性能。 随着人工智能技术的迅速发展,LLM 的应用也越来越广泛,如何高效地部署和使用这些模型成为了不少开发者面临的挑战。 llm-optimizer 的推出,无疑为这一问题提供了极具价值的解决方案。
9/16/2025 10:06:26 AM
AI在线

瑞士科技新突破:Apertus开源模型挑战AI“黑箱”,全面公开训练细节

瑞士的科研机构正在联手挑战大型语言模型的“黑箱”现状。 瑞士联邦理工学院洛桑分校(EPFL)、**苏黎世联邦理工学院(ETH Zurich)以及瑞士国家超级计算中心(CSCS)**近日发布了一款名为 Apertus 的大规模开源语言模型。 该模型不仅在名称上——拉丁语意为“开放”——彰显了其核心理念,更在实践中将“开放”做到了极致。
9/16/2025 10:06:26 AM
AI在线

DeepL 推出企业级 AI 智能体,挑战 OpenAI 与微软

德国初创公司 DeepL 宣布将业务从翻译拓展至 企业通用 AI 智能体 领域。 新推出的 DeepL 智能体 能跨人力资源、市场营销等部门执行重复性和耗时任务,支持自然语言指令操作。 该产品基于 DeepL 自研大型语言模型,并整合外部模型。
9/4/2025 10:52:19 AM
AI在线

谷歌推出新方法:训练数据量减少 1 万倍,提升模型精准度

近日,谷歌在其研究中提出了一种新颖的主动学习筛选流程,旨在大幅降低微调大型语言模型所需的训练数据量。 根据实验结果,这种方法能够将训练数据量降低至原来的1万分之一,同时提高模型与人类专家判断的一致性达65%。 在实际应用中,如广告内容分类、金融数据安全分析等领域,对高保真训练数据的需求一直很高,但筛选出符合要求的数据不仅难度大,成本也极为昂贵。
8/25/2025 3:00:52 PM
AI在线

AI爬虫“入侵”网络:Fastly 报告揭示,Meta、OpenAI 等巨头成主要流量来源

您好,这是一份我为您整理的关于AI爬虫对网络影响的新闻稿,内容紧凑且重点突出。 据云服务公司 Fastly 最新报告显示,人工智能(AI)爬虫正在给开放网络带来沉重负担,网站流量的显著增长并非来自人类访客,而是日益庞大的机器人程序,特别是来自大型AI公司的爬虫和抓取程序。 报告指出,在所有访问网站的AI机器人流量中,AI爬虫占据了高达**80%的份额,而剩下的20%**则由 AI抓取程序贡献。
8/22/2025 10:54:52 AM
AI在线

微软Copilot打破Excel工作流壁垒:一键完成数据分析、分类与内容生成

微软正在通过一项名为“Copilot”的新功能,将大型语言模型(LLM)的强大能力直接引入 Excel 单元格,旨在从根本上改变用户处理数据的方式。 这项集成将加快数据分析、文本分类和内容生成等任务的速度,让用户无需手动编辑或依赖外部工具。 使用简单,功能强大新的 Copilot 功能通过一个简单的公式 =COPILOT(prompt_part1, [context1], ...) 即可使用。
8/20/2025 10:05:59 AM
AI在线

如何训练你的大型语言模型

打造一个听起来很智能的大型语言模型 (LLM) 助手,就像在反复塑造泥塑一样。 你从一块泥土开始,把它挤压成一个可行的结构,然后开始精雕细琢,直到最终成品。 越接近最终成品,那些精妙的点缀就越重要,正是这些点缀决定了最终成品是杰作还是恐怖谷效应。
8/19/2025 10:10:46 AM
晓晓

Self-Play Critic:以“对抗博弈”创新大语言模型推理评估

大家好,我是肆〇柒。 今天,我想和大家聊一项创新的评估思路——Self-Play Critic(SPC)。 大型语言模型(LLM)目前已成为我们生活和工作中不可或缺的工具。
8/8/2025 3:00:00 AM
肆零柒

17 种 RAG 架构实现原理与选型

RAG(Retrieval-Augmented Generation)是一种结合外部知识检索与语言模型生成的混合技术架构。 它在大型语言模型(如 GPT)生成能力的基础上,通过外部知识库提高了准确性、时效性和可控性,广泛用于企业问答、搜索增强、智能客服、代码辅助、知识图谱等场景。 然而,RAG不是一个固定结构,也没有固定的套路,而是一套可以灵活演化的系统。
8/4/2025 6:05:00 AM
Andflow

全新的AI模型带来更快速的漏洞检测方案

一组研究人员开发出一种名为White-Basilisk的新型AI模型,该模型检测软件漏洞的效率高于许多大型系统。 当前,开发人员和安全团队在保障复杂代码库安全方面面临着越来越大的压力,且往往缺乏部署大规模AI工具的资源,该模型正是在这一背景下发布的。 小模型,大成效与需要数十亿参数和强大计算能力的大型语言模型(LLM)不同,White-Basilisk模型非常紧凑,仅有2亿个参数,然而,在多个用于漏洞检测的公共基准测试中,它的表现优于规模超过其30倍的模型,这至少在专门的安全任务方面,对“模型越大越好”的观点提出了质疑。
8/1/2025 2:38:14 PM
Mirko Zorz

AREAL 开源:解耦架构与创新算法驱动的强化学习系统

大家好,我是肆〇柒。 推理能力在当下 AI 领域,尤其自然语言处理、智能决策系统、科学研究辅助等众多关键领域,已然成为推动技术革新的关键要素。 然而,目前大型语言模型虽已取得瞩目成果,但在处理复杂逻辑时,常受困于逻辑连贯性把控,长链推理面临信息丢失、逻辑断裂问题,长序列输出任务下推理耗时久、资源消耗大,这些痛点严重制约模型应用场景拓展与性能深化。
7/25/2025 9:03:24 AM
肆零柒

AI Agent 协议:未来AI智能生态的基础设施

大家好,我是肆〇柒。 今天想跟大家深入聊聊 AI 智能体协议这个极具前瞻性的话题。 关于智能体协议,我跟了一段时间,发现它就像是打开智能体协作大门的一把钥匙,特别有意思,而且对未来的智能生态影响深远。
7/23/2025 9:21:03 AM
肆零柒

AGENTGROUPCHAT-V2:大型语言模型多智能体协作的创新思考

大家好,我是肆〇柒。 LLM 多智能体系统在社会模拟和复杂任务解决这两大领域大显身手。 在社会模拟里,它们精准地复刻人类社交互动模式,助力我们洞察群体行为背后的社会学;在复杂任务解决场景下,智能体们协同合作,先是制定详尽规划,再按部就班执行,轻松应对复杂局面。
7/15/2025 12:14:44 PM
肆零柒