AI在线 AI在线

理论

RAG 中的语义分块:实现更优的上下文检索

检索增强生成(RAG)技术异军突起,席卷了整个大语言模型领域。 通过将大语言模型(LLMs)的强大能力与外部知识检索相结合,RAG使得模型能够生成准确且有依据的回复,即便在专业领域也不例外。 在每一个表现卓越的RAG流程背后,都有一个默默发挥关键作用的 “英雄”:分块技术,尤其是语义分块。
5/7/2025 8:35:11 AM
大模型之路

SmallRye大模型简介:使用Langchain4J轻松向应用内引入AI服务

译者 | 核子可乐审校 | 重楼Langchain4J解决了哪些问题? Langchain4J 本质上是为 Java 开发者打造的工具箱,旨在简化向高级语言中集成 AI 功能(如聊天机器人或文本生成器)的过程,同时屏蔽底层复杂细节。 想象一下:我们想要构建一个能回答问题、生成内容或模拟人类对话的智能应用。
5/7/2025 8:14:58 AM
核子可乐

当人工智能脱离人类监督:自维持系统的网络安全风险

译者 | 晶颜审校 | 重楼人工智能正从执行预定义指令的工具,进化为具备自我修改、参数重写及实时反馈进化能力的复杂系统。 这种被称为“自创生”的自维持特性,使其能动态适应环境以提升效率,但也带来不可预测性。 对网络安全团队而言,传统安全模型基于“威胁来自外部”的假设——即恶意行为者利用稳定系统漏洞实施攻击。
5/7/2025 8:07:09 AM
晶颜

100个Python机器学习小技巧,让你速通ML

构建机器学习模型是数据科学的关键环节,涉及运用算法进行数据预测或挖掘数据中的模式。 本文分享一系列简洁的代码片段,涵盖机器学习过程的各个阶段,从数据准备、模型选择,到模型评估和超参数调优。 这些代码示例能帮助你使用诸如Scikit-Learn、XGBoost、CatBoost、LightGBM等库,完成常见的机器学习任务,还包含使用Hyperopt进行超参数优化、利用SHAP值进行模型解释等高级技术。
5/7/2025 7:17:18 AM
学研君

比人类更有说服力,AI被滥用成舆论操控隐形推手?

近年来,人工智能(AI)技术飞速发展,给人类社会带来诸多便利。 特别是大模型的飞速发展,对医疗、教育、交通等诸多领域带来了深刻变革。 然而,如同硬币的两面,AI在给人类社会带来诸多便利的同时,其滥用现象也逐渐浮出水面。
5/7/2025 6:00:00 AM
Yu

2025年的CIO现状:CIO制定AI议程

如今,随着对AI的关注,Tractor . Supply公司再次凭借其在AI领域的早期投资占据了领先地位,这些投资包括用于销售和商品预测以及优化商品补货的AI技术。 最近,Tractor .
5/7/2025 5:00:00 AM
Beth Stackpole

IT领导者如何将自主式AI用于业务工作流程

自主式AI是AI演进的新前沿,已成为当今企业讨论的核心话题。 自主式AI在Forrester的2024年趋势榜单中名列前茅,Salesforce预计到2026财年末将有10亿个自主式AI投入使用。 尽管“自主式AI”这一术语应用较为宽泛,但它通常指的是赋予智能体更多自主权,以优化任务并串联起日益复杂的行动。
5/7/2025 4:00:00 AM
Bill Doerrfeld

Java 开发者必看!用 Quarkus + LangChain4j 实现本地 Ollama 的 AI 深度集成

在探索AI与现代技术栈融合的道路上,搭建一个能在本地高效运行的智能交互应用是个不错的实践方向。 本文介绍如何构建 Quarkus 应用程序。 该程序会设置 REST 端点,借助 LangChain4j 调用本地 Ollama 模型,用户调用端点发问题,即可获取模型响应。
5/7/2025 1:01:00 AM
学研妹

从看见到理解,多模态大模型如何重塑行为检测

在人工智能技术快速迭代的今天,行为检测作为计算机视觉领域的重要分支,正迎来一场由多模态大模型引领的技术革命。 作为曾在CV算法公司工作的从业者,我深刻体会到传统计算机视觉方法在实际落地中的诸多痛点。 过去几年,许多行为检测、烟火检测等应用,往往因为高昂的训练成本和难以接受的误报率而被甲方叫停。
5/7/2025 1:00:00 AM
贝塔街的万事屋

三分钟快速入门大模型数据工程

向自然语言处理的大模型应用,数据工程的核心任务是构建一套高效、可扩展、可控的数据流程,从源头到可用于模型训练、推理的高质量文本语料,全链路打通。 数据工程的整体目标构建稳定的数据流转链路,从原始文本数据 → 清洗/标注/审核后的语料 → 符合模型输入格式的数据集保证数据可用性、完整性、质量、结构统一性支持多阶段使用场景:训练/微调、推理RAG、评估测试等数据来源最常见的形式是甲方提供,如客户工单、业务知识库、客服聊天记录、FAQ 等。 需尽早明确数据格式、内容范围、隐私边界。
5/7/2025 12:10:00 AM
贝塔街的万事屋

通义实验室又一位大佬出走!传应用视觉团队负责人薄列峰已离职,将任职另一大厂多模态模型负责人!

出品 | 51CTO技术栈(微信号:blog51cto)北京时间5月6日,据知情人士透露,阿里巴巴通义实验室应用视觉团队负责人薄列峰(title中不是阿里集团副总裁,所以职级应该为P10)已于4月30日低调离职。 有消息称他已经加入刚刚进行架构调整的某互联网大厂,担任多模态模型部副总经理,向公司副总裁汇报。 最早爆料该消息的公众号之一“互联网八卦小喇叭”发文表示:据可靠消息称:“薄老师于本月离职通义,即将进入某大厂担任多模态模型负责人”。
5/6/2025 4:03:20 PM

OpenAI转型计划遇阻:继续由非营利实体控制,重组方案被迫调整

当地时间5月5日,人工智能研究公司OpenAI宣布,其转型计划遭遇重大调整,将继续由其非营利性母公司控制,同时推进营利性部门的结构调整,以在激烈的AI竞赛中筹集更多资金并保持领先地位。 去年12月,OpenAI公布了一项重组计划,拟转型为一家公益企业(Public Benefit Corporation,简称PBC),称这将有助于吸引更多投资,并摆脱现行非营利架构带来的限制。 然而,这一计划却遭到了外界的猛烈批评及法律挑战,甚至引发了世界首富埃隆·马斯克的诉讼。
5/6/2025 3:48:25 PM

大模型集体“挂科”!全新中文网页检索测试:GPT-4o准确率仅6.2%

你以为大模型已经能轻松“上网冲浪”了? 新基准测试集BrowseComp-ZH直接打脸主流AI。 BrowseComp-ZH是一项由港科大(广州)、北大、浙大、阿里、字节跳动、NIO等机构联合发布的新基准测试集,让20多个中外主流大模型集体“挂科”:GPT-4o在测试中准确率仅6.2%;多数国产/国际模型准确率跌破10%;即便是目前表现最好的OpenAI DeepResearch,也仅得42.9%。
5/6/2025 3:32:23 PM

AI无师自通,搞定所有家务!π0.5突破泛化极限,UC伯克利系出品

近年来,机器人取得了显著进展,能表演杂技、跳舞、听从指令,甚至完成叠衣服、擦桌子等复杂任务。 但机器人面临的最大挑战并非灵活性,而是泛化能力——在新环境中正确完成任务的能力。 想象一个你家中的清洁机器人:每个家庭布局不同,物品摆放各异,机器人必须在多个层面上实现泛化。
5/6/2025 3:31:55 PM
新智元

陶哲轩:感谢ChatGPT,4小时独立完成了一个开源项目

这个五一假期,世界顶级数学家是如何度过的? 菲尔兹奖得主陶哲轩,似乎是忙着发布自己的开源项目:「我在大模型的协助下编写了一个概念验证软件工具,用于验证涉及任意正参数的给定估计是否成立(在常数因子范围内)。 」项目地址:,陶哲轩开发了一个用于自动(或半自动)证明分析中估计值的框架。
5/6/2025 3:31:17 PM

VDC+VBench双榜第一!强化学习打磨的国产视频大模型,超越Sora、Pika

随着 Deepseek 等强推理模型的成功,强化学习在大语言模型训练中越来越重要,但在视频生成领域缺少探索。 复旦大学等机构将强化学习引入到视频生成领域,经过强化学习优化的视频生成模型,生成效果更加自然流畅,更加合理。 并且分别在 VDC(Video Detailed Captioning)[1] 和 VBench [2] 两大国际权威榜单中斩获第一。
5/6/2025 3:28:14 PM
机器之心

尤雨溪宣布:Vue 生态正式引入 AI!

在前端开发领域,Vue 框架一直以其易用性和灵活性受到广大开发者的喜爱。 而如今,Vue 生态在人工智能(AI)领域的应用上又迈出了重要的一步。 尤雨溪近日宣布,Vue、Vite 和 Rolldown 的文档网站均已添加了llms.txt文件,这一举措旨在让大型语言模型(LLM)更方便地理解这些前端技术。
5/6/2025 1:44:17 PM
小4子

保姆级教程:零代码基础也能微调Qwen3,并本地部署

我将在本文介绍如何通过 unsloth 框架以 LoRA 的方法微调 Qwen3-14B 模型。 图片到目前还有很多小伙伴还不明白什么时候应该微调? 那么请看下图:图片接下来我们再看一下本文使用的 LoRA 微调方法的优势:图片LoRA(Low-Rank Adaptation of Large Language Models,大型语言模型的低秩自适应)是一种流行的轻量级训练技术,可以显著减少可训练参数的数量。
5/6/2025 1:43:31 PM
南七无名式