理论
RAG 中的语义分块:实现更优的上下文检索
检索增强生成(RAG)技术异军突起,席卷了整个大语言模型领域。 通过将大语言模型(LLMs)的强大能力与外部知识检索相结合,RAG使得模型能够生成准确且有依据的回复,即便在专业领域也不例外。 在每一个表现卓越的RAG流程背后,都有一个默默发挥关键作用的 “英雄”:分块技术,尤其是语义分块。
5/7/2025 8:35:11 AM
大模型之路
SmallRye大模型简介:使用Langchain4J轻松向应用内引入AI服务
译者 | 核子可乐审校 | 重楼Langchain4J解决了哪些问题? Langchain4J 本质上是为 Java 开发者打造的工具箱,旨在简化向高级语言中集成 AI 功能(如聊天机器人或文本生成器)的过程,同时屏蔽底层复杂细节。 想象一下:我们想要构建一个能回答问题、生成内容或模拟人类对话的智能应用。
5/7/2025 8:14:58 AM
核子可乐
当人工智能脱离人类监督:自维持系统的网络安全风险
译者 | 晶颜审校 | 重楼人工智能正从执行预定义指令的工具,进化为具备自我修改、参数重写及实时反馈进化能力的复杂系统。 这种被称为“自创生”的自维持特性,使其能动态适应环境以提升效率,但也带来不可预测性。 对网络安全团队而言,传统安全模型基于“威胁来自外部”的假设——即恶意行为者利用稳定系统漏洞实施攻击。
5/7/2025 8:07:09 AM
晶颜
100个Python机器学习小技巧,让你速通ML
构建机器学习模型是数据科学的关键环节,涉及运用算法进行数据预测或挖掘数据中的模式。 本文分享一系列简洁的代码片段,涵盖机器学习过程的各个阶段,从数据准备、模型选择,到模型评估和超参数调优。 这些代码示例能帮助你使用诸如Scikit-Learn、XGBoost、CatBoost、LightGBM等库,完成常见的机器学习任务,还包含使用Hyperopt进行超参数优化、利用SHAP值进行模型解释等高级技术。
5/7/2025 7:17:18 AM
学研君
比人类更有说服力,AI被滥用成舆论操控隐形推手?
近年来,人工智能(AI)技术飞速发展,给人类社会带来诸多便利。 特别是大模型的飞速发展,对医疗、教育、交通等诸多领域带来了深刻变革。 然而,如同硬币的两面,AI在给人类社会带来诸多便利的同时,其滥用现象也逐渐浮出水面。
5/7/2025 6:00:00 AM
Yu
2025年的CIO现状:CIO制定AI议程
如今,随着对AI的关注,Tractor . Supply公司再次凭借其在AI领域的早期投资占据了领先地位,这些投资包括用于销售和商品预测以及优化商品补货的AI技术。 最近,Tractor .
5/7/2025 5:00:00 AM
Beth Stackpole
IT领导者如何将自主式AI用于业务工作流程
自主式AI是AI演进的新前沿,已成为当今企业讨论的核心话题。 自主式AI在Forrester的2024年趋势榜单中名列前茅,Salesforce预计到2026财年末将有10亿个自主式AI投入使用。 尽管“自主式AI”这一术语应用较为宽泛,但它通常指的是赋予智能体更多自主权,以优化任务并串联起日益复杂的行动。
5/7/2025 4:00:00 AM
Bill Doerrfeld
Java 开发者必看!用 Quarkus + LangChain4j 实现本地 Ollama 的 AI 深度集成
在探索AI与现代技术栈融合的道路上,搭建一个能在本地高效运行的智能交互应用是个不错的实践方向。 本文介绍如何构建 Quarkus 应用程序。 该程序会设置 REST 端点,借助 LangChain4j 调用本地 Ollama 模型,用户调用端点发问题,即可获取模型响应。
5/7/2025 1:01:00 AM
学研妹
从看见到理解,多模态大模型如何重塑行为检测
在人工智能技术快速迭代的今天,行为检测作为计算机视觉领域的重要分支,正迎来一场由多模态大模型引领的技术革命。 作为曾在CV算法公司工作的从业者,我深刻体会到传统计算机视觉方法在实际落地中的诸多痛点。 过去几年,许多行为检测、烟火检测等应用,往往因为高昂的训练成本和难以接受的误报率而被甲方叫停。
5/7/2025 1:00:00 AM
贝塔街的万事屋
三分钟快速入门大模型数据工程
向自然语言处理的大模型应用,数据工程的核心任务是构建一套高效、可扩展、可控的数据流程,从源头到可用于模型训练、推理的高质量文本语料,全链路打通。 数据工程的整体目标构建稳定的数据流转链路,从原始文本数据 → 清洗/标注/审核后的语料 → 符合模型输入格式的数据集保证数据可用性、完整性、质量、结构统一性支持多阶段使用场景:训练/微调、推理RAG、评估测试等数据来源最常见的形式是甲方提供,如客户工单、业务知识库、客服聊天记录、FAQ 等。 需尽早明确数据格式、内容范围、隐私边界。
5/7/2025 12:10:00 AM
贝塔街的万事屋
通义实验室又一位大佬出走!传应用视觉团队负责人薄列峰已离职,将任职另一大厂多模态模型负责人!
出品 | 51CTO技术栈(微信号:blog51cto)北京时间5月6日,据知情人士透露,阿里巴巴通义实验室应用视觉团队负责人薄列峰(title中不是阿里集团副总裁,所以职级应该为P10)已于4月30日低调离职。 有消息称他已经加入刚刚进行架构调整的某互联网大厂,担任多模态模型部副总经理,向公司副总裁汇报。 最早爆料该消息的公众号之一“互联网八卦小喇叭”发文表示:据可靠消息称:“薄老师于本月离职通义,即将进入某大厂担任多模态模型负责人”。
5/6/2025 4:03:20 PM
OpenAI转型计划遇阻:继续由非营利实体控制,重组方案被迫调整
当地时间5月5日,人工智能研究公司OpenAI宣布,其转型计划遭遇重大调整,将继续由其非营利性母公司控制,同时推进营利性部门的结构调整,以在激烈的AI竞赛中筹集更多资金并保持领先地位。 去年12月,OpenAI公布了一项重组计划,拟转型为一家公益企业(Public Benefit Corporation,简称PBC),称这将有助于吸引更多投资,并摆脱现行非营利架构带来的限制。 然而,这一计划却遭到了外界的猛烈批评及法律挑战,甚至引发了世界首富埃隆·马斯克的诉讼。
5/6/2025 3:48:25 PM
大模型集体“挂科”!全新中文网页检索测试:GPT-4o准确率仅6.2%
你以为大模型已经能轻松“上网冲浪”了? 新基准测试集BrowseComp-ZH直接打脸主流AI。 BrowseComp-ZH是一项由港科大(广州)、北大、浙大、阿里、字节跳动、NIO等机构联合发布的新基准测试集,让20多个中外主流大模型集体“挂科”:GPT-4o在测试中准确率仅6.2%;多数国产/国际模型准确率跌破10%;即便是目前表现最好的OpenAI DeepResearch,也仅得42.9%。
5/6/2025 3:32:23 PM
AI无师自通,搞定所有家务!π0.5突破泛化极限,UC伯克利系出品
近年来,机器人取得了显著进展,能表演杂技、跳舞、听从指令,甚至完成叠衣服、擦桌子等复杂任务。 但机器人面临的最大挑战并非灵活性,而是泛化能力——在新环境中正确完成任务的能力。 想象一个你家中的清洁机器人:每个家庭布局不同,物品摆放各异,机器人必须在多个层面上实现泛化。
5/6/2025 3:31:55 PM
新智元
陶哲轩:感谢ChatGPT,4小时独立完成了一个开源项目
这个五一假期,世界顶级数学家是如何度过的? 菲尔兹奖得主陶哲轩,似乎是忙着发布自己的开源项目:「我在大模型的协助下编写了一个概念验证软件工具,用于验证涉及任意正参数的给定估计是否成立(在常数因子范围内)。 」项目地址:,陶哲轩开发了一个用于自动(或半自动)证明分析中估计值的框架。
5/6/2025 3:31:17 PM
VDC+VBench双榜第一!强化学习打磨的国产视频大模型,超越Sora、Pika
随着 Deepseek 等强推理模型的成功,强化学习在大语言模型训练中越来越重要,但在视频生成领域缺少探索。 复旦大学等机构将强化学习引入到视频生成领域,经过强化学习优化的视频生成模型,生成效果更加自然流畅,更加合理。 并且分别在 VDC(Video Detailed Captioning)[1] 和 VBench [2] 两大国际权威榜单中斩获第一。
5/6/2025 3:28:14 PM
机器之心
尤雨溪宣布:Vue 生态正式引入 AI!
在前端开发领域,Vue 框架一直以其易用性和灵活性受到广大开发者的喜爱。 而如今,Vue 生态在人工智能(AI)领域的应用上又迈出了重要的一步。 尤雨溪近日宣布,Vue、Vite 和 Rolldown 的文档网站均已添加了llms.txt文件,这一举措旨在让大型语言模型(LLM)更方便地理解这些前端技术。
5/6/2025 1:44:17 PM
小4子
保姆级教程:零代码基础也能微调Qwen3,并本地部署
我将在本文介绍如何通过 unsloth 框架以 LoRA 的方法微调 Qwen3-14B 模型。 图片到目前还有很多小伙伴还不明白什么时候应该微调? 那么请看下图:图片接下来我们再看一下本文使用的 LoRA 微调方法的优势:图片LoRA(Low-Rank Adaptation of Large Language Models,大型语言模型的低秩自适应)是一种流行的轻量级训练技术,可以显著减少可训练参数的数量。
5/6/2025 1:43:31 PM
南七无名式
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
AI新词
图像
Gemini
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
工具
计算
Sora
GPU
华为
大语言模型
RAG
具身智能
AI设计
字节跳动
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
编程
神器推荐
DeepMind
亚马逊
特斯拉
AI模型