理论
阿里Qwen3问鼎开源王座!8款模型全面开放,最大杯全方位超越R1/o1,网友:让开源再次伟大
千呼万唤,Qwen3终于来了! 一口气上新8大模型,通通开源。 旗舰模型Qwen3-235B-A22B全方位超越R1、o1、o3-mini,最大杯稠密模型也以32B参数量达到了可观水平。
4/29/2025 8:56:36 AM
苹果挥刀自救,肢解AI团队!神秘硬件或成救命稻草
曾被寄予厚望的苹果AI,似乎已被这个飞速迭代的时代淘汰了。 Siri,作为曾经的语音助手先驱,光环逐渐暗淡。 苹果AI的努力在谷歌OpenAI等巨头夹击之下,又显得力不从心。
4/29/2025 8:55:00 AM
新智元
RAG性能暴增20%!清华等推出“以笔记为中心”的深度检索增强生成框架,复杂问答效果飙升
在当前大语言模型(LLMs)广泛应用于问答、对话等任务的背景下,如何更有效地结合外部知识、提升模型对复杂问题的理解与解答能力,成为 RAG(Retrieval-Augmented Generation)方向的核心挑战。 来自清华大学、中国科学院大学、华南理工大学、东北大学、九星(AI9Stars)的联合研究团队提出了一项全新的适应式RAG方法——DeepNote。 它首次引入“笔记(Note)”作为知识载体,实现更深入、更稳定的知识探索与整合,在所有任务上均优于主流RAG方法,相较于基础RAG性能提升高达 20.1%。
4/29/2025 8:54:53 AM
100年企业知识超10万文件,「内网版ChatGPT」血洗最卷行业!全员70%和AI共事
要说什么行业是地球上「最卷」的,咨询行业说第一,恐怕没有哪个行业敢称第二。 在这个全球最精英、最高压的竞技场里,卷时间、卷精力、卷智力,现在要卷AI了! ChatGPT已经无法满足世界上最「卷」的这批人了。
4/29/2025 8:40:00 AM
新智元
Adaptive-RAG:让检索增强生成更智能
在人工智能领域,检索增强生成(Retrieval-Augmented Generation,RAG)一直是研究热点。 它通过结合检索和生成技术,为问答系统带来了更强大的性能。 然而,现有的RAG方法并非完美无缺。
4/29/2025 8:20:51 AM
Goldma
LLMs 防御升级:借函数调用机制打造无缝防御层
大语言模型(LLMs)展现出了令人惊叹的能力,其中函数调用功能更是让其如虎添翼。 然而,这一强大功能也伴随着风险,恶意用户可能利用巧妙设计的提示进行隐秘操纵。 本文将深入探讨如何将函数调用机制转化为一道无缝的防御层,有效检测和防范这些潜在威胁。
4/29/2025 8:18:48 AM
大模型之路
MCP安全噩梦终结者:Agent框架如何重构AI防护新范式?
译者 | 朱先忠审校 | 重楼引言目前,Anthropic公司推出的多代理上下文协议(MCP)备受业界关注。 MCP通常被称为“AI代理的USB-C”,它承诺将标准化代理之间的通信方式。 这个想法很简单:通过一个通用接口连接不同的AI代理和工具,让它们共享内存,并跨任务重用功能。
4/29/2025 8:15:41 AM
朱先忠
深夜突袭,阿里Qwen3登顶全球开源王座!暴击DeepSeek-R1,2小时狂揽17k星
就在今天凌晨,备受全球期待的阿里新一代通义千问模型Qwen3开源! 一经问世,它立刻登顶全球最强开源模型王座。 它的参数量仅为DeepSeek-R1的1/3,但成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型。
4/29/2025 8:14:14 AM
新智元
浅析小语言模型在增强RAG系统中的作用
译者 | 布加迪审校 | 重楼小语言模型(SLM)是大语言模型(LLM)的紧凑版。 它们包含的参数通常少于大语言模型:大约30亿个参数或更少。 这使得它们相对轻量级,推理时间更快。
4/29/2025 8:09:39 AM
布加迪
三招教你私有化部署 DeepSeek
在数字化转型的进程中,企业不仅需要高效、智能的工具来提升运营效率,还需确保数据安全与满足隐私保护要求。 DeepSeek 私有化部署正是为解决这一需求而生的,它通过将 DeepSeek 智能助手从公共云端迁移至企业内部服务器,为企业提供了一种安全、可控且高度定制化的解决方案。 这种部署方 式不仅能够满足企业对敏感数据的保护需求,还能根据具体业务场景进行灵活 调整,从而为企业数字化转型提供强有力的支持。
4/29/2025 8:04:10 AM
基于 Rowboat 快速构建多智能体(Multi-Agent)工作流
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的多智能体工作流。 在 AI 驱动的自动化浪潮中,多智能体(Multi-Agent)系统正成为企业实现高效协作和智能化转型的关键。 然而,构建一个多智能体工作流往往需要复杂的开发流程和高昂的成本,让许多团队望而却步。
4/29/2025 8:00:00 AM
Luga Lee
刚刚,Qwen3强势登顶,成开源新王!国内首个混合推理模型,235B击败R1、o1!源神火力全开:全系列8个模型一口气开源!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)源神 Qwen3 赶在五一假期前重磅上线! 这次 Qwen3 直接放出了一整个“全家桶” ——总共 8 个模型,包括 2 个 MoE(稀疏专家)模型和 6 个稠密模型,规模从 0.6B 到 235B 不等,阵容堪称豪华。 图片其中,旗舰模型 Qwen3-235B-A22B 强势登顶,成为新一代开源之王!
4/29/2025 7:39:45 AM
伊风
边缘AI:它适合你的业务吗?
边缘AI通过将AI直接引入IT设备和系统,有望大幅减少延迟并加快响应时间。 如果你还没听说过边缘AI,那么你很快就会了解到的。 听从其众多支持者的说法,这项技术即将简化AI的处理流程。
4/29/2025 7:07:00 AM
John Edwards
AI内部部署的隐患:治理缺口与灾难性风险
当OpenAI在两年多前发布当时更先进的语言模型GPT-4时,许多研究人员抱怨缺乏关于该模型是如何创建的信息。 尽管名字中有“开放”一词,但该公司却将所有事情都保密,以免其尖端研究被竞争对手或恶意行为者利用。 虽然这些担忧是可以理解的,但这也意味着人们几乎无法监督该公司在实验室中的所作所为,以及为防止其最新模型通过滥用或“失控”并以可能伤害人类的方式追求其目标而造成危害而采取的保障措施。
4/29/2025 7:00:00 AM
Federico Guerrini
“大模型失联”的凌晨,我靠这四个配置救了全组!LangChain4j API 进阶指南
1.引言大家好,我是小米,一个31岁、依然热爱编码的程序员大哥哥~今天给大家分享一个我最近在项目里踩坑无数、最后“高光时刻”拯救全组的进阶配置经验——LangChain4j 的 API 进阶配置四大件:日志、监控、重试、超时。 你以为 LangChain4j 就只是个 Java 包装器? 配置对了,它能稳定、健壮、可观测,能用得安心、跑得漂亮!
4/29/2025 3:40:00 AM
软件求生
MCP融合Spring AI,Java程序员大模型技术再上一层楼
在当下的技术发展浪潮中,大语言模型(LLMs)正深度渗透至企业应用开发领域,持续改写着该领域的格局。 开发者积极将其融入现代解决方案。 然而,快速发展背后,大语言模型通信和上下文处理缺乏标准化协议的问题日益凸显。
4/29/2025 12:01:55 AM
学研妹
LangChain4j+SpringAI=无敌!
知识不是简单的拼接,而是深入理解之后的灵活运用。 当下挑战在当前形势下,对于 Java 程序员有两个挑战:工作中的挑战:目前各个业务系统要进行 AI 化功能升级,例如添加智能客服系统、ChatBI 看板功能、领域相关 AI 工具,帮助用户提效等,但传统的 Java 开发技术,已无法支撑如今项目的 AI 改造和升级。 找工作时的挑战:大家都知道这两年编程行业的薪资很高,所以 Java 从业者也越来越多,当供给远远大于需求时就导致现在薪资越来越低,以及找工作难度越来越大。
4/29/2025 12:00:00 AM
磊哥
图像编辑开源新SOTA,来自多模态卷王阶跃!大模型行业正步入「多模态时间」
全球AI大模型智能涌现,现在正在进入“多模态时间”。 一方面,全球业内各式各样的技术进展,都围绕多模态如火如荼展开。 另一方面,AI应用和落地的需求中,多模态也是最重要的能力。
4/28/2025 2:13:43 PM
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
Gemini
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
DeepMind
特斯拉