理论
DeepSeek-R1「内心世界」首次曝光!AI显微镜破解R1大脑,发现神秘推理机制
推理模型的内心世界是怎么想的? 推理模型与普通LLM之间有没有本质的区别? 一直以来,AI内部的运作机理就像个「黑箱子」。
4/21/2025 8:42:00 AM
新智元
LeCun被痛批:你把Meta搞砸了!烧掉千亿算力,自曝折腾20年彻底失败
凭借着GPT/o系列、Gemini 2.5、Claude的强大能力,OpenAI、谷歌、Anthropic纷纷在AI大战中各领风骚。 唯独Meta,没有走在前沿。 Llama 4自发布以来种种拉跨的表现,让Meta在某种程度上沦为了业内的「笑柄」。
4/21/2025 8:40:00 AM
新智元
OpenAI CFO重磅曝料:AGI近在咫尺,全球最强编程智能体已就绪!
OpenAI,正引领生成式AI的革命浪潮。 这家公司如何确立行业领先地位? 又采取了哪些策略保持竞争优势?
4/21/2025 8:35:00 AM
新智元
仅需0.4GB,参数只有0和±1!微软开源首个原生1 bit模型,CPU轻松跑
大模型轻量化终于又有好玩的了。 就在最近,微软亚研院开源了第一款参数量达到20亿,并且还是原生1bit精度的LLM——BitNet b1.58 2B4T。 论文地址:,其实都在模型名字里了:1.
4/21/2025 8:30:00 AM
新智元
马斯克炫酷变身毒液!实测通义Wan2.1首尾帧视频模型,还能“拼接”经典梗图
在GitHub狂揽1w 星标的通义万相Wan2.1,又双叒上新了! 最新打开方式是酱婶儿的:给出开始(首帧)和结束(尾帧)两张图片,Wan2.1便能分分钟生成一段丝滑的5s、720p视频。 根据前后视角的不同,还能自动调整镜头角度,缓慢变成高空俯拍,并同时保证人物光影正确:原来这是阿里通义万相Wan2.1最新开源的首尾帧视频模型,基于Wan2.1文生视频14B大模型,为创作者们提供更高效、更灵活的视频制作方式。
4/21/2025 8:27:00 AM
量子位
纯自回归图像生成模型开源来了,复旦联手字节seed共同捍卫自回归
基于Transformer的自回归架构在语言建模上取得了显著成功,但在图像生成领域,扩散模型凭借强大的生成质量和可控性占据了主导地位。 虽然一些早期工作如Parti、LlamaGen,尝试用更强的视觉tokenizer和Transformer架构来提升自回归生成的效果,但他们论文中的结果表明,只有更多的参数量才能让自回归模型勉强和扩散模型“掰掰手腕”。 这也让越来越多的研究者质疑自回归视觉生成是否是一条可行、值得探索的路径。
4/21/2025 8:20:00 AM
量子位
生成式AI时代下的数据、模型与用户保护全攻略
译者 | 核子可乐审校 | 重楼生成式AI正在重塑企业运营模式,以前所未有的规模实现自动化、内容生成和智能决策。 从AI驱动的聊天机器人到高级代码生成和创意设计,生成式AI正在通过提升效率与创新能力引发行业革命。 然而,伴随技术进步而来的还有企业必须应对的重大安全风险。
4/21/2025 8:19:36 AM
核子可乐
基于ChatGPT用AI实现自然对话
1.概述ChatGPT是当前自然语言处理领域的重要进展之一,通过预训练和微调的方式,ChatGPT可以生成高质量的文本,可应用于多种场景,如智能客服、聊天机器人、语音助手等。 本文将详细介绍ChatGPT的原理、实战演练和流程图,帮助读者更好地理解ChatGPT技术的应用和优势。 2.内容在当今快速发展的人工智能领域,自然语言处理(Natural Language Processing, NLP)技术是研究的重要方向之一。
4/21/2025 8:13:58 AM
打破LLM的语境障碍:InfiniRetri vs RAG
译者 | 晶颜审校 | 重楼大型语言模型(LLM)正在重塑人工智能的格局,然其亦面临一项持续性挑战——检索和利用超出其训练数据的信息。 目前,有两种模式相左的方法可以解决这个问题:其一为InfiniRetri,该方法借助LLM自身的注意力机制,从长输入中检索相关上下文;其二是检索增强生成(RAG),它在生成响应前,动态地从结构化数据库获取外部知识。 每种方法都有其独特的优势、局限性和权衡之处。
4/21/2025 8:11:09 AM
晶颜
半马变翻车现场!宇树科技最新回应:G1开跑即摔倒系未使用原生算法!天工换三次电池夺冠——但也非独立智能!
出品 | 51CTO技术栈(微信号:blog51cto)宇树科技回应了机器人半马“开跑即摔倒”争议! 昨日,北京亦庄科技园举办了一场别开生面的赛事:全球首场人形机器人半程马拉松。 21台机器人被安排在专属跑道上与数千名人类选手同时出发,试图完成21公里的挑战。
4/21/2025 7:41:41 AM
谈谈 RAG 的四个级别
选择正确的 RAG(检索增强生成)架构主要取决于具体的用例和实施要求,确保系统符合任务需求。 Agentic RAG 的重要性将日益增加,与Agentic X的概念相一致,其中代理能力嵌入个人助理和工作流程中。 这里的“X”代表代理系统的无限适应性,能够实现无缝任务自动化和跨不同环境的明智决策,从而提高组织效率和自主性。
4/21/2025 6:25:00 AM
晓晓
企业级RAG选择难题:数据方案的关键博弈
智能时代,企业数据每日剧增。 员工寻找答案的效率直接影响工作流程,StackOverflow调查表明54%的开发者因等待问题答案而工作中断。 信息就在那里,却被深埋在企业资源迷宫中。
4/21/2025 4:50:00 AM
大数据AI智能圈
基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统
在大模型 Agent 发展浪潮下,如何通过模型驱动外部工具调用(Tool Calling)已成为构建智能业务系统的关键能力。 本文将手把手带你通过 Spring AI MCP(Model Context Protocol) DeepSeek-R1-7B 打造一个可落地的企业级智能 Agent。 项目背景与架构设计技术选型Spring AISpring 官方推出的 AI 接入框架,支持 LangChain、MCP、RAG 等能力;MCP(Model Context Protocol)模型与工具之间通信的协议桥梁;DeepSeek-R1-7B国产高性能开源大模型,已支持 Chat Completion、Tool Calling 接口;Ragflow用作 RAG 架构引擎(可选);系统功能用户向模型提问模型判断是否调用工具(如数据库查询)MCP 注册的工具服务完成任务模型生成最终响应环境准备安装依赖复制本地部署 DeepSeek-R1-7B 模型推荐使用 vLLM 启动 DeepSeek-R1-7B 模型服务:复制构建 Spring AI MCP 工具服务示例业务:产品信息查询复制注册 MCP 工具复制模型端配置(Ragflow 示例)在 ragflow.config.yaml 中配置模型地址及 MCP 工具启用:复制前端调用(可选)复制测试效果用户输入:复制输出结果:复制模型会自动触发 query-product 工具,无需用户指定,展示 Agent 工具能力。
4/21/2025 4:22:00 AM
编程疏影
告别SQL!四大技术重构数据查询:Text2SQL/RAG/TAG/MCP谁主沉浮?
想象这样的场景:市场部新来的实习生对咖啡机说:“帮我查华东区过去半年销量TOP3的爆款饮品,按周环比增长率排序。 ”系统秒速生成动态报表——这不再是科幻片桥段,而是自然语言查询技术带来的现实革命。 随着大模型突破性发展,企业数据正从“程序员黑箱”迈向“全员可探”的新纪元。
4/21/2025 4:10:00 AM
推推君
Cursor模型选型终极指南:解锁高效开发新姿势
引言在AI驱动开发的浪潮下,如何选择合适的工具模型成为决定项目成败的关键。 本文将结合MacOS环境下的Cursor 0.48.9实战体验,深度解析四大核心模型(Auto/Claude 3.7/GPT-4O/Gemini 2.5)的选型策略,助您构建高质量开发闭环。 一、智能开发新范式:Cursor的核心优势作为新一代AI开发利器,Cursor通过模型即服务的架构重塑开发流程。
4/21/2025 3:30:00 AM
前端组件开发
网络安全的战略性AI准备:从炒作到现实
构建网络安全中强大的AI就绪框架,基础概念至关重要,这些概念涵盖了企业的技术、数据、安全性、治理和运营流程。 AI就绪的表现AI在网络安全中的潜力在于其能够自动化、预测并增强随着威胁不断演变和复杂化而至关重要的决策能力。 例如,AI模型会处理网络流量模式以检测异常或基于历史数据预测潜在的攻击路径。
4/21/2025 2:00:00 AM
Aditya
十个AI网站生成神器,还没等咖啡凉透,网站就搭好了!
让AI帮你解决麻烦事,你只需专注想法本身,不再为技术抓狂。 我们说实话吧:大部分人其实并不享受从零开始做网站的过程。 要么技术太复杂,要么进度太缓慢,要么就是纯粹头大。
4/21/2025 12:00:00 AM
dev
近40年前「拉马努金图」概率的赌局,被姚班校友黄骄阳等三位数学家用物理方法终结
一切始于一场赌局。 20 世纪 80 年代末,在洛桑的一次会议上,两位数学家 Noga Alon 和 Peter Sarnak 展开了一场友好的辩论。 两人当时都在研究由节点和边组成的集合即图,他们特别想更好地理解一种名为「扩展图」的看似矛盾的图类型,这种图的边相对较少,但仍然高度互连。
4/20/2025 2:39:00 PM
机器之心
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind