资讯列表

分类

标签

大语言模型（LLM）是如何思考的？讲讲推动下一代人工智能推理的五种途径

译者 | 张哲刚审校 | 重楼大语言模型（LLMs）最早时期只是具备自动完成的功能，迄今为止，进步巨大，与当初已经不可同日而语。然而，仅仅是生成流畅的文本并不足以体现真正的智能——真正的智能是需要推理能力的。这意味着，大语言模型需要能够解决数学问题、能够调试代码、能够得出合乎逻辑的结论，还要能够检查和改正自身的错误。

4/8/2025 8:18:38 AM

张哲刚

如何对AI应用实施安全管控（带示例）

作者 | 陈峻审校 | 重楼今年初，随着DeepSeek惊艳全球，各个企业和组织都敏锐地察觉到了人工智能（AI）技术为其赋能的机遇。虽然居多IT专业人员都认为各项数字化服务都值得用AI进行提速提效，但是相对于All in AI的狂热，信息安全技术人员有必要在保持冷静的同时，积极筹备，尽快制定出针对那些涉及AI应用的安全性管控措施。下面，我将以自己在企业中的项目经验，依次从网络、系统、应用、模型、数据、以及合规，六个层面和你讨论一些具体、可落地的安全检查要点。

4/8/2025 8:10:03 AM

陈峻

初级开发者过度依赖 AI 的风险

当ChatGPT等工具出现故障时，软件开发人员离开工位、临时休息或沮丧地靠在椅背上的场景并不罕见。对许多技术从业者而言，AI辅助编码工具已成为日常便利。即便是像2025年3月24日那样的短暂中断，也可能导致开发工作停滞。

4/8/2025 8:05:00 AM

AI小蜜蜂

消息称谷歌付钱让部分 AI 员工赋闲一年，以防其投奔竞争对手

谷歌旗下DeepMind为防止AI人才流失，对英国员工实施竞业禁止协议：离职后一年内不得为对手工作但照发薪水。有研究员称被变相“边缘化”，微软AI高管曝员工求助无门。#AI人才争夺战##谷歌DeepMind#

4/8/2025 8:00:10 AM

远洋

全能且实用！实战测评谷歌最新模型Gemini 2.5 Pro

自从春节期间的 deepseek 出圈后，各家大模型就开始疯狂内卷，真应了那句话，AI 一天，人间一年。尤其是到了近一个月，AI 圈更是打的火热，各大 AI 大厂都在玩命更新，那在这些更新里到底哪个更好用呢？不知道大家能不能清楚，反正我是有点分不清，所以这个假期花了几天时间，实验对比了一圈，最终发现谷歌最新的模型 Gemini 2.5 Pro 成了最好用的。

4/8/2025 7:52:09 AM

彩云Sky

谷歌向 Pixel 9 /三星 Galaxy S25 推出 Gemini Live AI“实时拍摄”及识图导购助手功能

谷歌Gemini Live AI推出实时拍摄和识图导购功能，支持Pixel 9和Galaxy S25，可识别物体并比价购物。#谷歌AI##智能手机#

4/8/2025 7:36:23 AM

漾仔

AI在供应链中的潜力

在当今动态且不断发展的商业环境中，AI已成为一股关键力量，有望通过提高效率、敏捷性和决策能力来推动各行业变革。各行各业的CEO正在认识到AI的潜力，尽管许多人预见到，为了在AI主导的世界中蓬勃发展，需要对当前运营进行调整。在供应链领域，这种矛盾体现得尤为明显，AI的潜力在很大程度上尚未得到开发，根据Gartner的调查，只有17%的供应链组织表示已成功大规模部署了AI。

4/8/2025 5:00:00 AM

Noha Tohamy

模态编码器 | 超强开源CLIP模型OpenCLIP

来自LAION、UC伯克利、HuggingFace等的工作，这篇工作的研究动机也很简单，CLIP 模型在多模态领域展现出了巨大潜力，但原始 CLIP 模型未完全开源，限制了其更广泛的应用和深入研究。 OpenCLIP 旨在通过开源的方式，让更多开发者能够无门槛地利用这一先进模型，推动多模态技术在各个领域的应用和发展。模型架构和原始CLIP无异，下面简单介绍这篇工作中的一些研究规律和实验结果。

4/8/2025 4:20:00 AM

Goldma

AI问答的核心！知识图谱：突破传统 RAG 的天花板

看似简单的 AI 问答系统，背后却隐藏着无数技术难题。当我们询问"组件 A 与组件 B 有什么区别"这样的问题时，传统检索增强生成(RAG)系统往往会犯难。它们就像只会做加法的计算器，遇到了需要乘除法的复杂方程...传统 RAG 的三大痛点传统 RAG 技术已成为 AI 应用的标配，但它面临三个根本性挑战：信息孤岛：文档被切分成互不相关的小块，丢失了上下文联系视野局限：只能基于文本相似度检索，无法理解概念间的逻辑关系推理能力缺失：无法像人类那样进行跨文档的综合分析例如，你问系统："A组件和B组件有什么区别？

4/8/2025 3:45:00 AM

大数据AI智能圈

Llama 4发布36小时差评如潮！匿名员工爆料拒绝署名技术报告

Meta最新基础模型Llama 4发布36小时后，评论区居然是这个画风：失望，非常失望不知道他们后训练怎么搞的，总之不太行在[各种测试]2中失败……还被做成表情包调侃，总结起来就是一个“差评如潮”。具体来看，大家的抱怨主要集中在代码能力。最直观的要数经典“氛围编程”小球反弹测试，小球直接穿过墙壁掉下去了。

4/8/2025 3:44:00 AM

大模型部署工具 Ollama 使用指南：技巧与问题解决全攻略

一、Ollama 是什么？ Ollama 是一个开源的本地大模型部署工具，旨在简化大型语言模型（LLM）的运行和管理。通过简单命令，用户可以在消费级设备上快速启动和运行开源模型（如 Llama、DeepSeek 等），无需复杂配置。

4/8/2025 3:22:00 AM

wayn

模态编码器 | 最强CLIP模型EVA-CLIP-18B

来自智源王鑫龙团队的工作，将EVA-CLIP模型参数扩展至18B，简单看下结果，EVA-CLIP-18B性能远超其他模型。项目地址：。首先，随着大型语言模型(LLMs)参数量的增长至千亿级别，与其配套的视觉基础模型却未能同步扩展，这种不对等限制了多模态应用的整体效能。

4/8/2025 3:00:00 AM

Goldma

Meta LLaMA 4：对抗 GPT-4o 与 Claude 的开源王牌

2025 年 4 月，Meta 正式发布了 LLaMA 4 系列的首批两款模型。这两款模型模型分别是：LLaMA 4 Scout 与 LLaMA 4 Maverick，均采用了专家混合架构（Mixture-of-Experts, MoE）。据 Meta 表示，这是首次有 LLaMA 模型实现文字与图像的统一处理能力，具备真正意义上的多模态理解。

4/8/2025 2:26:00 AM

LLM幻觉，竟因知识「以大欺小」！华人团队祭出对数线性定律与CoDA策略

大语言模型（LLMs）已经彻底改变了AI，但「幻觉」问题如影随从，堪称LLM癌症。 LLM会一本正经、义正辞严的捏造事实，「脸不红，心不跳」地说谎。「幻觉」被普遍认为与训练数据相关。

4/8/2025 2:22:00 AM

新智元

比DeepSeek更惊艳，生成式决策如何让机器人拥有创造力？

当传统机器人遇见生成式AI，会擦出什么样的火花？技术的演进从不停滞。如今，我们正处在具身智能发展的关键节点，生成式决策技术正悄然改变着这个领域的游戏规则。

4/8/2025 2:00:00 AM

大数据AI智能圈

改变世界的十大算法

在当今这个数字化时代，算法已经成为推动世界运转的核心力量。它们如同隐藏在幕后的魔术师，用精密的逻辑和数学原理塑造了现代生活的方方面面。从我们每天使用的智能手机，到支撑全球金融体系的复杂网络，算法无处不在。

4/8/2025 1:11:00 AM

大道至简

五年复合增长率达35.2%！2028年中国AI总投资规模将超千亿美元

IDC发布的《全球人工智能和生成式人工智能支出指南》(IDC Worldwide AI and Generative AI Spending Guide)显示，2024年全球人工智能（AI） IT总投资规模为3158亿美元，预计2028年增至8159亿美元，五年复合增长率为32.9%。其中，生成式AI市场五年复合增长率或达63.8%，到2028年其市场规模将达2842亿美元，占AI市场投资总规模的35%。聚焦中国，IDC数据显示，中国将继续引领亚太地区人工智能市场发展，占亚太地区人工智能总支出超五成。

4/8/2025 1:00:00 AM

谷歌研究：合成数据使大模型数学推理能力提升八倍

最近，来自谷歌、卡内基梅隆大学和 MultiOn 的联合研究团队发表了一项关于合成数据在大型模型训练中应用的新研究。据专注于人工智能发展的研究机构 Epoch AI 报告显示，目前全球约有 300 万亿个公开可用的高质量文本训练标记。然而，随着类似 ChatGPT 这样的大模型的迅猛发展，对训练数据的需求呈指数级增长，预计到 2026 年之前，这些数据将被耗尽。

4/8/2025 12:40:00 AM

远洋

资讯热榜

Cursor宣布免费向学生开放一年Pro会员，助力AI编程教育大BUG！非学生用户竟能白嫖谷歌顶级AI全家桶白嫖攻略速看保姆级教程：零代码基础也能微调Qwen3，并本地部署英伟达全新开源自动语音识别模型 Parakeet-TDT-0.6B-V2，语音转录能力再提升应对网络威胁利器！Cisco与Meta推出Foundation-sec-8B LLM Excel MCP Server上线可通过Claude等客户端直接操作Excel文件 Figma重磅升级：发布五大新功能，Figma Sites支持一键发布网站字节跳动开源深度研究框架DeerFlow

标签云

人工智能 OpenAI AI AIGC ChatGPT AI绘画 DeepSeek 模型机器人数据谷歌大模型 Midjourney 智能用户开源学习微软 GPT Meta 图像 AI创作技术 Gemini 论文马斯克 Stable Diffusion 算法芯片代码蛋白质生成式英伟达腾讯神经网络研究 Anthropic 计算 3D 开发者 Sora AI设计机器学习 AI for Science GPU AI视频苹果场景华为人形机器人百度预测伟达搜索 Claude Transformer 深度学习 xAI 大语言模型字节跳动模态训练具身智能驾驶神器推荐文本 LLaMA Copilot 视觉算力应用安全智能体视频生成干货合集亚马逊大型语言模型 API 科技 AGI