理论

自动驾驶行业现状，端到端大模型，训练，数据合成方法

自动驾驶行业现状，端到端大模型，训练，数据合成方法

自动驾驶行业现状1、当前行业主要玩家有第一梯队有：华为，momenta，元戎第二梯队有：鉴智, 绝影智能等2、主机厂现在都要求自动驾驶厂商白盒交付，本质上就是前两年依赖供应商，后面打算自己做。整个行业基本上是赔本赚吆喝的阶段。没有收入，每年还要自己投入几个亿进行模型的训练，人才等。

4/7/2025 3:00:00 AM 朱洁

GPT-4.5创造力比GPT-4o弱！浙大上海AI Lab发布新基准，寻找多模态创造力天花板

GPT-4.5创造力比GPT-4o弱！浙大上海AI Lab发布新基准，寻找多模态创造力天花板

近来风头正盛的GPT-4.5，不仅在日常问答中展现出惊人的上下文连贯性，在设计、咨询等需要高度创造力的任务中也大放异彩。当GPT-4.5在创意写作、教育咨询、设计提案等任务中展现出惊人的连贯性与创造力时，一个关键问题浮出水面：多模态大模型（MLLMs）的“创造力天花板”究竟在哪里？写一篇基于图片的短篇小说、分析一张复杂的教学课件、甚至设计一份用户界面……这些对于人类驾轻就熟的任务，对于现有的部分多模态大模型却往往是“高难动作”。

4/7/2025 2:33:00 AM

基于 DeepSeek GRPO 的 1.5B Rust 代码生成模型训练实战

基于 DeepSeek GRPO 的 1.5B Rust 代码生成模型训练实战

群组相对策略优化（Group Relative Policy Optimization，GRPO）已被证明是一种有效的算法，可用于训练大语言模型（LLMs），使其具备推理能力并在基准测试中持续提升性能表现。 DeepSeek-R1 展示了如何通过监督式微调（Supervised Fine-Tuning）与 GRPO 技术的结合，引导模型达到与 OpenAI 的 o1 等顶尖模型相竞争的水平。为了进一步探索其实践应用，我们尝试将这些技术应用于现实场景中。

4/7/2025 2:25:00 AM

智能体|基于ReAct框架：构建极简智能体实践的探索

智能体|基于ReAct框架：构建极简智能体实践的探索

基于ReAct的方式，手动制作了一个最小的Agent结构（其实更多的是调用工具）。完整代码可以参考：：ReAct: Synergizing Reasoning and Acting in Language Models1、Step 1: 构造大模型首先我们需要一个大模型，这里我使用智谱的glm-4。 glm-4是基于Decoder-Only的通用对话大模型，可以使用API_key来调用模型。

4/7/2025 2:00:00 AM

人工智能催生“零知识”威胁行为者

人工智能催生“零知识”威胁行为者

人工智能是一把双刃剑。一方面，人工智能帮助人们更好更快地完成工作；另一方面，它也使心怀恶意的人成为诈骗者、黑客分子和网络罪犯。零知识威胁行为者的崛起网络犯罪业务利润丰厚；然而，传统上，只有拥有先进技术技能的人才能从事这一行业。

4/7/2025 1:45:00 AM 何威风

物联网人工智能关键技术和技巧

物联网人工智能关键技术和技巧

人工智能在实现物联网功能方面发挥着至关重要的作用。让我们探索推动人工智能和物联网融合、赋能智能和自主系统的关键技术和技巧。使用人工智能分析物联网数据的机器学习算法机器学习构成了物联网人工智能的基础，使设备能够学习模式、做出预测并适应不断变化的环境。

4/7/2025 1:30:00 AM chris han

PandasAI：当数据分析遇上自然语言处理

PandasAI：当数据分析遇上自然语言处理

数据科学的新范式在数据爆炸的时代，传统的数据分析工具正面临着前所未有的挑战。数据科学家们常常需要花费70%的时间在数据清洗和探索上，而真正的价值创造时间却被大幅压缩。 PandasAI的出现，正在改变这一现状——它将生成式AI的强大能力注入到经典的Pandas生态中，创造了一种全新的对话式数据分析体验。

4/7/2025 1:25:00 AM 云朵君

DeepSeek AI时代下，数字化转型的本质：拼的不是技术了，是人

DeepSeek AI时代下，数字化转型的本质：拼的不是技术了，是人

你见过多少数字化转型的尝试，最终变成了买软件、堆硬件的采购工程？又有多少企业花了大价钱引入先进系统，却发现员工仍在用Excel表格手动录入数据？数字化转型已成为每个企业的必修课，但成功率却惊人地低。

4/7/2025 1:00:00 AM 大数据AI智能圈

DeepSeek再好，还得先进行数据清洗！

DeepSeek再好，还得先进行数据清洗！

数据分析师的日常，有大半时间都在和数据"搏斗"。每当接到一份数据，第一反应往往是叹气： "这数据质量...又得清洗半天。 " 数据清洗就像是数据分析的"地基工程"，地基不牢，上层再漂亮也会坍塌。

4/7/2025 12:30:00 AM

C#搞AI？用ML.NET实现ChatGPT本地化部署！代码全开源

C#搞AI？用ML.NET实现ChatGPT本地化部署！代码全开源

在人工智能蓬勃发展的当下，ChatGPT这类大型语言模型吸引了全球目光。它强大的自然语言处理能力，能实现智能对话、文本生成等多种功能。但在实际应用中，出于数据安全、网络限制等因素考量，将ChatGPT本地化部署成为众多开发者的迫切需求。

4/7/2025 12:22:00 AM conan

OpenAI 的新 GPT-4o 图像生成技术绝对会改变游戏规则

OpenAI 的新 GPT-4o 图像生成技术绝对会改变游戏规则

GPT-4o 的图像生成功能刚刚发布就直接开始摧毁传统行业，甚至让 OpenAI 的 CEO 山姆·奥特曼（Sam Altman）都直呼：“我也看不懂眼前发生的一切！ ”图片传统的设计软件，比如 Photoshop，现在可真是如临大敌了。一、图像融合的能力彻底超越传统工具来看一个让人震惊的图像融合实例：图片传统的 Photoshop 顶多就是简单地将人物图层叠加到背景图上，对光影和角度的细节通常还要手动调整。

4/7/2025 12:00:00 AM dev

多模态模型结构与训练总结

多模态模型结构与训练总结

01、模型结构一般的多模态模型架构包含5个部分，分别是：模态编码器、输入映射器、大模型骨干、输出映射器以及模态生成器。模态编码器（Modality Encoder, ME）将多种模态输入编码成特征表示，公式如下X表示模态，表示各种预训练好的编码器。目前模态主要分为：视觉模态、语音模态、3D点云模态，其中视觉模态主要包括图像和视频，对于视频，视频通常被均匀采样成5帧图像，然后进行与图像相同的预处理。

4/7/2025 12:00:00 AM Goldma

三思而后行，让大模型推理更强的秘密是「THINK TWICE」？

三思而后行，让大模型推理更强的秘密是「THINK TWICE」？

近年来，大语言模型（LLM）的性能提升逐渐从训练时规模扩展转向推理阶段的优化，这一趋势催生了「测试时扩展（test-time scaling）」的研究热潮。 OpenAI 的 o1 系列与 DeepSeek 的 R1 模型已展示出显著的推理能力提升。然而，在实现高性能的同时，复杂的训练策略、冗长的提示工程和对外部评分系统的依赖仍是现实挑战。

4/5/2025 5:10:00 PM 机器之心

刚刚，DeepSeek公布推理时Scaling新论文，R2要来了？

刚刚，DeepSeek公布推理时Scaling新论文，R2要来了？

这会是 DeepSeek R2 的雏形吗？本周五，DeepSeek 提交到 arXiv 上的最新论文正在 AI 社区逐渐升温。当前，强化学习（RL）已广泛应用于大语言模型（LLM）的后期训练。

4/4/2025 1:56:00 PM 机器之心

思维链不可靠：Anthropic曝出大模型「诚信」问题，说一套做一套

思维链不可靠：Anthropic曝出大模型「诚信」问题，说一套做一套

机器之心报道，编辑：蛋酱。

4/4/2025 1:50:00 PM 机器之心

250多篇论文，上海AI Lab综述推理大模型高效思考

250多篇论文，上海AI Lab综述推理大模型高效思考

最近，像 OpenAI o1/o3、DeepSeek-R1 这样的大型推理模型（Large Reasoning Models，LRMs）通过加长「思考链」（Chain-of-Thought，CoT）在推理任务上表现惊艳。但随之而来的是一个日益严重的问题：它们太能「说」了！生成的推理过程往往充斥着冗余信息（比如反复定义）、对简单问题过度分析，以及对难题的探索浅尝辄止。

4/4/2025 1:47:00 PM 机器之心

多榜单登顶！华为 & 哈工深团队提出 AdaReTaKe，突破长视频理解极限

多榜单登顶！华为 & 哈工深团队提出 AdaReTaKe，突破长视频理解极限

第一作者为哈尔滨工业大学（深圳）博士生王霄和华为大模型研究员佀庆一，该工作完成于王霄在华为实习期间。王霄的研究方向为多模态视频理解和生成，佀庆一的研究方向为多模态理解、LLM post-training和高效推理。随着视频内容的重要性日益提升，如何处理理解长视频成为多模态大模型面临的关键挑战。

4/4/2025 1:39:00 PM 机器之心

Claude 3.5首战复现21%顶会论文，人类博士无法取代！OpenAI：AI全是草台班子

Claude 3.5首战复现21%顶会论文，人类博士无法取代！OpenAI：AI全是草台班子

AI智能体，能否复现顶会中重磅的AI研究？今天，OpenAI团队发布了全新框架PaperBench，便可评估AI智能体复现顶尖研究的基础能力。论文地址：，AI智能体需从0开始复现20篇ICML 2024 Spotlight和Oral论文，包括理解论文核心文献、开发可运行代码库，以及执行实验并验证结果。

4/4/2025 12:00:00 AM 新智元

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉