理论

AI写代码新姿势：一个截图，代替千行代码

现在写代码，最fashion的“姿势”应该是什么？答案或许就是：截图。没错，就像这样，先随便找个网页，截取想要的那部分界面，然后“喂”给AI，并附上一句Prompt：参考这个页面，生成一个类似的HTML页面。

2/24/2025 8:20:00 AM 量子位

解决 NLP 任务的 Transformer 为什么可以应用于计算机视觉？

几乎所有的自然语言处理任务，从语言建模和masked词预测到翻译和问答，在2017年Transformer架构首次亮相后都经历了革命性的变化。 Transformer在计算机视觉任务中也表现出色，只用了2-3年的时间。在这篇文章中，我们探索了两种基础架构，它们使Transformer能够闯入计算机视觉的世界。

2/24/2025 8:20:00 AM 二旺

谷歌Fellow级大佬出走！17年老将吴永辉加盟字节，亲自操刀大模型研发

谷歌17年老将，正式加入字节跳动。据报道，吴永辉博士已确认离职谷歌，加盟字节负责AI基础研究领域的工作。他将在字节担任大模型团队Seed基础研究负责人，专注于大模型基础研究搜索、AI for Science科研工作，直接向CEO梁汝波汇报。

2/24/2025 8:15:00 AM 新智元

忘掉 DeepSeek：Qwen 2.5 VL 与 Qwen Max 来了

Qwen 系列又推出了两款令人瞩目的新模型：Qwen 2.5 VL 和 Qwen 2.5 Max。如果还停留在“DeepSeek 是最强”那一档，就可能要重新考虑一下，因为这两款模型的实力相当惊艳。什么是 Qwen 2.5 VL？

2/24/2025 8:10:00 AM de

使用共享神经网络扩展机器学习模型

译者 | 崔皓审校 | 重楼随着机器学习模型的复杂性和规模不断增长，任何企业或者组织在部署、扩展模型上都面临着巨大的挑战。迫在眉睫的挑战是如何在内存限制与模型规模之间取得平衡，并保持高性能和成本效益。本文探讨了一种创新的架构解决方案，通过将共享神经编码器与专门的预测头结合的混合方法来应对这些挑战。

2/24/2025 8:00:00 AM 崔皓

AI+C#落地指南：用SemanticKernel+本地模型开发智能应用

在人工智能快速发展的当下，将AI技术与传统编程语言相结合，成为了推动创新应用的重要途径。 C#作为一种广泛应用于企业级开发的编程语言，与微软的AI生态整合，尤其是借助SemanticKernel和本地模型，为开发者打开了全新的智能应用开发大门。本文将深入探讨如何利用这些工具实现AI C#的落地，并通过开源项目示例，让你快速上手。

2/24/2025 2:00:00 AM conan

2025最新版DeepSeek保姆级安装教程：本地部署+避坑指南

本文旨在提供一个全面且详细的DeepSeek本地部署指南，帮助大家在自己的设备上成功运行DeepSeek模型。无论你是AI领域的初学者还是经验丰富的开发者，都能通过本文的指导，轻松完成DeepSeek的本地部署。一、本地部署的适用场景DeepSeek本地部署适合以下场景：高性能硬件配置：如果你的电脑配置较高，特别是拥有独立显卡和足够的存储空间，那么本地部署将能充分利用这些硬件资源。

2/24/2025 12:00:09 AM

DeepSeek R-1 能否解答这五道“刁钻”AI 问题？

每当有新的语言模型公开发布时，我总会忍不住拿它来做一些看似简单、实则暗藏难点的小测试。我把这当作给模型做“压力测试”，用来检验它们在逻辑推理上到底行不行。 DeepSeek R-1 刚发布不久，就因为它是开源、且推理能力强大而备受关注。

2/24/2025 12:00:00 AM dev

慢思考助力医学大语言模型突破数据瓶颈：上海交大联合上海AI Lab推出MedS3系统

编辑 | ScienceAIOpenAI o1、DeepSeek R1 等模型成功实现了在数学、编程等领域的智能慢思考推理，通过自我反思和修正实现了运行时的性能外推。然而，在医疗领域，仍然很少有模型可以实现具有长链慢思考的推理。目前医疗领域的推理模型大多是通过在医疗考试题上对 OpenAI 系列的模型进行蒸馏，并没有考虑推理过程的可验证性，以及医疗任务的覆盖度。

2/21/2025 4:04:00 PM ScienceAI

清华大学AIR联合水木分子开源DeepSeek版多模态生物医药大模型BioMedGPT-R1

编辑 | ScienceAI2025 年初，DeepSeek给全球引发了 AI 大模型的新一轮热议。多家市场咨询公司指出，在 DeepSeek 的影响下，从大模型供应商到基础设施和平台供应商的整个 AI 产业生态都掀起了一波「新浪潮」。 DeepSeek R1 以其强大的推理能力，为各行各业带来了智能化升级新机遇。

2/21/2025 4:03:00 PM ScienceAI

从概念到应用，清华团队开发DeepTFBU工具包助力基因表达精准调控

编辑 | 萝卜皮增强子通过与转录因子 (TF) 相互作用，在各种生物过程中充当基因表达的关键调节器。虽然转录因子结合位点 (TFBS) 被广泛认为是 TF 结合和增强子活性的关键决定因素，但其周围背景序列的重要作用仍有待定量表征。清华大学的研究团队提出了转录因子结合单元（transcription factor binding unit，TFBU）概念，通过使用深度学习模型量化 TFBS 周围上下文序列的影响，模块化地建模增强子。

2/21/2025 4:01:00 PM ScienceAI

无需联网！DeepSeek-R1+本地化RAG，打造私有智能文档助手

1、写在前面官方开源的版本除了满血的 671b 外，还有 1.5b，7b，8b，14b，32b，70b 六个蒸馏后的尺寸，笔者使用 Ollama 在电脑本地部署了 7b 的模型，在终端中测试了虽然回答没有满血版的那么惊艳，但凑活能用。作为一款高阶模型开源，确实要 salute 一下。不过进一步的问题是，我们面对这样的强思维链模型，除了在官网间或 Chat 一下，如何进一步的将其变成工作或生活场景的生产力工具？

2/21/2025 3:56:42 PM 韦东东

刚刚，DeepSeek官宣：下周将是重磅开源周！网友：真正的OpenAI来了！

DeepSeek在X上发布推文，为即将到来的开源周预热。下周起，DeepSeek将连续开源5个代码库！ DeepSeek的通知翻译如下：我们是一个小团队@deepseek_ai ，正在探索 AGI。

2/21/2025 3:18:20 PM

抛弃OpenAI后，Figure AI发布新一代人形机器人Helix模型

当地时间2月20日，机器人初创公司Figure AI宣布发布其最新成果——Helix模型。这是一款用于通用人形机器人控制的视觉-语言-动作（VLA）模型，标志着人形机器人技术的重大突破。 Helix模型的关键技术突破.

2/21/2025 2:53:40 PM

Gartner预测到2027年，跨境GenAI滥用引起的AI数据泄露比例将达到40%

Gartner预测，到2027年，跨境生成式人工智能（GenAI）引起的AI相关数据泄露比例将超过40%。 GenAI在终端用户中的普及速度已超过了数据治理和安全措施的发展速度，而支持这些技术所需的集中算力引发了对数据本地化的担忧。 Gartner研究副总裁Joerg .

2/21/2025 2:50:19 PM

DeepSeek开源模型重塑法证审计，个人本地做RAG+微调，25年多试试

全球82亿人口，网民55.6亿，而ChatGPT坐拥3.5亿全球月活，渗透率算下来也有6%左右了。但这还是DeepSeek-R1开源之前的故事。 1/20 开源以来，DeepSeek-R1属实又硬拉高了一大波全球 AI的渗透率，或者换句话说，是解锁了更多的应用场景。

2/21/2025 2:37:21 PM 韦东东

用户破4亿、企业客户翻倍！OpenAI的GPT-5将推进全球AI战争进入白热化阶段！

用户突破4亿、企业客户翻倍、GPT-5即将上线——OpenAI用数据与野心宣告：全球AI战争进入白热化阶段!据首席运营官布拉德·莱特卡普周四在X平台上的帖子称，OpenAI的ChatGPT周活跃用户已突破4亿大关，这一里程碑彰显了该公司在消费者和企业市场日益扩大的影响力。在OpenAI面临来自埃隆·马斯克的xAI和DeepSeek等竞争对手日益加剧的竞争之际，ChatGPT实现了快速扩张。这两家公司最近都推出了旨在打破OpenAI主导地位的高性能模型。

2/21/2025 2:23:17 PM Michael Nuñez

老旧业务系统会如何限制企业AI进展？

当全球企业争相押注AI革命，一场隐秘的“数据饥荒”正悄然蔓延——IDC数据显示，企业12.8%的IT预算被技术债务吞噬，而遗留系统如同生锈的数据管道，既挤占AI弹药库，又掐断创新血液。 IT专家表示，过时的软件应用程序正在成为许多企业采用AI的障碍，其中数据保留能力有限是主要原因之一。托管服务提供商Ensono的首席战略官布赖恩·克林格贝尔(Brian Klingbeil)表示，由于当时存储成本高昂，数十年前设计的应用程序只能保留有限的数据量，因此这些应用程序也不太可能轻易与AI工具集成。

2/21/2025 2:18:52 PM Grant Gross

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉