理论

DeepMind首个猜想库开源，获陶哲轩力挺！

形式化猜想，再次获陶哲轩认可！最近，谷歌DeepMind正式开源了「形式化猜想」GitHub项目，在业内引发巨大的反响。项目地址：，一直以来对此关注度最高的菲尔兹奖得主陶哲轩，发长文进行了点评。

6/12/2025 2:20:35 PM

逆天！特朗普最新AI计划竟在GitHub泄露！被发现就删库跑路！白宫也要搞ChatGPT？还有一个惊人发现：项目主导者出身特斯拉

出品 | 51CTO技术栈（微信号：blog51cto）许多大模型的“上新消息”往往都不是官宣给出的，而是——不小心从 GitHub 泄露出来的。但这一次，事情比以往都更炸裂：特朗普政府的“AI接管计划”被曝出，就藏在 GitHub 的一个公开仓库里！ 6 月 10 日，有眼尖的开发者在 GitHub 上发现了这个名为“AI.gov”的项目。

6/12/2025 1:32:36 PM

伊风

夸克发布高考志愿大模型，蒸馏数百名人类志愿专家经验

6月12日，夸克发布国内首个为高考志愿填报场景开发的高考志愿大模型，并同步上线“高考深度搜索”、“志愿报告”、“智能选志愿”三大核心功能。该模型具备专家级决策能力，能够为每位考生提供精准、个性化的志愿填报服务。让每位考生都有自己的AI志愿顾问高考志愿大模型驱动的夸克“志愿报告”以Agent方式运行，目前已开放试用。

6/12/2025 1:03:13 PM

每秒生成超30帧视频，支持实时交互！自回归视频生成新框架刷新生成效率

在A100上用310M模型，实现每秒超30帧自回归视频生成，同时画面还保持高质量！视频生成现在都快这个程度了？最近，来自微软研究院的团队与北大联合发布新框架——Next-Frame Diffusion (NFD)。

6/12/2025 11:57:56 AM

最大的开源GraphRag：知识图谱完全自主构建｜港科大＆华为

知识图谱（KGs）已经可以很好地将海量的复杂信息整理成结构化的、机器可读的知识，但目前的构建方法仍需要由领域专家预先创建模式，这限制了KGs的可扩展性、适应性和领域覆盖范围。为此，香港科技大学KnowComp实验室联合香港华为理论部提出了AutoSchemaKG：一个无需预定义模式、用于完全自主知识图谱构建的框架。该系统利用大型语言模型，可以直接从文本中同时提取知识三元组并归纳出全面的模式，对实体和事件进行建模，同时采用概念化方法将实例组织成语义类别。

6/12/2025 11:56:30 AM

超实用！手把手教你Dify版本升级

很多情况下，我们需要升级 Dify 版本以获得新的功能和性能的提升，同时还能确保系统的安全性、稳定性和兼容性，从而更好地满足用户的需求。那问题来了，怎么升级 Dify 版本呢？接下来，我们以 Docker 方式安装 Dify 的升级为例，给大家演示一下升级的流程和注意事项，当然源码安装的升级方式也是类似的，升级思路都相同的，只是具体的操作可能略有不同。

6/12/2025 10:27:02 AM

磊哥

免费GPU算力部署DeepSeek-R1 32B

前言DeepSeek-R1发布最新版本DeepSeek-R1-0528，显著提升了模型的思维深度与推理能力，在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩，并且在整体表现上已接近其他国际顶尖模型，如 o3 与 Gemini-2.5-Pro。另外，API接口还增加了Function Calling和JsonOutput 的支持。 DeepSeek-R1团队已经证明，大模型的推理模式可以蒸馏到小模型中，与通过强化学习在小模型上发现的推理模式相比，性能更优。

6/12/2025 9:48:27 AM

刚刚，LeCun亲自出镜，Meta推出新世界模型！

最近，Meta 大动作不断。前些天有外媒曝出马克・扎克伯格正在组建一个名为「超级智能团队」的专家团队，以实现通用人工智能。随后开出 9 位数的薪酬为该团队吸纳人才。

6/12/2025 9:37:30 AM

机器之心

杨立昆亲自指导开源世界大模型，为AI Agent打造超级大脑

今天凌晨，全球社交巨头Meta在官网开源了一个世界大模型V-JEPA 2。与第一代相比，V-JEPA 2使用了100万视频 100万图片超大规模训练数据集，可以让AI Agent像人类那样理解真实的物理世界，为智能体打造一个“超级大脑”自主学会观察、规划到执行全自动化能力。值得一提的是，图灵奖获得者、Meta首席科学家杨立昆（Yann LeCun）参与了该模型的开发，这在Meta开源的众多大模型中很罕见。

6/12/2025 9:12:00 AM

o3绞尽脑汁仅答对40%的题目，开源模型基本乱猜？MMSI-Bench：多图空间智能试金石

AI能看图，也能讲故事，但能理解“物体在哪”“怎么动”吗？空间智能，正是大模型走向具身智能的关键拼图。面对1000道多图推理题，开源大模型集体失守——准确率不到30%，甚至不如瞎猜！

6/12/2025 9:05:00 AM

全球首个历史基准！普林复旦打造AI历史助手，AI破圈人文学科

历史是关于时间中的人的科学。 ——马克·布洛赫人工智能已在诸多自然科学领域成为有力的研究助手，然而面对承载着文化意涵与历史记忆的人文学科，却仍旧表现得捉襟见肘。究其原因，AI当前最缺乏的并非工具性能力，而是对人类智慧与文化的理解能力——这正是人文学科探究的核心。

6/12/2025 9:03:00 AM

谷歌流量急坠归0？核心员工被「自愿离职」，30年搜索帝国崩塌

搜索，真的要完了吗？谷歌搜索的流量终结比预期来得更快！令人始料未及！

6/12/2025 9:00:00 AM

端到端GUI智能体首次实现“犯错-反思-修正”闭环，模拟人类认知全过程

端到端多模态GUI智能体有了“自我反思”能力！南洋理工大学MMLab团队提出框架GUI-Reflection。随着多模态大模型的发展，端到端GUI智能体在手机、电脑等设备上的自动化任务中展示出巨大潜力。

6/12/2025 8:58:00 AM

MSRA清北推出强化预训练！取代传统自监督，14B模型媲美32B

“预测下一个token”——这个支撑LLM的核心训练机制，正在被强化学习颠覆。微软亚洲研究院（MSRA）联合清华大学、北京大学提出全新预训练范式RPT（强化预训练），首次将强化学习深度融入预训练阶段，让模型在预测每个token前都能先“动脑推理”，并根据推理正确性获得奖励。传统预训练依赖海量文本进行自监督学习，模型通过简单预测下一个token建立语言能力，作者将之比喻为一块蛋糕胚，而RL只是作为上面点缀的一颗樱桃。

6/12/2025 8:46:00 AM

简易实用项目攻略：如何创建集文档问答、摘要、转录、翻译与提取于一身的AI门户

译者 | 核子可乐审校 | 重楼如今AI虽已全面普及，但多数职场人士仍难以统一运用各类互不相关的工具：一会需要使用聊天机器人、一会需要将文本复制到摘要器内，再加上会议转录和翻译，将本应顺畅的工作流程拆分得零散琐碎。所以问题来了：为什么不能把各项AI功能集中起来？为此我决定构建单一Web门户，供用户随时上传文档、提问、获取摘要、转录会议内容、翻译文件，甚至从PDF中提取表格等。

6/12/2025 8:24:57 AM

核子可乐

保护由AI代理创建的软件：下一个安全范式

译者 | 晶颜审校 | 重楼代理式人工智能（Agentic AI）具备自主编写与部署代码的能力，由此衍生出新的安全风险，因而需要人工监督与强有力的保障机制。自2022年底ChatGPT及生成式人工智能（GenAI）成为主流以来，其影响力的持续攀升对软件开发行业产生了直接影响。生成式人工智能工具编写可执行代码的能力被视作显著优势之一，且此后人工智能一直在持续迭代优化。

6/12/2025 8:15:24 AM

晶颜

RPA的未来与智能体紧密相关

RPA正加速走向一个十字路口，IT领导者和专家们对该技术的未来展开了越来越多的辩论。一些IT领导者认为，更强大、更自主的智能体最终将取代这项已有二十年历史的AI前体技术，而另一些人则预测，智能体和RPA将携手合作，实现更高水平的自动化。 RPA仍在制造业、医疗保健和金融等多个行业广泛使用，随着企业开始部署智能体和其他下一代AI工具，未来几年RPA可能会被重新审视，但如果供应商和IT领导者能够通过连接RPA和智能体来创造新的业务流程自动化方式，这项技术可能不会走向末路。

6/12/2025 8:08:00 AM

Grant Gross

三家银行利用AI实现盈利增长的实战经验

银行业迅速认识到了GenAI的商业潜力，同时也意识到盲目采用可能带来的风险，该行业最大的机构擅长管理风险，在将试点项目推向生产环境时采取了谨慎而坚定的态度。跟踪北美、欧洲和亚洲50家最大银行的Evident Insights公司表示，过去一年里，GenAI的采用势头有所增强，该公司情报部门副总裁Colin Gilbert周二在行业分析师公司举办的虚拟圆桌会议上表示，截至上周，这50家银行共宣布了266个AI应用案例，高于2月份的167个。 “绝大多数，即约75%的应用案例仍然是面向内部或员工的，”他说，并补充道，GenAI和传统预测性AI应用案例的分布大致为五五开。

6/12/2025 7:10:00 AM

Matt Ashare

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词）

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 马斯克英伟达 Anthropic 图像 AI创作训练 LLM 论文代码算法 AI for Science 苹果 Agent 腾讯 Claude 芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型 Sora 研究百度生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind AI模型亚马逊特斯拉场景深度学习架构 Transformer MCP Copilot 编程视觉