资讯列表

分类

标签

MIT工科生跨界AI，独作论文登Nature：只需3.5小时修复600年前名画

MIT理工男跨界艺术，一不小心就以一篇独作论文登上Nature？由他设计的AI算法，将原本需要数月/数年才能搞定的名画修复工作，极限压缩至几小时。 Alex Kachkine，打破画作修复只能对原作数字扫描品进行“缝缝补补”的传统艺能，提出一种“以数字方式修复一幅画，并在物理上实现效果”的全新方法。

6/17/2025 8:50:00 AM

SFT+RL双管齐下：ReasonGen-R1如何破解文生图「指令不遵」难题？

近年来，链式推理和强化学习已经被广泛应用于大语言模型，让大语言模型的推理能力得到了显著提升。然而，在图像生成模型中，这种成功经验尚未得到充分探索。图像生成模型往往直接依据给定文本生成图像，缺乏类似人类创作过程中的推理，导致生成的图像在语义遵循上仍有一定局限。

6/17/2025 8:47:00 AM

4B Qwen3逆袭671B DeepSeek！字节DAPO微调方法这么猛的吗

6/17/2025 8:45:00 AM

OpenAI o3 pro vs Gemini 2.5 pro：得分相差不大，更推荐使用Gemini 2.5 Pro

译者 | 李睿审校 | 重楼本文对OpenAI的o3-pro与谷歌的Gemini 2.5 Pro在图像分析、逻辑推理和数字推理上的表现进行了比较。 o3-pro在推理和工具使用上有所增强，但Gemini 2.5 Pro在逻辑和数学推理上更准确可靠。 Gemini 2.5 Pro在复杂任务中表现更佳，提供经过验证的准确响应，适合对准确性要求高的任务，而o3-pro虽然快速但存在关键错误。

6/17/2025 8:40:44 AM 李睿

关于AI区块链的一切：哪些是真，哪些是假？

译者 | 核子可乐审校 | 重楼人工智能（AI）正在推动创新，并彻底颠覆人们的工作方式。然而，AI的普及以及人们对这项技术的日益依赖，也引发人们对其底层基础设施的中心化趋势、以及相关风险的质疑。加密货币让我们意识到去中心化的重要性，特别是将计算资源及数据集集中于少数设施所带来的风险。

6/17/2025 8:28:45 AM 核子可乐

国内首个人形机器人全产业链专业展 6 月 20 日在杭州召开，特斯拉、宇树参展

国内首个人形机器人全产业链专业展6月20日-22日在杭州召开，特斯拉、宇树等300家企业参展，展示仿生驱动、具身智能等前沿技术。#人形机器人##AI技术#

6/17/2025 8:14:00 AM 浩渺

谷歌被曝用 ChatGPT 训练 Gemini，Scale AI 否认

有文件显示谷歌承包商或用 ChatGPT 训练改进 Bard（现谷歌 Gemini），Scale AI 否认。同时，Meta 拟 143 亿美元部分收购 Scale AI，谷歌不满或终止合作。#谷歌 #Gemini #ChatGPT

6/17/2025 8:11:50 AM 远洋

为 Apple Intelligence 入华铺路？阿里巴巴发布适配苹果 MLX 架构的 Qwen3 升级版

阿里巴巴推出Qwen3升级版，兼容苹果MLX架构，苹果智能中国上线指日可待。该模型支持119种语言，性能优于前代。iOS 18.6或向中国用户提供苹果智能预览。#AI技术##苹果智能#

6/17/2025 7:53:02 AM 远洋

C#与AI联姻：零依赖！用Keras.NET训练深度学习模型实录

在C#中实现深度学习通常需要依赖复杂的框架，但通过Keras.NET，我们可以在零外部依赖的情况下训练强大的深度学习模型。下面我将分享一个完整的实战案例，展示如何用C#和Keras.NET训练一个图像分类模型。这个实现具有以下特点：零外部依赖：仅使用Keras.NET和Numpy.NET库，无需安装Python或其他深度学习框架完整的训练流程：包括模型构建、数据加载、训练、评估和保存卷积神经网络：使用现代CNN架构进行图像分类模型检查点：自动保存验证集表现最佳的模型灵活的配置：可调整图像尺寸、批次大小和训练轮数要运行此代码，你需要安装以下NuGet包：Keras.NETNumpy.NETSciSharp.TensorFlow.Redist在实际应用中，你需要替换LoadData方法中的模拟数据加载逻辑，使用真实的图像数据。

6/17/2025 7:28:51 AM CONAN

为何AI系统在规模化部署前必须植入审计追踪机制

AI服务编排框架为企业提供了多种功能，它们不仅规定了应用程序或智能体如何协同工作，还使管理员能够管理工作流程和智能体，并审计其系统。随着企业开始扩大其AI服务的规模并将其投入生产，构建一个可管理、可追踪、可审计且健壮的流程管道能够确保其智能体按预期运行。如果没有这些控制措施，企业可能无法意识到其AI系统中正在发生什么，可能只有在出现问题或未能遵守法规时才发现问题，而那时可能为时已晚。

6/17/2025 7:11:00 AM Emilia

系统集成商在投标方案中使用AI时的六大安全防护策略

GenAI正在迅速改变系统集成商与企业之间的互动方式，特别是在这些供应商回应提案请求(RFP)的过程中。随着越来越多的系统集成商利用AI来起草和优化他们的回应，企业必须重新考虑如何评估这些回应，并确保供应商的责任感。在此，我们将探讨这一微妙的平衡，并讨论AI取证能力的重要性、加强合同条款以保护你的企业，以及AI素养培训如何帮助你在面对AI驱动的系统集成商提案时保持控制。

6/17/2025 7:00:00 AM Ted Rogers

彻底解决Docker镜像无法下载

前言Docker是一个开源容器化平台，它的核心作用是通过容器技术将应用程序及其依赖环境打包成一个轻量级、可移植的单元，从而简化开发、部署和运维流程。例如我们可以通过Docker轻松部署Dify社区版，帮助开发者和企业快速构建、部署及管理生成式AI应用。由于众所周知的限制，国内开发者访问Docker Hub面临诸多不便，且多个国内镜像源陆续出现了无法使用的情况。

6/17/2025 6:40:45 AM AI大模型应用开发

智能体协作的力量：Anthropic 的「Research」多智能体实践

大家好，我是肆〇柒。在 AI 领域，多智能体系统正逐渐成为解决复杂任务的关键技术之一。昨天，我看到一篇出自 Anthropic 官网 Engineering 板块的博文，主要分享了Anthropic 在 Research 这个功能对于多智能体的工程实践。

6/17/2025 6:28:08 AM 肆零柒

迈向人工智能的认识论：如何推理对齐和改变他们的思维

要理解 LLM 的行为方式，回顾一下其架构基础知识会很有帮助：Transformer。 Vaswani等人提出的 Transformer 从根本上建立在自注意力层之上。每一层都允许模型在输入以及之前生成的输出token 之间动态地重新分配注意力，这意味着它可以在每一步检索它认为相关的任何信息。

6/17/2025 6:21:13 AM 晓晓

DouBao large model evolves again! Global leading AI Agent applications accelerate落地!

Recently, the DouBao large language model has welcomed its brand new version 1.6, marking another leap in its comprehensive capabilities. In core areas such as reasoning, mathematics, and instruction-following, DouBao 1.6 has achieved significant performance improvements while greatly reducing the barriers for user adoption, driving the rapid application of AI Agents in industries such as consumer electronics, automobiles, and finance.According to the latest released data, DouBao 1.6 has ranked among the global leaders in complex reasoning, competitive-level mathematics, multi-turn dialogue, and instruction-following tests. For instance, in the evaluation based on Beijing Haidian District's simulated college entrance exam papers, DouBao 1.6 improved the science score by 154 points and the liberal arts score by 90 points compared to last year.

6/17/2025 6:01:36 AM AI在线

视频版AI换衣框架MagicTryOn，基于Wan2.1视频模型

在现代时尚产业中，视频虚拟试穿（Video Virtual Try-On， VVT）逐渐成为了用户体验的重要组成部分。这项技术旨在通过模拟服装在视频中与人体动作的自然互动，展现出服装在动态变化中的真实效果。然而，目前的 VVT 方法仍然面临着空间时间一致性和服装内容保留等多重挑战。

6/17/2025 3:01:36 AM AI在线

工业异常检测新突破，复旦等多模态融合监测入选CVPR 2025

多模态融合检测，工业异常检测领域新突破！复旦大学、荣旗工业科技、腾讯优图实验室上海交通大学、上海海洋大学等机构联合发布高精度多模态数据集Real-IAD D³，并基于此数据集提出了一种创新的多模态融合检测方法。相关成果已被计算机视觉顶会CVPR 2025收录。

6/17/2025 2:25:00 AM

Xiaomi Announces New Product Release Tide in Late July: First True AI Glasses Officially Unveiled, Targeting Meta Ray-Ban

The press conference held by Xiaomi in late July will be the focus of attention for technology enthusiasts. In addition to the highly anticipated Xiaomi car, Xiaomi will also bring several重磅 new products, including the powerful Redmi K80 Ultimate Edition and the upgraded functions of the Mi Pad 7S Pro.However, the most awaited one is the first public appearance of Xiaomi's first true AI glasses. According to well-known blogger Digital Chat Station, the market positioning of this AI glasses will be aligned with Meta Ray-Ban, which is currently the best-selling AI glasses product globally.Prior leaks have indicated that as Xiaomi's pioneering work in this field, this true AI smart glasses will adopt an advanced dual-core architecture and come with a high-definition lens, expected to achieve shooting effects comparable to those of Meta Ray-Ban.

6/17/2025 2:02:32 AM AI在线

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉