AI在线 AI在线

理论

OpenAI o3 pro vs Gemini 2.5 pro:得分相差不大,更推荐使用Gemini 2.5 Pro

译者 | 李睿审校 | 重楼本文对OpenAI的o3-pro与谷歌的Gemini 2.5 Pro在图像分析、逻辑推理和数字推理上的表现进行了比较。 o3-pro在推理和工具使用上有所增强,但Gemini 2.5 Pro在逻辑和数学推理上更准确可靠。 Gemini 2.5 Pro在复杂任务中表现更佳,提供经过验证的准确响应,适合对准确性要求高的任务,而o3-pro虽然快速但存在关键错误。
6/17/2025 8:40:44 AM
李睿

关于AI区块链的一切:哪些是真,哪些是假?

译者 | 核子可乐审校 | 重楼人工智能(AI)正在推动创新,并彻底颠覆人们的工作方式。 然而,AI的普及以及人们对这项技术的日益依赖,也引发人们对其底层基础设施的中心化趋势、以及相关风险的质疑。 加密货币让我们意识到去中心化的重要性,特别是将计算资源及数据集集中于少数设施所带来的风险。
6/17/2025 8:28:45 AM
核子可乐

C#与AI联姻:零依赖!用Keras.NET训练深度学习模型实录

在C#中实现深度学习通常需要依赖复杂的框架,但通过Keras.NET,我们可以在零外部依赖的情况下训练强大的深度学习模型。 下面我将分享一个完整的实战案例,展示如何用C#和Keras.NET训练一个图像分类模型。 这个实现具有以下特点:零外部依赖:仅使用Keras.NET和Numpy.NET库,无需安装Python或其他深度学习框架完整的训练流程:包括模型构建、数据加载、训练、评估和保存卷积神经网络:使用现代CNN架构进行图像分类模型检查点:自动保存验证集表现最佳的模型灵活的配置:可调整图像尺寸、批次大小和训练轮数要运行此代码,你需要安装以下NuGet包:Keras.NETNumpy.NETSciSharp.TensorFlow.Redist在实际应用中,你需要替换LoadData方法中的模拟数据加载逻辑,使用真实的图像数据。
6/17/2025 7:28:51 AM
CONAN

为何AI系统在规模化部署前必须植入审计追踪机制

AI服务编排框架为企业提供了多种功能,它们不仅规定了应用程序或智能体如何协同工作,还使管理员能够管理工作流程和智能体,并审计其系统。 随着企业开始扩大其AI服务的规模并将其投入生产,构建一个可管理、可追踪、可审计且健壮的流程管道能够确保其智能体按预期运行。 如果没有这些控制措施,企业可能无法意识到其AI系统中正在发生什么,可能只有在出现问题或未能遵守法规时才发现问题,而那时可能为时已晚。
6/17/2025 7:11:00 AM
Emilia

系统集成商在投标方案中使用AI时的六大安全防护策略

GenAI正在迅速改变系统集成商与企业之间的互动方式,特别是在这些供应商回应提案请求(RFP)的过程中。 随着越来越多的系统集成商利用AI来起草和优化他们的回应,企业必须重新考虑如何评估这些回应,并确保供应商的责任感。 在此,我们将探讨这一微妙的平衡,并讨论AI取证能力的重要性、加强合同条款以保护你的企业,以及AI素养培训如何帮助你在面对AI驱动的系统集成商提案时保持控制。
6/17/2025 7:00:00 AM
Ted Rogers

彻底解决Docker镜像无法下载

前言Docker是一个开源容器化平台,它的核心作用是通过容器技术将应用程序及其依赖环境打包成一个轻量级、可移植的单元,从而简化开发、部署和运维流程。 例如我们可以通过Docker轻松部署Dify社区版,帮助开发者和企业快速构建、部署及管理生成式AI应用。 由于众所周知的限制,国内开发者访问Docker Hub面临诸多不便,且多个国内镜像源陆续出现了无法使用的情况。
6/17/2025 6:40:45 AM
AI大模型应用开发

智能体协作的力量:Anthropic 的「Research」多智能体实践

大家好,我是肆〇柒。 在 AI 领域,多智能体系统正逐渐成为解决复杂任务的关键技术之一。 昨天,我看到一篇出自 Anthropic 官网 Engineering 板块的博文,主要分享了Anthropic 在 Research 这个功能对于多智能体的工程实践。
6/17/2025 6:28:08 AM
肆零柒

迈向人工智能的认识论:如何推理对齐和改变他们的思维

要理解 LLM 的行为方式,回顾一下其架构基础知识会很有帮助:Transformer。 Vaswani等人提出的 Transformer 从根本上建立在自注意力层之上。 每一层都允许模型在输入以及之前生成的输出token 之间动态地重新分配注意力,这意味着它可以在每一步检索它认为相关的任何信息。
6/17/2025 6:21:13 AM
晓晓

工业异常检测新突破,复旦等多模态融合监测入选CVPR 2025

多模态融合检测,工业异常检测领域新突破! 复旦大学、荣旗工业科技、腾讯优图实验室 上海交通大学、上海海洋大学等机构联合发布高精度多模态数据集Real-IAD D³,并基于此数据集提出了一种创新的多模态融合检测方法。 相关成果已被计算机视觉顶会CVPR 2025收录。
6/17/2025 2:25:00 AM

基于Dify构建客服智能体全流程实战,揭秘提升RAG效果关键

前言Dify是一款开源的大语言模型应用开发平台,旨在降低AI应用的开发门槛,帮助开发者和企业快速构建、部署及管理生成式AI应用。 Dify的知识库功能将RAG管线上的各环节可视化,提供了一套简单易用的用户界面来方便应用构建者管理个人或者团队的知识库,并能够快速集成至 AI 应用中。 为了达到最好的RAG检索效果,需要选择正确的分段设置。
6/17/2025 1:00:00 AM
AI大模型应用开发

Devin联合创始人:别搞多智能体系统!微软和OpenAI鼓吹的代理构建理念大错特错!上下文工程将成新标准,员工:老板停止泄密

编辑 | 云昭OpenAI 和 微软正在宣传一些错误的 Agent 理念! OpenAI 的 Swarm 走的是一条“歧路”! 刚刚过去的周末,Devin 联合创始人 Walden Yan 发布了的帖子语出惊人,引起了业界的关注和讨论。
6/16/2025 6:03:36 PM
云昭

ACL 2025|为什么你设计的 Prompt 会成功?新理论揭示大模型 Prompt 设计的奥秘与效能

本文共同一作是张翔和曹峻泰。 张翔是英属哥伦比亚大学研究生,主要研究兴趣集中在大模型推理和 AI for Science;曹峻泰是英属哥伦比亚大学研究生,主要研究兴趣集中在大模型推理和可解释性研究;本文通讯作者是来自纽约大学石溪分校的助理教授尤晨羽,以及来自 Meta Gen AI 的研究员丁渡鉴。 近年来,大型语言模型(LLM)在自然语言处理领域取得了革命性进展。
6/16/2025 2:44:14 PM

Muon作者仅用一篇博客,就被OpenAI看中了

「许多博士(包括过去的我)都陷入了这样一个误区:认为只有在顶级会议上发表论文才是终极目标。 」AI 云服务商 Hyperbolic CEO Yuchen Jin 如是说。 但现在,发表论文并不与学术影响力直接画等号了。
6/16/2025 2:43:38 PM

20瓦就能运行下一代AI?科学家瞄上了神经形态计算

「西部世界」真的要来了! 科学家们正试图为AI装上人类大脑。 最新进展由美国国家实验室主导。
6/16/2025 2:42:12 PM

10% KV Cache实现无损数学推理!这个开源方法解决推理大模型「记忆过载」难题

推理大模型虽好,但一个简单的算数问题能推理整整三页,还都是重复的“废话”,找不到重点……一种可以把大模型的“碎碎念”转化为可控记忆条目的高效压缩方法,出现了! R-KV开源登场:显存↓90%、吞吐×6.6、准确率=100%。 它可以通过实时对token进行排序,兼顾重要性和非冗余性,仅保留信息丰富且多样化的token,从而解决大模型推理时的冗余问题。
6/16/2025 2:41:07 PM

网页智能体新突破!引入协同进化世界模型,腾讯AI Lab提出新框架

让网页智能体自演进突破性能天花板! 腾讯AI Lab提出WebEvolver框架,通过引入协同进化的世界模型(World Model),让智能体在真实网页环境中实现10%的性能提升。 由此突破现有基于大语言模型(LLM)的网页智能体“自我迭代演进的性能最终会停滞”的瓶颈。
6/16/2025 2:40:40 PM

如何选择最佳多模态大模型压缩方案?哈工大、度小满开源EFFIVLM-BENCH基准测试框架

在金融科技智能化转型进程中,大语言模型以及多模态大模型(LVLM)正成为核心技术驱动力。 尽管 LVLM 展现出卓越的跨模态认知能力,其部署却长期受限于显著的算力瓶颈 —— 大小中等的模型一次多图推理可能需要 100 G 的显存空间,严重制约产业落地。 针对这一技术痛点,哈工大团队联合度小满金融科技正式发布 EFFIVLM-BENCH,业界首个支持跨场景统一评估的多模态大模型高效化基准框架,为学术界提供可复现的压缩方案对比基准,同时赋能工业界实现最优部署策略遴选。
6/16/2025 2:39:56 PM

AI 黑话太多看不懂?一文帮你打通:AI, 机器学习, 大模型, LLM, Agent 都是啥关系?

最近是不是感觉整个世界都在聊AI? 从ChatGPT、Sora、到Cursor… 人工智能正以前所未有的速度和广度渗透进我们的生活和工作。 伴随而来的是一堆高频词汇:大模型(Large Model)、LLM(Large Language Model)、机器学习(Machine Learning)、深度学习(Deep Learning,虽然你没问,但它太重要了,我们也会提一下)、还有最新的智能体(Agent)……哎呀,听得多了,感觉脑袋都成了一锅粥。
6/16/2025 10:05:00 AM
徐述