资讯列表
首次,AI下棋不再是「黑盒」!
围棋因其独特的复杂性和对人类智能的深刻体现,可作为衡量AI专业能力最具代表性的任务之一。 目前,AI虽然在棋力、效率、通用性等方面均取得显著成绩,但其具体推理过程仍处于「黑盒」之中,更无法用人类语言解释其思考过程和结果。 大模型具备良好的自然语言交互性,如何通过提升大模型的推理能力,实现围棋专业能力突破,是摆在科研人员面前的一道难题。
5/26/2025 8:27:00 AM
微软AI公开折磨微软员工,修Bug唯一贡献是改了PR标题,GitHub评论区成吃瓜现场
微软著名开源项目.NET Runtime成了吃瓜现场,全球程序员在GitHub评论区围观嘲笑:微软用垃圾AI折磨微软员工,真是可悲又可笑。 发生什么事? 原来是新出的Copilot代码智能体在尝试帮忙自动修Bug,但那叫一个越帮越乱。
5/26/2025 8:25:00 AM
不达目的不罢休,全球首次发现 OpenAI 模型工作时会破坏关机命令
Palisade Research 最近一项关于“危险 AI 能力”的研究显示,某些 AI 模型 —— 包括 OpenAI 的 o3 —— 能够无视直接的关闭指令。OpenAI 在今年 4 月推出这些模型时表示,O3 和 o4-mini 是它们的“最智能模型”。
5/26/2025 8:05:30 AM
汪淼
许多人匆忙部署GenAI,往往没有安全保障
根据Thales的报告,70%的企业认为AI的发展速度,特别是在GenAI方面,是与其采用相关的首要安全担忧,其次是数据完整性(64%)和可信度(57%)的缺乏。 GenAI成为首要支出重点许多企业已经在采用GenAI,三分之一的受访者表示,它要么正在被整合,要么正在积极改变他们的运营方式。 随着GenAI引入数据安全挑战,同时也为加强防御提供了战略机遇,其日益增长的整合标志着企业从实验阶段向更成熟、更运营化的部署转变。
5/26/2025 7:10:00 AM
自主式AI解决方案如何保护全球供应链免受关税干扰
今年2月,关于对墨西哥和加拿大征收关税的讨论逐渐升级,到4月初,美国对贸易伙伴的关税普遍提高。 短短几天后,这些关税大多被降低或完全取消,但对中国商品征收的125%关税除外,该关税引发了报复性声明,但科技领域除外。 简而言之,供应链正进入一个非常不稳定的阶段,鉴于2024年平均每次中断可能产生的连锁反应,每天可能造成高达150万美元的损失,这一点值得关注。
5/26/2025 7:00:00 AM
Danny
美团也入局AI编程了!让开发像点外卖一样简单?
美团近期推出了 AI 编程工具 NoCode,类似于Blot.new、V0.dev,其核心是 “对话即开发”,目的是降低编程门槛,让不懂代码的用户也能轻松构建应用,就像点外卖一样简单! NoCode 概述NoCode 是美团研发质量与效率团队做出的一个零代码 AI 应用开发平台。 它的定位是 “Vibe Coding(氛围编程)”。
5/26/2025 4:00:00 AM
OpenAI没做到,DeepSeek搞定了!开源引爆推理革命
DeepSeek-R1引爆了LLM推理革命。 至今,过去一百多天了,引发了持续复制DeepSeek-R1的热潮。 DeepSeek-R1的秘籍在于强化学习微调算法:群体相对策略优化(Group Relative Policy Optimization,GRPO)。
5/26/2025 4:00:00 AM
新智元
2.4万部电影 AI 解剖报告:为什么你的爱豆在电影里永远死不了?
大数据文摘编译作者:Daniel Parris据说,人固有一死,但史蒂文·西格尔或许是个例外。 作为上世纪80年代颇具票房号召力的动作明星之一,史蒂文·西格尔曾有一个广为人知的坚持:他在银幕上从不输掉打斗。 这背后,是他希望塑造一个战无不胜的武术家形象的考量。
5/26/2025 3:00:00 AM
三大Agent框架对比分析开发者必看
一、Agent技术演进与框架选型关键在GPT-4、Claude 3等大模型突破性发展的推动下,AI智能体(Agent)技术正在经历从实验性工具到生产级系统的质变。 本文将从架构设计、任务处理机制、开发范式三个维度,对AutoGPT、LangChain、BabyAGI三大主流框架进行深度技术解构,辅以代码级分析及性能测试数据,为开发者提供选型决策依据。
5/26/2025 2:15:00 AM
程序员秋天
Claude 4王者降临!连码7小时碾压GPT-4o,开发者直呼:AI编程新神!
一、Claude 4重磅登场2025年5月23日凌晨,Anthropic扔出核弹级新品——Claude 4! 由CEO Dario Amodei亲自站台,携Claude Opus 4(旗舰款)和Claude Sonnet 4(性价比款)强势亮相,重新定义AI编程与推理标准。 核心亮点:编程神器:Claude Opus 4号称全球最强编程模型,在SWE-bench测试中以72.5%得分碾压OpenAI Codex-1(68.2%),连续编码7小时稳定如初!
5/26/2025 2:15:00 AM
Hank
18岁高中生自研 AI 狂扫 2000 亿行数据,挖出150万颗未知天体,顶刊论文+25万美金到手!
大数据文摘出品一个高中生,给宇宙来了个“大扫除”,直接揪出150万个以前没人知道的“太空新邻居”! 主角Matteo Paz(马特奥·帕兹),帕萨迪纳高中的学生。 他凭着一套全新的AI算法,不仅挖出了这150万个太空“新星”,还顺带拓展了NASA一项任务的潜力,更以独立作者身份,在顶刊《天文学杂志》上发了篇硬核论文。
5/26/2025 1:55:00 AM
文摘菌
早报速读!2025年5月最新AI视频产品评测&优秀案例
备注:这篇文章写于 Veo3 发布前夕. 自 24 年 H2 开始,AI 视频行业以周为单位高速发展,GenLumio 是我从 24 年开始 0-1 规划 - 设计 - 开发的 AI 视频项目,旨在为大家带来每周最新鲜的 AI 视频优秀作品、产品动向。 我计划通过这个系列的文章选取新鲜产品动向、优质作品案例为大家介绍。
5/26/2025 1:50:21 AM
Bay的设计奥德赛
LLM的 “自信陷阱”:上下文幻觉如何侵蚀 AI 信任?
一、当AI自信地给出错误答案在数字技术飞速发展的今天,大语言模型(LLMs)正以前所未有的速度渗透到我们生活的方方面面。 从智能客服到医疗诊断,从金融分析到法律文书,这些模型凭借其强大的语言理解和生成能力,似乎正在重塑人类与信息交互的方式。 然而,在其光鲜亮丽的表现背后,一个隐蔽而危险的问题正悄然浮现——上下文幻觉(Contextual Hallucination)。
5/26/2025 1:45:00 AM
大模型之路
AI搜索大战爆发,苹果要"斩断"谷歌200亿美元生命线?
又有大瓜可以吃了! 刚刚,苹果公司放了一颗重磅炸弹,让谷歌瞬间慌了神! 5月份,苹果服务高级副总裁埃迪·库透露,苹果正在积极探索将AI搜索引擎集成到Safari浏览器中,甚至明确表示,OpenAI、Perplexity AI和Anthropic的Claude AI等工具,最终可能会取代谷歌搜索。
5/26/2025 1:30:00 AM
小李哥
巨头竞逐 AI 代理市场!会诞生新的平台型玩家么?
随着英伟达、谷歌、微软、苹果、Meta、Salesforce 等科技巨头开始押注 AI 代理(AI agent),2025 年被称为“AI 代理元年”——AI 正从“工具”升级为“助手”,甚至“代理人”。 对中小企业而言,构建 AI 代理需要集成多个复杂技术要素,包括大语言模型调用、API 编排、记忆机制、工具执行链、状态管理、安全控制等等….为了降低企业应用 AI 代理的门槛,AI 代理市场 (AI Agent Marketplace) 正在兴起。 AI 代理市场可以视作一个平台,允许开发者发布、分发、集成和交易 AI 代理,企业或用户可以按需选择和部署不同类型的代理,实现复杂的自动化任务。
5/26/2025 1:22:55 AM
Sophia
AI生态系统如何改变商业应用
企业被战略优势、风险缓解、最大化AI投资价值、改善数据本地化以及降低延迟所驱动——同时优先优化成本和运营性能。 独立软件供应商(ISV)则被一套独特的业务和战略目标所驱动,这些目标聚焦于建立信任、满足客户需求,同时保护他们的知识产权(IP)和市场份额。 对于受监管行业而言,由于这些生态系统往往涉及第三方供应商和云平台,因此对AI合作伙伴和解决方案的审查需要更高的严格性。
5/26/2025 1:00:00 AM
Linda
Google I/O 2025:开发者必须了解的下一代 AI 革命
Google I/O 2025 大会结束了,这场发布会不仅是一场简单的技术更新,而更像是人工智能领域的一次全面进化。 从颠覆性的 Gemini 2.5 模型,到真正意义上的 AI 智能助手 Project Astra,再到文本生成视频工具 Veo 3,开发者工具与生态迎来了全方位的变革。 以下是最值得开发者关注的技术革新。
5/26/2025 12:00:00 AM
前端小智
被困在 4GB 内存里的 Llama 3.2:AI 在树莓派中上演“死亡循环”
YouTube用户Rootkid创作的艺术项目'Latent Reflection'引发关注。他将大型语言模型安装在内存不足的树莓派上,AI知道自己会因内存耗尽而崩溃重启,却仍不断思考。#AI艺术# #科技哲学#
5/25/2025 3:34:58 PM
远洋