资讯列表
DeepMind 员工抗议谷歌与军工合同,引发工会组建潮
近日,谷歌旗下的 DeepMind 公司在英国的员工们正积极寻求组建工会,以对抗公司将人工智能技术出售给军工集团的决定,以及与以色列政府之间的合作关系。 据悉,约有300名位于伦敦的 DeepMind 员工已向英国通信工人工会(CWU)递交了申请,期望通过工会的力量来改变公司现有的商业化策略。 谷歌正在推动 DeepMind 寻找其技术的商业应用,这一过程引起了员工们的广泛担忧。
4/27/2025 9:00:49 AM
AI在线
谷歌AI发布601个真实世界的生成式AI应用案例,涵盖各行业
谷歌云近期发布了一份令人瞩目的报告,展示了601个来自全球顶尖企业的真实世界生成式 AI(GenAI)应用案例。 这一数字比去年在谷歌云大会上分享的101个案例增长了六倍,展现了生成式 AI 技术从原型走向生产应用的飞速进展,这些技术正在几乎所有行业中推动变革。 在2025年谷歌云大会上宣布的这份报告涵盖了从优步、三星、花旗到梅赛德斯 - 奔驰、德意志银行和阿拉斯加航空等多家知名公司的应用。
4/27/2025 9:00:48 AM
AI在线
GPT-4o图像生成功能现已集成至自定义GPTs
2025年4月26日 AIbase报道:OpenAI近日宣布,其旗舰多模态模型GPT-4o的图像生成功能现已正式集成至ChatGPT的自定义GPTs功能中。 这一更新标志着用户创建的定制化AI助手能够直接生成和编辑图像,为内容创作、设计和教育等领域带来更多可能性。 无缝集成的图像生成体验GPT-4o的图像生成功能此前已于2025年3月25日起在ChatGPT和Sora平台向免费、Plus、Pro和Team用户逐步开放。
4/27/2025 9:00:21 AM
AI在线
结构化提示词驱动开发实践
最近有幸参加了公司组织的关于AI实践的对外直播,我分享的内容是《结构化提示词驱动开发实践》。 现在将其记录成一篇博客,在此与大家分享我们团队在提示词驱动开发领域的一些实践与思考。 随着大语言模型的不断成熟,我们逐步认识到,如何高效运用结构化提示词,引导AI生成高质量代码,已成为提升软件开发效率与质量的关键所在。
4/27/2025 9:00:00 AM
Thoughtworks洞见
北航推出全开源TinyLLaVA-Video-R1,小尺寸模型在通用视频问答数据上也能复现Aha Moment!
当前,基于强化学习提升多模态模型的推理能力已经取得一定的进展。 但大多研究者们选择 7B 的模型作为基座,这对于许多资源有限的科研人员而言仍存在显著的门槛。 同时,在视频推理领域,由于高质量强推理性数据较为稀少,通用问答数据较难激发模型的深层次逻辑推理能力,因此先前一些初步尝试的效果大多不尽如人意。
4/27/2025 9:00:00 AM
机器之心
具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互
OpenAI 的 o1 系列模型、Deepseek-R1 带起了推理模型的研究热潮,但这些推理模型大多关注数学、代码等专业领域。 如何将这种深度推理模型扩展到智能体和具身领域,让机器人通过思考和推理来完成复杂具身交互等任务? 近期,来自浙江大学、中科院软件所和阿里巴巴的团队提出了 Embodied-Reasoner,让机器人或智能体拥有深度思考和交互决策能力,从而在真实物理世界完成环境探索、隐藏物体搜索、交互和搬运等长序列复杂任务。
4/27/2025 8:55:00 AM
机器之心
英伟达AI奥赛夺冠,1.5B数学碾压DeepSeek-R1!代码全系开源,陶哲轩点赞
AI数学奥赛第一名「答卷」终于公布! NVIDIA公布并开源了他们的冠军模型OpenMath-Nemotron系列! 论文地址:、软件工程师Chan Kha Vu,则盛赞道:这些模型太不可思议了!
4/27/2025 8:54:00 AM
新智元
秒杀同行!Kimi开源全新音频基础模型,横扫十多项基准测试,总体性能第一
kimi 又发布了新的开源项目 —— 一个全新的通用音频基础模型 Kimi-Audio,支持语音识别、音频理解、音频转文本、语音对话等多种任务,在十多个音频基准测试中实现了最先进的 (SOTA) 性能。 结果显示,Kimi-Audio 总体性能排名第一,几乎没有明显短板。 例如在 LibriSpeech ASR 测试上,Kimi-Audio 的 WER 仅 1.28%,显著优于其他模型。
4/27/2025 8:50:00 AM
机器之心
OpenAI、谷歌等一线大模型科学家公开课,斯坦福CS 25春季上新!
在斯坦福,有一门专门讲 Transformer 的课程,名叫 CS 25。 这门课曾经邀请过 Geoffrey Hinton、Andrej Karpathy 以及 OpenAI 的 Hyung Won Chung、Jason Wei 等一线大模型研究科学家担任讲师,在 AI 社区引起广泛关注。 最近,这门课又上新了。
4/27/2025 8:40:00 AM
机器之心
英伟达开源「描述一切」模型,拿下7个基准SOTA
图像描述(image captioning)生成一直是计算机视觉和自然语言处理领域面临的长期挑战,因为它涉及理解和用自然语言描述视觉内容。 虽然近期的视觉语言模型 (VLM) 在图像级描述生成方面取得了令人瞩目的成果,但如何为图像中的特定区域生成详细准确的描述仍然是一个悬而未决的问题。 这一挑战在视频领域尤为突出,因为模型必须额外捕捉动态视觉内容,例如人类动作、物体运动以及人与物体的交互。
4/27/2025 8:30:00 AM
机器之心
一日一技:如何快速生成大模型工具调用的JSON Schema
在使用大模型的工具调用时,我们需要编写JSON Schema,例如下图的tools字段的值:图片这个Schema写起来非常麻烦,括号太多了,看着眼花。 不信你肉眼看看,你需要几秒钟才能分清楚type: "object"跟哪个字段在同一层级? 这个Schema有没有什么办法自动生成呢?
4/27/2025 7:57:50 AM
kingname
“AI 编程”之争:Anthropic 因版权纠纷受批评,OpenAI 意外赢得用户好感
Claude Code 和 Codex CLI 都是让开发者能够利用云端的 AI 模型来完成各种编程任务的工具,功能相似。两家公司几乎在同一时期发布了这两款工具,争夺开发者的关注。
4/27/2025 7:30:24 AM
清源
指导智能体:为什么你的下一个安全雇员可能是算法
安全团队正淹没在警报中,威胁、可疑活动和误报的数量之大,使得分析师几乎不可能有效地调查所有内容,这时,出现了自主式AI,它能够同时完成数百项任务而不会感到疲倦。 企业越来越多地采用自主式AI来处理重复的安全任务,如警报分类,从而让人类分析师专注于最严重的威胁,但尽管自主式AI可能速度很快,但它并非万无一失,它天生就不了解企业独特的风险环境或安全优先级。 就像任何新员工一样,智能体需要指导才能发挥效用,它必须被调整、监控和完善,以与企业的安全政策和运营工作流程保持一致。
4/27/2025 7:10:00 AM
Edward Wu
如何利用网络爬虫进行大规模LLM数据收集
大语言模型的 “智慧” 很大程度上依赖于其训练数据的质量和数量。 想要打造一个能够理解真实世界的模型,就必须获取来自真实世界的信息,而互联网无疑是海量数据的主要来源。 本文将深入探讨如何利用网络爬虫收集大规模、适用于 AI 训练的数据,为人工智能模型的训练筑牢坚实基础。
4/27/2025 4:05:00 AM
大模型之路
不要小看线性回归!
在数据领域初学时,大家常听到的一个建议是:不要试图把整个机器学习都学透——因为它实在太庞大且变化太快,根本不现实;而更应该聚焦在少数几个与数据工作日常紧密相关的模型,比如决策树、支持向量机,当然,还有线性回归。 线性回归本身就是一个非常实用的模型,更有意思的是,许多其他机器学习模型其实都是在它的基础上稍作改动而来。 本文的目的,就是想让大家看到这一点。
4/27/2025 4:02:00 AM
你的 MCP 调用正在成为系统的"后门",这个解决方案刻不容缓!
在人工智能快速发展的今天,大型语言模型 (LLM) 已成为提升工作效率的重要工具。 随着 MCP(Model Context Protocol)的出现,我们有了一种标准化的方式来与 AI 模型交互。 然而,当需要同时使用多个 MCP 资源服务器时,管理和使用这些服务不仅变得复杂,安全问题也越发严重。
4/27/2025 3:34:00 AM
PIG AI
深度研究 | 解构国内外代表性Agentic AI系统风险模型
Agentic AI正在走向现实应用。 这些拥有自主决策能力的AI系统也带来了全新的安全挑战。 与传统网络安全风险不同,Agentic AI系统面临着更为复杂、多维度的威胁态势,需要我们以创新的视角重新审视安全防护体系。
4/27/2025 3:10:00 AM
如何用DeepSeek+Cursor加速开发微信小程序(实战级指南)
一、工具链核弹级组合1. 双AI引擎配置复制技术协同原理:• Cursor:实时代码生成/缺陷修复(相当于AI程序员)• DeepSeek:业务逻辑设计/架构优化(相当于CTO)2. 环境闪电部署复制二、小程序开发加速流水线1.
4/27/2025 2:25:00 AM
架构师秋天