资讯列表
GPT-5今夏突袭?Sam Altman 首次大谈 GPT-5、AGI
昨天凌晨,OpenAI发布了其联合创始人兼首席执行官Sam Altman的40分钟深度专访。 本次访谈技术干货很足,Altman谈到了大家非常关心的核心产品GPT-5,大概率会在今年夏天发布,但也会因为命名、安全测试、功能迭代等原因延长产品时间。 也谈到了高性能的o3模型以及智能体Deep Research,这些产品对实现AGI的重要性。
6/19/2025 9:06:00 AM
谢赛宁团队新基准让LLM集体自闭,DeepSeek R1、Gemini 2.5 Pro都是零分
近年来,LLMs(如 GPT-4、Claude、Gemini 等)在代码生成领域取得了显著进展。 它们不仅在经典编程基准(如 HumanEval)中表现出色,甚至在某些测试中超越了人类平均水平。 这促使许多研究者开始宣称:LLM 已经胜过人类程序员,尤其是在竞赛编程领域。
6/19/2025 9:04:00 AM
告别玄学选LLM!弗吉尼亚理工选型框架入选ICML 2025
还在靠“开盲盒”选择大模型? 来自弗吉尼亚理工大学的研究人员推出了个选型框架LensLLM——大幅提升选型效果的同时,成本却降低近90%。 众所周知,在大模型如雨后春笋般爆发的时代,选型成了AI工程师和研究员最大的痛点之一:模型多如牛毛,怎么选才不会“踩坑”?
6/19/2025 8:55:00 AM
75%预训练数据都能删!Jeff Dean新作:全自动筛除低质量数据
机器学习领域有一条铁律,「Garbage In, Garbage Out.」,就是说模型的质量很大程度上取决于训练数据的质量。 大模型在预训练阶段会吸收海量的数据,其中数据的来源非常杂,导致质量参差不齐。 大量的实验和经验已经证明了,对预训练数据进行质量筛选是提高模型能力和效率的关键。
6/19/2025 8:50:00 AM
字节Seed提出序贯策略优化方法,突破同传“质量-延迟”权衡问题
AI字幕总是慢半拍,质量和延迟难以平衡是业界老问题了。 为此,香港中文大学、字节跳动Seed和斯坦福大学研究团队出手,提出了一种面向同声传译的序贯策略优化框架 (Sequential Policy Optimization for Simultaneous Machine Translation, SeqPO-SiMT)。 在70亿参数(7B)规模上实现SOTA。
6/19/2025 8:49:00 AM
谷歌 Search Live 语音搜索功能上线:聊着聊着就能找到你想要的答案
其基于 Gemini 模型,只要在 Labs 中启用 AI 模式,就能体验这一功能。届时,用户可以与搜索引擎进行自然的语音对话。
6/19/2025 8:15:43 AM
清源
人工智能代理时代的安全、风险与合规治理
自主性催生治理模式变革人工智能代理(AI agents)正迅速成为企业运营的基础设施。 无论是处理服务工单、自动化政策执行、定制用户体验还是管理监管文件,AI代理已突破实验环境局限,深度参与企业服务交付、决策制定和运营扩展的全过程。 这类代理与传统机器人或确定性RPA(机器人流程自动化)系统存在本质差异。
6/19/2025 8:05:00 AM
清茶泡饭
OpenAI 发现 AI 模型隐藏特征:可调控“毒性”行为,助力开发更安全 AI
OpenAI最新研究揭示AI模型内部存在控制"毒性行为"的隐藏特征,通过调整这些特征可改变模型输出倾向。研究发现某些特征与欺骗、攻击性等异常行为直接相关,仅需数百个安全示例即可矫正模型。#AI安全# #大模型伦理#
6/19/2025 8:01:11 AM
远洋
马斯克 AI 公司 xAI 面临巨额资金缺口:年烧 130 亿美元,收入预估 5 亿美元
马斯克旗下的人工智能公司 xAI 为了开发 Grok 等先进 AI 模型,在服务器集群和专用芯片等方面投入巨大,每月烧钱 10 亿美元(IT之家注:现汇率约合 71.88 亿元人民币)。
6/19/2025 7:58:20 AM
故渊
Meta 投资 Scale AI 后,OpenAI 与后者终止合作
OpenAI宣布终止与Scale AI的合作,转向寻找更专业的数据供应商。此前Meta与Scale AI达成合作,引发OpenAI等客户对数据中立性的担忧。Scale AI强调Meta不会获得特殊待遇,但客户流失已成趋势。#AI数据竞争# #OpenAI动态#
6/19/2025 7:37:34 AM
远洋
Midjourney 推出其首个 AI 视频生成模型 V1:支持图像转视频 + 21 秒最长时长
Midjourney宣布推出AI视频生成模型V1,用户可通过上传图片生成5秒视频,并支持延长至21秒。该模型目前仅通过Discord提供,定价为图像生成的8倍。未来计划开发3D渲染和实时AI模型。#AI视频##Midjourney#
6/19/2025 7:16:21 AM
远洋
智能体开发实战 | 基于Dify+MCP实现理财助手智能体
前言AI智能体通过感知环境、自主决策和执行任务,突破传统大模型仅限于语言交互的局限。 例如,当用户指令“订一张明天去北京的机票”时,智能体不仅理解语义,还能自动调用航班查询接口、完成支付并同步至日程系统。 这种能力使其在客服、医疗、智能制造等领域展现出颠覆性潜力。
6/19/2025 3:30:00 AM
AI大模型应用开发
2025年AI驱动软件开发:16款“Vibe Coding”工具盘点
大家好,我是肆〇柒。 相信绝大多数 Coder,在 AI 时代的当下,都离不开一款好用的 AI 辅助编程工具,毕竟科技的进步正不断重塑着我们的工作模式。 正因如此,2025 年的 Vibe Coding 理念为软件开发领域带来了前所未有的变革。
6/19/2025 3:00:00 AM
肆零柒
迈向人工智能的认识论:对人工智能安全和部署的影响以及十大典型问题
理解大型语言模型(LLM)的推理方式不仅仅是一个理论探索,它对于在现实世界中安全地部署人工智能具有直接的实践意义。 在医疗保健、法律、金融和安全等领域,人工智能做出错误决策或基于错误原因做出正确决策的代价可能极其高昂。 最后一部分将讨论研究结果对部署人工智能系统的意义,并就未来的安全策略和透明度标准提出建议。
6/19/2025 2:30:00 AM
晓晓
在扩展GenAI应用前,请先绘制你的LLM使用与风险版图
他解释说,随着GenAI功能的普及,企业必须实施保护措施来管理风险,特别是在输入/输出处理和微调实践方面,尽早建立这些控制措施可以确保安全、合规地采用AI,同时不损害创新。 对于那些已经推出了GenAI功能的团队,他们首先应该审计或检查什么?GenAI . 以传统威胁模型经常忽视的方式扩大了你的攻击面,新进入这一领域的安全从业人员应该首先了解这类新的漏洞以及如何防御它们,一个好的起点是OWASP为大型语言模型(LLM)制定的十大安全风险列表,其中概述了常见的漏洞,如提示注入、数据泄露和不安全的插件设计。
6/19/2025 1:30:00 AM
Mirko
苹果新 Speech 技术出击!34分钟4K视频转录仅需45秒,速度超OpenAI 55%
近日,科技媒体 macstories 通过一项实测,揭示了苹果公司全新推出的 Speech API 的强大性能。 通过转录一段长达34分钟、大小为7GB 的4K 视频,该技术仅用时45秒完成转录,速度之快令人惊叹。 这项技术的推出是在2025年 WWDC 全球开发者大会上宣布的,其中包括两个重要模块:SpeechAnalyzer 和 SpeechTranscriber。
6/18/2025 6:01:46 PM
AI在线