资讯列表

分类

标签

谷歌 Search Live 语音搜索功能上线：聊着聊着就能找到你想要的答案

其基于 Gemini 模型，只要在 Labs 中启用 AI 模式，就能体验这一功能。届时，用户可以与搜索引擎进行自然的语音对话。

6/19/2025 8:15:43 AM 清源

人工智能代理时代的安全、风险与合规治理

自主性催生治理模式变革人工智能代理（AI agents）正迅速成为企业运营的基础设施。无论是处理服务工单、自动化政策执行、定制用户体验还是管理监管文件，AI代理已突破实验环境局限，深度参与企业服务交付、决策制定和运营扩展的全过程。这类代理与传统机器人或确定性RPA（机器人流程自动化）系统存在本质差异。

6/19/2025 8:05:00 AM 清茶泡饭

OpenAI 发现 AI 模型隐藏特征：可调控“毒性”行为，助力开发更安全 AI

6/19/2025 8:01:11 AM 远洋

马斯克 AI 公司 xAI 面临巨额资金缺口：年烧 130 亿美元，收入预估 5 亿美元

马斯克旗下的人工智能公司 xAI 为了开发 Grok 等先进 AI 模型，在服务器集群和专用芯片等方面投入巨大，每月烧钱 10 亿美元（IT之家注：现汇率约合 71.88 亿元人民币）。

6/19/2025 7:58:20 AM 故渊

Meta 投资 Scale AI 后，OpenAI 与后者终止合作

OpenAI宣布终止与Scale AI的合作，转向寻找更专业的数据供应商。此前Meta与Scale AI达成合作，引发OpenAI等客户对数据中立性的担忧。Scale AI强调Meta不会获得特殊待遇，但客户流失已成趋势。#AI数据竞争# #OpenAI动态#

6/19/2025 7:37:34 AM 远洋

Midjourney 推出其首个 AI 视频生成模型 V1：支持图像转视频 + 21 秒最长时长

Midjourney宣布推出AI视频生成模型V1，用户可通过上传图片生成5秒视频，并支持延长至21秒。该模型目前仅通过Discord提供，定价为图像生成的8倍。未来计划开发3D渲染和实时AI模型。#AI视频##Midjourney#

6/19/2025 7:16:21 AM 远洋

OpenAI 奥尔特曼：GPT-5 预计今年夏季推出

根据《商业内幕》报道，GPT-5将远超GPT-4，早期测试者称其“在多个方面都有显著进步”。

6/19/2025 7:07:04 AM 清源

智能体开发实战 | 基于Dify+MCP实现理财助手智能体

前言AI智能体通过感知环境、自主决策和执行任务，突破传统大模型仅限于语言交互的局限。例如，当用户指令“订一张明天去北京的机票”时，智能体不仅理解语义，还能自动调用航班查询接口、完成支付并同步至日程系统。这种能力使其在客服、医疗、智能制造等领域展现出颠覆性潜力。

6/19/2025 3:30:00 AM AI大模型应用开发

2025年AI驱动软件开发：16款“Vibe Coding”工具盘点

大家好，我是肆〇柒。相信绝大多数 Coder，在 AI 时代的当下，都离不开一款好用的 AI 辅助编程工具，毕竟科技的进步正不断重塑着我们的工作模式。正因如此，2025 年的 Vibe Coding 理念为软件开发领域带来了前所未有的变革。

6/19/2025 3:00:00 AM 肆零柒

迈向人工智能的认识论：对人工智能安全和部署的影响以及十大典型问题

理解大型语言模型（LLM）的推理方式不仅仅是一个理论探索，它对于在现实世界中安全地部署人工智能具有直接的实践意义。在医疗保健、法律、金融和安全等领域，人工智能做出错误决策或基于错误原因做出正确决策的代价可能极其高昂。最后一部分将讨论研究结果对部署人工智能系统的意义，并就未来的安全策略和透明度标准提出建议。

6/19/2025 2:30:00 AM 晓晓

在扩展GenAI应用前，请先绘制你的LLM使用与风险版图

他解释说，随着GenAI功能的普及，企业必须实施保护措施来管理风险，特别是在输入/输出处理和微调实践方面，尽早建立这些控制措施可以确保安全、合规地采用AI，同时不损害创新。对于那些已经推出了GenAI功能的团队，他们首先应该审计或检查什么?GenAI . 以传统威胁模型经常忽视的方式扩大了你的攻击面，新进入这一领域的安全从业人员应该首先了解这类新的漏洞以及如何防御它们，一个好的起点是OWASP为大型语言模型(LLM)制定的十大安全风险列表，其中概述了常见的漏洞，如提示注入、数据泄露和不安全的插件设计。

6/19/2025 1:30:00 AM Mirko

AI初创公司MINIMAX据悉计划在香港上市

据媒体报道，人工智能初创公司MINIMAX据悉计划在香港上市。

6/18/2025 7:01:36 PM AI在线

苹果新 Speech 技术出击！34分钟4K视频转录仅需45秒，速度超OpenAI 55%

近日，科技媒体 macstories 通过一项实测，揭示了苹果公司全新推出的 Speech API 的强大性能。通过转录一段长达34分钟、大小为7GB 的4K 视频，该技术仅用时45秒完成转录，速度之快令人惊叹。这项技术的推出是在2025年 WWDC 全球开发者大会上宣布的，其中包括两个重要模块:SpeechAnalyzer 和 SpeechTranscriber。

6/18/2025 6:01:46 PM AI在线

字节跳动推出的AI视频生成模型 Seedance 1.0悄然超越谷歌 Veo 3

在近期的人工智能视频生成领域，字节跳动（TikTok 的母公司）悄然发布了一款名为 Seedance1.0的新模型，该模型在独立的评测中已经超越了谷歌最新推出的 Veo3。 Veo3以其音频合成和电影级工具而受到广泛关注，但 Seedance1.0的技术实力却令人刮目相看，成为视频生成的领头羊。 Seedance1.0的研究论文中详细介绍了该模型的创新之处。

6/18/2025 6:01:46 PM AI在线

MiniMax 发布 M1 大模型，百万Token上下文+MoE架构，只花了 GPT-4 的零头！

近日，国内 AI 初创公司 MiniMax 发布了一款全新的语言大模型 MiniMax-M1。有两个方面最引人注目：1.高达100万Token的上下文处理能力。 2.极具竞争力的训练成本效益。

6/18/2025 4:42:38 PM

单GPU搞定高清长视频生成，效率×10！引入Mamba机制突破DiT瓶颈 | 普林斯顿&Meta

视频生成模型太贵太慢怎么办？普林斯顿大学和Meta联合推出的新框架LinGen，以MATE线性复杂度块取代传统自注意力，将视频生成从像素数的平方复杂度压到线性复杂度，使单张GPU就能在分钟级长度下生成高质量视频，大幅提高了模型的可扩展性和生成效率。实验结果表明，LinGen在视频质量上优于DiT（胜率达75.6%），并且最高可减少15×（11.5×）FLOPs（延迟）。

6/18/2025 4:42:15 PM

统一框架下的具身多模态推理：自变量机器人让AI放下海德格尔的锤子

当一位熟练的木匠抓起锤子时，锤子消失了 —— 不是物理上的消失，而是无需思考便可自如使用。然而，当前最先进的机器人仍然无法“放下”这把“锤子”，它们被困在循环中 —— 识别锤子、规划如何使用锤子，每一次交互都需要重新“拿起”工具作为认知对象，这种割裂式的处理方式让 AI 永远无法达到人类那种直觉的工具使用境界。具身智能的突破，不会来自对现有基于视觉 - 语言基础模型的修补，而将源于一场架构革命。

6/18/2025 4:41:45 PM

10×加速！DCM显著提升视频扩散模型推理效率！HunyuanVideo13B推理时间从1500秒缩短至120秒！

本文由南京大学，香港大学，上海人工智能实验室，中国科学院大学与南洋理工大学 S-Lab 联合完成。扩散模型在视频合成任务中取得了显著成果，但其依赖迭代去噪过程，带来了巨大的计算开销。尽管一致性模型（Consistency Models）在加速扩散模型方面取得了重要进展，直接将其应用于视频扩散模型却常常导致时序一致性和外观细节的明显退化。

6/18/2025 4:39:02 PM

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

资讯列表

谷歌 Search Live 语音搜索功能上线：聊着聊着就能找到你想要的答案

人工智能代理时代的安全、风险与合规治理

OpenAI 发现 AI 模型隐藏特征：可调控“毒性”行为，助力开发更安全 AI

马斯克 AI 公司 xAI 面临巨额资金缺口：年烧 130 亿美元，收入预估 5 亿美元

Meta 投资 Scale AI 后，OpenAI 与后者终止合作

Midjourney 推出其首个 AI 视频生成模型 V1：支持图像转视频 + 21 秒最长时长

OpenAI 奥尔特曼：GPT-5 预计今年夏季推出

智能体开发实战 | 基于Dify+MCP实现理财助手智能体

2025年AI驱动软件开发：16款“Vibe Coding”工具盘点

迈向人工智能的认识论：对人工智能安全和部署的影响以及十大典型问题

在扩展GenAI应用前，请先绘制你的LLM使用与风险版图

AI初创公司MINIMAX据悉计划在香港上市

苹果新 Speech 技术出击！34分钟4K视频转录仅需45秒，速度超OpenAI 55%

​字节跳动推出的AI视频生成模型 Seedance 1.0悄然超越谷歌 Veo 3

MiniMax 发布 M1 大模型，百万Token上下文+MoE架构，只花了 GPT-4 的零头！

单GPU搞定高清长视频生成，效率×10！引入Mamba机制突破DiT瓶颈 | 普林斯顿&Meta

统一框架下的具身多模态推理：自变量机器人让AI放下海德格尔的锤子

10×加速！DCM显著提升视频扩散模型推理效率！HunyuanVideo13B推理时间从1500秒缩短至120秒！

字节跳动推出的AI视频生成模型 Seedance 1.0悄然超越谷歌 Veo 3