AI在线 AI在线

理论

如何使用Google Vids创建免费视频或短片

译者 | 李睿审校 | 重楼Google Vids是谷歌公司推出的一款免费人工智能视频创作工具,该工具基于Veo 2模型,集成在Workspace中,无需安装。 其适用人群广泛,可实现“20分钟快速制视频”,颠覆传统高门槛创作模式,本文将探索如何使用Google Vids创建视频。 “嘿,能帮我快速做一个视频吗?
7/23/2025 8:10:32 AM
李睿

四个步骤构建了解云的智能Slackbot

译者 | 布加迪审校 | 重楼尽管云自动化领域取得了诸多进步,但大多数工程团队仍然通过工单、仪表板或隐藏的文档与其基础架构进行交互。 想要检查生产环境的AWS S3存储桶是否可公开访问? 准备好打开云控制台,点开一系列错综复杂的选项卡。
7/23/2025 8:01:30 AM
布加迪

Cursor 新定价方案引发用户强烈不满

最近,Cursor 的开发商 nysphere 推出了每月 200 美元的高端订阅计划,但这不仅仅是新增了昂贵套餐,还在悄悄削弱了现有的 Pro 计划。 曾经承诺的 500 次请求保障,如今被标榜为“无限请求”却伴随着随意的限流规则。 据 Cursor 用户反馈,新推出的 “Ultra” 计划提供了比 20 美元的 Pro 方案高 20 倍的 AI 模型使用额度,但 Pro 用户的体验却大打折扣,甚至被描述为“完全无法生成内容”。
7/22/2025 12:58:26 PM
前端小智

机器人高层指挥低层做,“坐标系转移接口”一次演示实现泛化学习 | ICML2025

如何让AI像人一样,仅凭少量演示,就能稳健适应复杂多变的真实场景? 美国东北大学和波士顿动力RAI提出了HEP(Hierarchical Equivariant Policy via Frame Transfer)框架,首创“坐标系转移接口”,让机器人学习更高效、泛化更灵活。 总的来说,HEP框架具有以下亮点:极简高效的分层结构高层负责全局目标设定,低层自主在本地坐标下优化动作,显著提升操作的灵活性与效率;空间对称性自然泛化模型自动适应目标平移、旋转等变化,极大降低泛化对数据量的依赖;创新型体素编码器三维视觉信息高效表达,兼顾细节还原与计算速度。
7/22/2025 12:42:53 PM

OpenAI 亲自下场!全能ChatGPT Agent发布,Manus们危险了

昨天,OpenAI在凌晨正式推出了全新的“ChatGPT Agent”,这一产品整合了此前的Operator和DeepResearch两大系统。 图片Operator善于网页互动,能像人一样浏览网站、点击按钮、填写表单,但它读文章太慢,需要慢慢滚动。 DeepResearch擅长信息挖掘,能从全网抓取材料、整合分析并生成研究报告,但它基本不会和网页互动。
7/22/2025 11:56:26 AM

微软发布《与AI共事》:被AI影响的不是程序员,而是销售和媒体人!

微软研究院发布了一份名为《与AI共事》的报告,发现知识工作、沟通和销售类岗位,正处在被人工智能影响的最前沿。 图片地址: Copilot用户对话进行了分析,从用户意图和AI操作两个维度,评估AI在实际工作场景中的应用情况。 这些对话被映射到O*NET数据库,这是美国对所有职业的标准分类工具,涵盖每项工作的核心活动与职责。
7/22/2025 11:54:47 AM

35分斩金!Gemini 成首个 IMO 认证 AI 金牌 ,OpenAI 未获许可强蹭 IMO 热度

Gemini Deep Think正式跨入国际数学奥林匹克(IMO)金牌行列。 谷歌DeepMind宣布,其搭载Deep Think模式的先进版本Gemini,在2025年IMO中斩获35分,成功达到了金牌标准。 这一成绩来自对6道题中的5道完美解答,评分标准、比赛时间、参赛流程与人类选手完全一致。
7/22/2025 11:53:05 AM

AI原生创业公司的典范。他们15个人,做了5款产品,目前自负盈亏

我强烈建议所有的老板和团队管理者都看看这期内容,看完之后,让我真正理解了什么才是 AI 原生公司。 AI 创业公司 Every 的 CEO Dan Shipper 完整分享了自己团队使用 AI 的经验。 Every 是一家专注于 AI 领域的创业公司,目前团队只有 15 人,但业务覆盖非常广。
7/22/2025 11:45:12 AM
阿颖

中国AI新王者?Kimi K2正在突破Claude的编程壁垒

一个明显的趋势是,中国的开源AI模型正在悄悄改写全球AI竞争格局。 继DeepSeek引发硅谷震动后,Moonshot AI刚刚发布的Kimi K2,再次证明了这个判断。 这次真的不一样了。
7/22/2025 11:38:38 AM
阿丸笔记

Agentic Enterprise:把 AI 从神坛拉回用户办公桌

大家好,我是肆〇柒,AI 的蓬勃发展正以前所未有的速度渗透到人类生活的各方面。 而在商业领域,AI 的影响力更是不容小觑,尤其在企业决策这一关键环节。 企业各职能、任务和运营都离不开高效的决策,而 AI 正展现出助力企业提升决策效能的巨大潜力。
7/22/2025 11:24:32 AM
肆零柒

Qwen深夜升级235B模型,重夺王座、全面超越Kimi K2!还预告了一个重磅更新

Qwen 深夜上新!  Qwen3-235B-A22B-2507 系列正式启动,今天率先登场的是非思考模型 —— Qwen3-235B-A22B-Instruct-2507。 在最新基准测试中,新模型全面超越 Kimi K2,开源王冠再度回到 Qwen 头上!
7/22/2025 11:03:07 AM

南洋理工、北大、上海AI实验室开源长记忆世界模型

目前,世界模型的模拟方法在维持长期一致性方面仍面临巨大挑战。 许多模拟环境在视角移动或时间推移后会出现内容变化,导致 3D 空间不一致,严重影响了用户体验和模拟效果的可靠性。 为了解决这一难题,南洋理工大学、北京大学王选计算机技术研究所、上海人工智能实验室的研究人员联合开源了长记忆世界模型WORLDMEM。
7/22/2025 10:45:55 AM

碾压DeepSeek V3!阿里开源新版Qwen-3,屠榜级断层第一

今天凌晨1点,阿里巴巴开源了Qwen3系列新版本Qwen3-235B-A22B-2507。 比较意外的是,阿里已经停用了混合思考模型,新版Qwen3是一个非思维推理,又回到了指令微调模型,但性能非常强劲。 根据阿里公布的数据显示,新版Qwen3在知识、推理、代码、对齐、智能体、多语言测试6大类几十种测试基准中,全部大幅度超过了DeepSeek开源的新版V3-0324模型。
7/22/2025 10:43:25 AM

并行革命,32倍吞吐量跃升!英伟达Helix架构突破百万Token推理瓶颈

想象一个使用大模型的任务,需要一次处理百万字符的文档,例如从百科全书中获取信息,或是分析数百页的法律卷宗,异或追踪持续数月的对话记录,都需要越来越长的上下文。 而大模型生成的每个词都需要扫描存储在所谓的KV缓存中存储的过去标记。 反复读取这个缓存会消耗GPU内存带宽。
7/22/2025 10:40:00 AM

刷新世界纪录!神秘学生击败谷歌AlphaEvolve难题最优解,优势仅0.00006442

一个还在上学的少年在AI的帮助下,击败了谷歌最先进的技术,创造了新的世界纪录! 当IMO闹剧还在争论,这个少年靠着AI已经在数学问题上逆袭了谷歌最先进的、用于设计高级算法的AlphaEvolve。 在「Circle Packing」问题上,这个少年的算法以「0.00006442」的优势超过了谷歌AlphaEvolve,也超过了此前的FICO Xpress创造的纪录。
7/22/2025 10:38:02 AM

超越Claude 3.5和o1!8B模型靠「分层投票+测试时训练」逆袭

测试时训练(test-time training)是一种通用的训练方法。 该方法将单个未标记的测试实例转化为自监督学习问题,在对测试样本进行预测之前更新模型参数。 而对于大模型训练,通常会使用一种称为情境学习的技术来提高其模型在新任务上的性能。
7/22/2025 10:22:02 AM

深度解析 MEM1:开启智能体长时序高效交互之门

大家好,我是肆〇柒。 相信大家在落地AI应用的时候,对长上下文的处理时所遇到的挑战,都深有感触。 大型语言模型(LLM)于单轮任务中表现卓越,然而现实应用场景日益复杂,多轮交互需求剧增。
7/22/2025 4:00:00 AM
四零柒

深度解密国内BAS如何实现AI赋能的智能化安全验证攻防新范式!

在网络安全形势日益复杂、各类威胁不断涌现的当下,人工智能(AI)已然成为推动各行业数字化转型以及提升安全防御能力的关键力量。 AI正从根本上重塑BAS(入侵与攻击模拟),使其从传统的“模拟验证工具”进化为“智能对抗中枢”。 其核心价值在于:通过赋能动态攻击生成、自适应路径探索、智能化结果分析与自动化策略闭环,将BAS的全生命周期智能化。
7/22/2025 2:11:00 AM
安全牛