Adobe Premiere Pro 新增 AI 视觉识别搜索功能:一句话快速找到视频片段

今日 Adobe 为其视频编辑软件 Premiere Pro 引入了一项基于 AI 视觉识别的搜索功能,用户可以通过描述视频内容来快速查找相关片段。这一功能是 Adobe 在 Premiere Pro、After Effects 和 Frame.io 中新增的多项提升用户体验的功能之一,这些功能旨在帮助视频编辑者节省时间。

英国零售业拥抱自动化以降本增效,机器人包装工、AI 摄像头等逐渐普及

据英国《卫报》21 日报道,为了应对不断上涨的劳动力成本,英国零售商正加快采用电子货架标签、自动退货机、机器人包装工以及更多自助结账设备。

Claude 创始人:AI 全面超越人类,只剩 2-3 年

他认为,AI 确有可能在短期内替代部分人类的工作,但让 AI 与人类形成互补才是对生产力最有益的方式。

ChatGPT 每月产生 260 吨二氧化碳,与 260 趟纽约至伦敦航班碳排放相当

随着科技不断发展,进入 2025 年后,如何在技术创新和环境可持续性之间取得平衡,将成为科技企业和用户必须关注的核心议题。

谷歌母公司 Alphabet 总裁:美国 AI 技术未必会永远领先中国

据彭博社报道,Alphabet 公司总裁兼首席投资官鲁斯・波拉特(Ruth Porat)表示,美国在人工智能(AI)发展竞赛中未必能保持对中国的领先优势。

灵敏度高达94.9%!牛津团队AI多模态ctDNA检测方法,进行癌症早期筛查

编辑 | 2049在癌症诊疗的漫长征程中,早期检测始终是最具挑战性的环节之一,液体活检技术因其无创性和高灵敏度而备受关注。 然而,现有的检测方法大多依赖于深度靶向测序,难以同时整合多模态数据,导致检测灵敏度和特异性受限。 正是基于这一技术痛点,牛津大学的研究团队开发了一种基于全基因组 TET 辅助吡啶硼烷测序(TAPS)的多模态循环肿瘤 DNA(ctDNA)检测方法。

AI伪造论文渗透学术圈:Google Scholar成虚假科学温床,如何应对?

编辑 | 1984随着生成式 AI 技术的普及,学术界正面临着一个新的挑战:越来越多疑似由 AI 生成的研究论文正在渗透到学术期刊、档案库和知识库中。 这些论文通常借助 ChatGPT 等普及型 AI 应用来模仿学术写作风格,其危害不容忽视。 作为广受欢迎的学术搜索引擎,Google Scholar 在展示搜索结果时,并未区分这些可疑论文与经过严格质量把关的研究成果。

可灵视频生成可控性为什么这么好?快手又公开了四篇研究

可灵,视频生成领域的佼佼者,近来动作不断。 继发布可灵 1.6 后,又公开了多项研究揭示视频生成的洞察与前沿探索 ——《快手可灵凭什么频繁刷屏? 揭秘背后三项重要研究》。

「称霸」20年的谷歌翻译,一朝被小红书干沉默了

AI好好用报道编辑:杨文莲花脚皮片、硬气体毛……谷歌翻译闹出的那些国际笑话。 每天都在小红书上找乐子。 因为中外网友语言不通,唠嗑全倚仗谷歌翻译器。

百万 tokens 降至 0.8 元后,消息称字节跳动豆包大模型毛利率达 50%

据界面新闻今日援引多个知情人士消息称,字节跳动旗下的豆包大模型在去年大幅降价后,毛利率仍然为正。

阶跃星辰再拿多模态榜首,全方位升级发布六款模型

作者|朱可轩编辑|陈彩娴春节将近,各家厂商似乎都在争取休假前的最后一博,此时步入 2025 年也才半月有余,大模型玩家们已然卷上了新高度。 先是 OpenAI 打响了开年第一“枪”,ChatGPT 上线了新功能“Tasks”,主打提升了任务执行能力,之后国内一众厂商也先后发布了自家成果——月之暗面发布了全新的多模态图片理解模型 moonshot-v1-vision-preview;MiniMax 开源了基础语言模型 MiniMax-Text-01 和视觉多模态模型 MiniMax-VL-01;生数科技上新了视频大模型 Vidu 2.0;接着,智谱 AI 推出了端到端多模态大模型 GLM-Realtime;面壁智能带来了端侧多模态模型 MiniCPM-o 2.6;DeepSeek 开源了 DeepSeek-R1 推理模型......刚开年,模型更新便多到让人眼花缭乱,当中也不难发现,多模态、推理和端侧依旧是今年各家寻求突破的重点方向。 不得不提的是,在这一各厂商密集上新的“黄金节点”,AI 科技评论关注到,阶跃星辰一周内竟一口气批量更新了 6 款模型,全方位涵盖语言、语音、推理、图片理解、视频生成等多类别。

截胡 OpenAI:清华复旦等抢先开源智能体框架 Eko,一句话打造「虚拟员工」

清华、复旦和斯坦福的研究者联合提出了名为 Eko 的 Agent 开发框架,开发者可以通过简洁的代码和自然语言,快速构建可用于生产的「虚拟员工」。

36000亿元!OpenAI启动全球史上最大规模AI基础设施项目,英伟达软银甲骨文均参与

史上最大规模AI基础设施项目启动! 不久之前,OpenAI官宣了一项“星际之门”(The Stargate Project)计划——将与软银甲骨文组建合资公司,未来4年内总投资5000亿美元(约合3.64万亿元人民币)在美国建立多个AI数据中心。 该计划将立即启动,而且OpenAI一出手就准备先投它个1000亿美元。

几十个测试后,发现海螺语音与 ElevenLabs 掰手腕的能力不是盖的

试想一个场景,职场中接到一个香港客户的单子,但是在交付的过程中耽搁了时间,现在要进行线上沟通解释,那么你面对的情况大致是这样的:如果不对这段音频进行标注,可能大部分人会认为这一粤语、英语混用的片段是真实发生或从TVB电视剧里截出来的。 但其实,这是由 AI 完成的配音,背后所使用的工具是海螺语音。 今年 1 月,继 MiniMax 发布并开源基础语言大模型 MiniMax-Text-01 和视觉多模态大模型 MiniMax-VL-01 后,再次推出了升级的语音大模型 T2A-01 系列,搭载于海螺 AI 之上,开辟海螺语音板块。

深扒星际之门主角团:中东皇室也参与了!奥特曼搭上特朗普,至少5000亿开搞“星际之门”!大规模AI基建时代:带动数十万美国人就业

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)太炸裂了! 一早上刷到OpenAI奥特曼和特朗普同框了! 特朗普大手一挥,宣布了一个疯狂燃烧经费的AI项目——星际之门计划,将投资 "至少 "5000亿美元!

李飞飞:语言之外,另一半的智能还有待实现

「语言是人类的语言,而 3D 是自然的语言。 」「除了语言,我们还有另外一半智能,这部分非常深刻,就是我们做事的能力。 」「在 AI 之间加一个 G 以强调其通用性,我是尊重这个想法的。

1M长上下文,满血版Gemini 2.0又一次登上Chatbot Arena榜首

就在国内各家大模型厂商趁年底疯狂卷的时候,太平洋的另一端也没闲着。 就在今天,谷歌发布了 Gemini 2.0 Flash Thinking 推理模型的加强版,并再次登顶 Chatbot Arena 排行榜。 谷歌 AI 掌门人 Jeff Dean 亲发贺信:「我们在此实验性更新中引入了 1M 长的上下文,以便对长篇文本(如多篇研究论文或大量数据集)进行更深入的分析。

化解机器人的「幻觉」:北大发布OmniManip,VLM结合双闭环系统,3D理解能力大幅提升

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。