AI在线 AI在线

应用

Pika 1.5王者归来!将一切压扁、膨胀、融化、爆炸,化身为了超强特效利器

「I am back !」去年 11 月,「横空出世」的 Pika 展现出了令人惊艳的视频生成效果,并点燃了视频生成领域。今年 6 月 5 日,Pika 宣布已完成 8000 万美元(约合人民币 5.8 亿元)的 B 轮融资,总融资额达到 1.35 亿美元,较 2023 年末,公司投后估值实现翻倍至 4.7 亿美元。但是,面对以 Sora 为代表的各种「后辈」视频生成模型的冲击,Pika 迟迟没有大的版本更新。就在几个小时前,Pika 官方推特(X)时隔数月后,终于「发声」了。新版本 Pika 1.5 正式与大家见
10/2/2024 11:55:00 AM
机器之心

乏善可陈的第二届OpenAI开发者大会,果然没有掀起太大波澜

OpenAI宫斗后的 DevDay 开发者大会,没有什么惊喜。OpenAI 的宫斗大戏刚落下帷幕,今日凌晨就在旧金山召开了第二届 DevDay 开发者大会。不过,与去年盛大的活动相比,今年略显低调,他们没有推出重大产品,而是选择对其现有的 AI 工具和 API 进行增量改进。在这次活动中,OpenAI 发布了四大API新功能:视觉微调(Vision Fine-Tuning)、实时 API(Realtime API)、模型蒸馏(Model Distillation)和提示缓存(Prompt Caching)。这些新工
10/2/2024 11:37:00 AM
机器之心

mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVA

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本文作者来自香港科技大学、香港大学和华为诺亚方舟实验室等机构。其中第一作者陈铠、苟耘豪、刘智立为香港科技大学在读博士生,黄润辉为香港大学在读博士生,谭达新为诺亚方舟实验室研究员。随着 Op
10/2/2024 11:34:00 AM
机器之心

非 Transformer 架构 AI 模型 Liquid 问世,号称性能“凌驾 Meta Llama / 微软 Phi”

去年刚成立的 Liquid AI 公司于 9 月 30 日发布了三款 Liquid 基础模型(Liquid Foundation Models,LFM),分别为 LFM-1.3B、LFM-3.1B 和 LFM-40.3B。这些模型均采用非 Transformer 架构,号称在基准测试中凌驾同规模的 Transformer 模型。AI在线注意到,目前业界在深度学习和自然语言处理方面主要使用 Transformer 架构,该架构主要利用自注意力机制捕捉序列中单词之间的关系,包括 OpenAI 的 GPT、Meta 的
10/2/2024 11:28:46 AM
漾仔

安卓版谷歌 Gemini Live 上线,助力 AI 开启全民语音聊天时代

谷歌公司昨日(10 月 1 日)在 X 平台发布推文,宣布通过 Gemini 应用,现面向所有安卓用户开放 Gemini Live 功能。AI在线曾于 8 月报道,谷歌在 Pixel 9 系列手机发布会上,发布了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式,采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。需要注意的是,目前仅
10/2/2024 9:14:09 AM
故渊

OpenAI 引领 AI 浪潮:o1 模型可处理 5 小时任务,颠覆营销思维和模式

科技媒体 The Decoder 昨日(9 月 30 日)发布博文,报道称在 Hubspot 的 Inbound 活动上,OpenAI 战略营销负责人 Dane Vahey 表示 o1 模型可以处理 5 小时的任务。营销人员需要提高 AI 技能Vahey 认为,随着营销任务变得越来越复杂,人工智能正变得越来越重要,专业人士需要以更低的获取成本和更少的资源实现相同的结果。虽然许多公司已经在营销中使用人工智能,特别是在内容创作方面,但 Vahey 认为市场营销人员应该发展更广泛的人工智能技能,这些技能包括研究、数据分析
10/1/2024 2:28:39 PM
故渊

微软 Copilot 变身新闻主播:时长 4 分钟、4 种语音,AI 网罗热点和用户偏好信息

科技媒体 Windows Latest 今天(10 月 1 日)发布博文,报道称微软公司借鉴 Perplexity AI 的 Discover Daily,推出了名为“Copilot Daily”的全新新闻播客功能。Discover DailyPerplexity AI 的 Discover Daily 是由 AI 生成的播客节目,每天上线一期,节目时长约 8 分钟,有两个 AI 主持人,由 ElevenLabs 的 AI 提供支持。Perplexity 的 Discover Daily 基于其 Discover
10/1/2024 1:52:26 PM
故渊

macOS 原生版 Perplexity 本月 15 日上线:AI 颠覆搜索体验,重塑苹果 Mac 用户知识管理

科技媒体 9to5Mac 昨日(9 月 30 日)发布博文,报道称 Perplexity AI 计划 10 月推出 macOS 原生版 AI 搜索引擎 Perplexity,并支持用户通过 Mac App Store 下载。Perplexity 平台成立于 2022 年,它是一款生成式 AI 搜索引擎,通过大语言模型提供更卓越的搜索结果,以提供准确的答案和更好地总结网页内容而脱颖而出。AI在线查询公开信息,Perplexity 目前已以预览版的形式,上架 Mac App Store,感兴趣的用户可以访问这里尝试体验
10/1/2024 10:21:12 AM
故渊

谷歌安卓版 Gemini AI 现支持浮动 / 分屏操作,三星 Galaxy Z Fold6 折叠手机限时独享

科技记者 Mishaal Rahman 昨日(9 月 30 日)发布博文,报道称在三星 Galaxy Z Fold6 折叠屏手机上,通过升级最新 Gemini AI 助手应用,可以实现分屏或者浮动窗口操作。用户升级新版 Gemini 应用之后,浮动叠加层顶部有一条小白条,显示用户当前可以像常规安卓应用一样操作 Gemini,不仅支持变为浮动窗口,还支持上下、左右分屏。三星首次在其最新的 Unpacked 活动中展示了这一功能。这表明该功能可能暂时仅限于某些三星设备,Gemini 目前已知仅支持三星 Galaxy Z
10/1/2024 8:04:49 AM
故渊

索尼 PlayStation 将使用更多 AI 技术,实现游戏开发降本增效

据 Insider Gaming 28 日报道,在索尼公司本月发布的《2024 年企业报告》中,索尼提出了未来的愿景 —— 要成为一家适应社会变革和技术发展的娱乐公司,AI 和机器学习将在 PlayStation 发挥核心作用,尤其是在游戏领域。报告举例说,在《漫威蜘蛛侠 2》的制作过程中,工作人员就使用了语音识别软件来自动同步字幕和人物对话,大大缩短了开发过程。据了解,索尼的目标是在不影响质量的前提下加快流程、降低成本,为此还计划将实时 3D 处理和传感器技术等技术整合到游戏开发中。“今后,我们计划在集团内跨职能
9/30/2024 11:03:38 PM
清源

软银大手笔,被曝将向 OpenAI 投资 5 亿美元

感谢北京时间今晚,据 The Information 援引知情人士消息称,软银的愿景基金(Vision Fund)已经同意向 OpenAI 的最新一轮融资投资 5 亿美元(AI在线备注:当前约 34.96 亿元人民币)。在投资前,OpenAI 的估值为 1500 亿美元(当前约 1.05 万亿元人民币),这笔交易是软银对其的首次投资。软银加入了领投方 Thrive Capital 的行列,后者在本轮融资中的投资额超过 10 亿美元(当前约 69.92 亿元人民币)。据悉,Tiger Global Managemen
9/30/2024 9:52:55 PM
清源

全球首家 AI 艺术博物馆明年开幕:位于美国洛杉矶,将推广“伦理 AI”

感谢据《卫报》25 日报道,传媒艺术家 Refik Anadol 宣布将在美国洛杉矶开设全球首家人工智能艺术博物馆,该馆将突出“人类想象力与机器创造潜力”的交汇点。该馆被命名为“Dataland”,预计 2025 年底开幕,毗邻当代艺术博物馆、布罗德博物馆和洛杉矶爱乐乐团所在地,将在洛杉矶最负盛名的文化场所中为 AI 艺术创造一个空间。Refik Anadol 承诺,该博物馆将推广“伦理 AI”,使用可再生能源。他和他的艺术家、技术专家团队希望通过 Dataland 重塑 AI 时代的博物馆,同时突出展示数字艺术家
9/30/2024 8:49:15 PM
清源

消息称字节跳动计划使用华为芯片训练新的 AI 模型

北京时间今天下午,据路透社援引三名知情人士消息称,字节跳动计划为 TikTok 开发一种新的 AI 模型,主要使用来自华为的芯片进行训练。报道称,字节跳动现已将目光转向中国国内 AI 芯片供应商,同时也加快自主研发的步伐。在这场 AI 竞赛中,字节跳动的下一步动作是使用华为昇腾 910B 芯片来训练 AI 大模型。第四位知情人士也称,字节跳动计划建设一个新的 AI 模型,但“不能透露”是否会使用华为芯片。前述三位知情人士表示,字节跳动已经开始使用昇腾 910B 芯片,主要用于计算密集度较低的推理任务,即利用预先训练
9/30/2024 4:57:44 PM
清源

OpenAI 想转成营利性公司,这一操作被指极为复杂

9 月 30 日消息,人工智能研究机构 OpenAI 计划转型为营利性公司,目的是简化公司架构和运营模式。然而,实现这一目标的过程极其复杂。图源 Pexels作为热门聊天机器人 ChatGPT 的开发商,OpenAI 正在筹集 65 亿美元资金,投资者包括微软、英伟达、风险投资机构以及阿联酋的一家国有企业。谈判中的一项重要条款是,目前由非营利组织管理的 OpenAI 必须在两年内转型为公益性公司。这意味着 OpenAI 需要在创造社会效益的同时实现盈利。如果未能转型成功,投资者可以收回资金。为了实现这一目标,Ope
9/30/2024 4:32:42 PM
辰辰

下注端到端:一场具身智能的谨慎豪赌

作者 | 赖文昕编辑 | 陈彩娴上个月末,世界机器人大会(WRC 2024)在北京刚刚结束,27 款人形机器人果然成为了会场中的主角。 夹爪叠衣服、做汉堡,灵巧手抓鸡蛋、演手舞,轮式进商超,双足满场逛......在这场硅基生命的大 party 里,人形机器人们的才艺都得到了充分的展示,特别是在操作能力上有了显著提升。 在具身智能时代,人形机器人代表着人类创造者对通用机器人终极形态的一大向往。
9/30/2024 3:22:00 PM
赖文昕

独家 | 腾讯 Robotics X 控制负责人郑宇近日离职,已加入优必选

作者:赖文昕编辑:陈彩娴据悉,郑宇由周剑亲自出马邀请加入,将带领整个双足人形机器人团队。 纵观个人履历,郑宇深耕机器人领域27年。 1997年,郑宇入读上海交通大学机械工程系,开始了在上交大本硕博的校园生活;2007年,郑宇获得上交大机电学博士学位,并在同年10月来到新加坡国立大学,担任了1年10个月的博士后研究员;2009年8月,郑宇前往美国北卡罗来纳大学教堂山分校继续深造,用四年时间拿到了计算机博士学位,与逐际动力首席科学家、香港大学计算机系副教授潘佳为同学;从2010年5月至2014年8月,郑宇前后四次加入匹兹堡迪士尼研究中心,期间参与了多个项目,包括 Sarcos 人形机器人在滚动圆筒上的平衡控制和行走运动生成,机器人手机制和配置的抓握质量评估,以及各种几何算法在机器人中的应用,如射线射击算法和距离计算算法;2014年9月,郑宇入职密歇根大学戴尔伯恩分校,任电气与计算机工程学院助理教授;2018年9月,郑宇受张正友之邀来到深圳,加入Robotics X实验室,离职前为首席研究科学家、控制中心负责人。
9/30/2024 3:06:00 PM
赖文昕

我国无锡超算“太湖之光 A+”项目亮相:算力密度国内最高,单个机柜达 40P

以“聚智向新算领未来”为主题的 2024 中国算力大会 9 月 27 日至 29 日在河南郑州举行。会上,中国算力领域“年度重大成果”发布,共有 8 项突破性意义的成果上榜,其中包括国家超级计算无锡中心的“太湖之光 A ”项目。据介绍,太湖之光 A 基于异构众核架构的国产智算加速卡,自研业内最高密度一体化服务器机柜方案,单个机柜算力达到 40P 国产智能算力。算力密度国内最高,采用集中式供电,单机柜功耗达 100KW。国家超级计算无锡中心表示:“太湖之光 A 的高密设计是 HPC AI 领域的重要标杆案例,
9/30/2024 2:20:16 PM
汪淼

SB 1047尘埃落定!州长否决,李飞飞等人有了新使命

刚刚,被讨论了大半年的 SB 1047 终于迎来了大结局:加州州长 Gavin Newsom 否决了该法案。SB 1047 全称是「Safe and Secure Innovation for Frontier Artificial Intelligence Act(《前沿人工智能模型安全创新法案》)」,旨在为高风险的 AI 模型建立明确的安全标准,以防止其被滥用或引发灾难性后果。具体来说,该法案旨在从模型层面对人工智能进行监管,适用于在特定计算和成本阈值之上训练的模型。但如果严格按照规定的计算和成本阈值来算,现在
9/30/2024 2:08:00 PM
机器之心