应用
Pika 1.5王者归来!将一切压扁、膨胀、融化、爆炸,化身为了超强特效利器
「I am back !」去年 11 月,「横空出世」的 Pika 展现出了令人惊艳的视频生成效果,并点燃了视频生成领域。今年 6 月 5 日,Pika 宣布已完成 8000 万美元(约合人民币 5.8 亿元)的 B 轮融资,总融资额达到 1.35 亿美元,较 2023 年末,公司投后估值实现翻倍至 4.7 亿美元。但是,面对以 Sora 为代表的各种「后辈」视频生成模型的冲击,Pika 迟迟没有大的版本更新。就在几个小时前,Pika 官方推特(X)时隔数月后,终于「发声」了。新版本 Pika 1.5 正式与大家见
10/2/2024 11:55:00 AM
机器之心
乏善可陈的第二届OpenAI开发者大会,果然没有掀起太大波澜
OpenAI宫斗后的 DevDay 开发者大会,没有什么惊喜。OpenAI 的宫斗大戏刚落下帷幕,今日凌晨就在旧金山召开了第二届 DevDay 开发者大会。不过,与去年盛大的活动相比,今年略显低调,他们没有推出重大产品,而是选择对其现有的 AI 工具和 API 进行增量改进。在这次活动中,OpenAI 发布了四大API新功能:视觉微调(Vision Fine-Tuning)、实时 API(Realtime API)、模型蒸馏(Model Distillation)和提示缓存(Prompt Caching)。这些新工
10/2/2024 11:37:00 AM
机器之心
mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVA
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文作者来自香港科技大学、香港大学和华为诺亚方舟实验室等机构。其中第一作者陈铠、苟耘豪、刘智立为香港科技大学在读博士生,黄润辉为香港大学在读博士生,谭达新为诺亚方舟实验室研究员。随着 Op
10/2/2024 11:34:00 AM
机器之心
非 Transformer 架构 AI 模型 Liquid 问世,号称性能“凌驾 Meta Llama / 微软 Phi”
去年刚成立的 Liquid AI 公司于 9 月 30 日发布了三款 Liquid 基础模型(Liquid Foundation Models,LFM),分别为 LFM-1.3B、LFM-3.1B 和 LFM-40.3B。这些模型均采用非 Transformer 架构,号称在基准测试中凌驾同规模的 Transformer 模型。AI在线注意到,目前业界在深度学习和自然语言处理方面主要使用 Transformer 架构,该架构主要利用自注意力机制捕捉序列中单词之间的关系,包括 OpenAI 的 GPT、Meta 的
10/2/2024 11:28:46 AM
漾仔
安卓版谷歌 Gemini Live 上线,助力 AI 开启全民语音聊天时代
谷歌公司昨日(10 月 1 日)在 X 平台发布推文,宣布通过 Gemini 应用,现面向所有安卓用户开放 Gemini Live 功能。AI在线曾于 8 月报道,谷歌在 Pixel 9 系列手机发布会上,发布了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式,采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。需要注意的是,目前仅
10/2/2024 9:14:09 AM
故渊
OpenAI 引领 AI 浪潮:o1 模型可处理 5 小时任务,颠覆营销思维和模式
科技媒体 The Decoder 昨日(9 月 30 日)发布博文,报道称在 Hubspot 的 Inbound 活动上,OpenAI 战略营销负责人 Dane Vahey 表示 o1 模型可以处理 5 小时的任务。营销人员需要提高 AI 技能Vahey 认为,随着营销任务变得越来越复杂,人工智能正变得越来越重要,专业人士需要以更低的获取成本和更少的资源实现相同的结果。虽然许多公司已经在营销中使用人工智能,特别是在内容创作方面,但 Vahey 认为市场营销人员应该发展更广泛的人工智能技能,这些技能包括研究、数据分析
10/1/2024 2:28:39 PM
故渊
微软 Copilot 变身新闻主播:时长 4 分钟、4 种语音,AI 网罗热点和用户偏好信息
科技媒体 Windows Latest 今天(10 月 1 日)发布博文,报道称微软公司借鉴 Perplexity AI 的 Discover Daily,推出了名为“Copilot Daily”的全新新闻播客功能。Discover DailyPerplexity AI 的 Discover Daily 是由 AI 生成的播客节目,每天上线一期,节目时长约 8 分钟,有两个 AI 主持人,由 ElevenLabs 的 AI 提供支持。Perplexity 的 Discover Daily 基于其 Discover
10/1/2024 1:52:26 PM
故渊
macOS 原生版 Perplexity 本月 15 日上线:AI 颠覆搜索体验,重塑苹果 Mac 用户知识管理
科技媒体 9to5Mac 昨日(9 月 30 日)发布博文,报道称 Perplexity AI 计划 10 月推出 macOS 原生版 AI 搜索引擎 Perplexity,并支持用户通过 Mac App Store 下载。Perplexity 平台成立于 2022 年,它是一款生成式 AI 搜索引擎,通过大语言模型提供更卓越的搜索结果,以提供准确的答案和更好地总结网页内容而脱颖而出。AI在线查询公开信息,Perplexity 目前已以预览版的形式,上架 Mac App Store,感兴趣的用户可以访问这里尝试体验
10/1/2024 10:21:12 AM
故渊
谷歌安卓版 Gemini AI 现支持浮动 / 分屏操作,三星 Galaxy Z Fold6 折叠手机限时独享
科技记者 Mishaal Rahman 昨日(9 月 30 日)发布博文,报道称在三星 Galaxy Z Fold6 折叠屏手机上,通过升级最新 Gemini AI 助手应用,可以实现分屏或者浮动窗口操作。用户升级新版 Gemini 应用之后,浮动叠加层顶部有一条小白条,显示用户当前可以像常规安卓应用一样操作 Gemini,不仅支持变为浮动窗口,还支持上下、左右分屏。三星首次在其最新的 Unpacked 活动中展示了这一功能。这表明该功能可能暂时仅限于某些三星设备,Gemini 目前已知仅支持三星 Galaxy Z
10/1/2024 8:04:49 AM
故渊
索尼 PlayStation 将使用更多 AI 技术,实现游戏开发降本增效
据 Insider Gaming 28 日报道,在索尼公司本月发布的《2024 年企业报告》中,索尼提出了未来的愿景 —— 要成为一家适应社会变革和技术发展的娱乐公司,AI 和机器学习将在 PlayStation 发挥核心作用,尤其是在游戏领域。报告举例说,在《漫威蜘蛛侠 2》的制作过程中,工作人员就使用了语音识别软件来自动同步字幕和人物对话,大大缩短了开发过程。据了解,索尼的目标是在不影响质量的前提下加快流程、降低成本,为此还计划将实时 3D 处理和传感器技术等技术整合到游戏开发中。“今后,我们计划在集团内跨职能
9/30/2024 11:03:38 PM
清源
软银大手笔,被曝将向 OpenAI 投资 5 亿美元
感谢北京时间今晚,据 The Information 援引知情人士消息称,软银的愿景基金(Vision Fund)已经同意向 OpenAI 的最新一轮融资投资 5 亿美元(AI在线备注:当前约 34.96 亿元人民币)。在投资前,OpenAI 的估值为 1500 亿美元(当前约 1.05 万亿元人民币),这笔交易是软银对其的首次投资。软银加入了领投方 Thrive Capital 的行列,后者在本轮融资中的投资额超过 10 亿美元(当前约 69.92 亿元人民币)。据悉,Tiger Global Managemen
9/30/2024 9:52:55 PM
清源
全球首家 AI 艺术博物馆明年开幕:位于美国洛杉矶,将推广“伦理 AI”
感谢据《卫报》25 日报道,传媒艺术家 Refik Anadol 宣布将在美国洛杉矶开设全球首家人工智能艺术博物馆,该馆将突出“人类想象力与机器创造潜力”的交汇点。该馆被命名为“Dataland”,预计 2025 年底开幕,毗邻当代艺术博物馆、布罗德博物馆和洛杉矶爱乐乐团所在地,将在洛杉矶最负盛名的文化场所中为 AI 艺术创造一个空间。Refik Anadol 承诺,该博物馆将推广“伦理 AI”,使用可再生能源。他和他的艺术家、技术专家团队希望通过 Dataland 重塑 AI 时代的博物馆,同时突出展示数字艺术家
9/30/2024 8:49:15 PM
清源
消息称字节跳动计划使用华为芯片训练新的 AI 模型
北京时间今天下午,据路透社援引三名知情人士消息称,字节跳动计划为 TikTok 开发一种新的 AI 模型,主要使用来自华为的芯片进行训练。报道称,字节跳动现已将目光转向中国国内 AI 芯片供应商,同时也加快自主研发的步伐。在这场 AI 竞赛中,字节跳动的下一步动作是使用华为昇腾 910B 芯片来训练 AI 大模型。第四位知情人士也称,字节跳动计划建设一个新的 AI 模型,但“不能透露”是否会使用华为芯片。前述三位知情人士表示,字节跳动已经开始使用昇腾 910B 芯片,主要用于计算密集度较低的推理任务,即利用预先训练
9/30/2024 4:57:44 PM
清源
OpenAI 想转成营利性公司,这一操作被指极为复杂
9 月 30 日消息,人工智能研究机构 OpenAI 计划转型为营利性公司,目的是简化公司架构和运营模式。然而,实现这一目标的过程极其复杂。图源 Pexels作为热门聊天机器人 ChatGPT 的开发商,OpenAI 正在筹集 65 亿美元资金,投资者包括微软、英伟达、风险投资机构以及阿联酋的一家国有企业。谈判中的一项重要条款是,目前由非营利组织管理的 OpenAI 必须在两年内转型为公益性公司。这意味着 OpenAI 需要在创造社会效益的同时实现盈利。如果未能转型成功,投资者可以收回资金。为了实现这一目标,Ope
9/30/2024 4:32:42 PM
辰辰
下注端到端:一场具身智能的谨慎豪赌
作者 | 赖文昕编辑 | 陈彩娴上个月末,世界机器人大会(WRC 2024)在北京刚刚结束,27 款人形机器人果然成为了会场中的主角。 夹爪叠衣服、做汉堡,灵巧手抓鸡蛋、演手舞,轮式进商超,双足满场逛......在这场硅基生命的大 party 里,人形机器人们的才艺都得到了充分的展示,特别是在操作能力上有了显著提升。 在具身智能时代,人形机器人代表着人类创造者对通用机器人终极形态的一大向往。
9/30/2024 3:22:00 PM
赖文昕
独家 | 腾讯 Robotics X 控制负责人郑宇近日离职,已加入优必选
作者:赖文昕编辑:陈彩娴据悉,郑宇由周剑亲自出马邀请加入,将带领整个双足人形机器人团队。 纵观个人履历,郑宇深耕机器人领域27年。 1997年,郑宇入读上海交通大学机械工程系,开始了在上交大本硕博的校园生活;2007年,郑宇获得上交大机电学博士学位,并在同年10月来到新加坡国立大学,担任了1年10个月的博士后研究员;2009年8月,郑宇前往美国北卡罗来纳大学教堂山分校继续深造,用四年时间拿到了计算机博士学位,与逐际动力首席科学家、香港大学计算机系副教授潘佳为同学;从2010年5月至2014年8月,郑宇前后四次加入匹兹堡迪士尼研究中心,期间参与了多个项目,包括 Sarcos 人形机器人在滚动圆筒上的平衡控制和行走运动生成,机器人手机制和配置的抓握质量评估,以及各种几何算法在机器人中的应用,如射线射击算法和距离计算算法;2014年9月,郑宇入职密歇根大学戴尔伯恩分校,任电气与计算机工程学院助理教授;2018年9月,郑宇受张正友之邀来到深圳,加入Robotics X实验室,离职前为首席研究科学家、控制中心负责人。
9/30/2024 3:06:00 PM
赖文昕
我国无锡超算“太湖之光 A+”项目亮相:算力密度国内最高,单个机柜达 40P
以“聚智向新算领未来”为主题的 2024 中国算力大会 9 月 27 日至 29 日在河南郑州举行。会上,中国算力领域“年度重大成果”发布,共有 8 项突破性意义的成果上榜,其中包括国家超级计算无锡中心的“太湖之光 A ”项目。据介绍,太湖之光 A 基于异构众核架构的国产智算加速卡,自研业内最高密度一体化服务器机柜方案,单个机柜算力达到 40P 国产智能算力。算力密度国内最高,采用集中式供电,单机柜功耗达 100KW。国家超级计算无锡中心表示:“太湖之光 A 的高密设计是 HPC AI 领域的重要标杆案例,
9/30/2024 2:20:16 PM
汪淼
SB 1047尘埃落定!州长否决,李飞飞等人有了新使命
刚刚,被讨论了大半年的 SB 1047 终于迎来了大结局:加州州长 Gavin Newsom 否决了该法案。SB 1047 全称是「Safe and Secure Innovation for Frontier Artificial Intelligence Act(《前沿人工智能模型安全创新法案》)」,旨在为高风险的 AI 模型建立明确的安全标准,以防止其被滥用或引发灾难性后果。具体来说,该法案旨在从模型层面对人工智能进行监管,适用于在特定计算和成本阈值之上训练的模型。但如果严格按照规定的计算和成本阈值来算,现在
9/30/2024 2:08:00 PM
机器之心
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
LLaMA
Copilot
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind