应用
毫末龙年春节智驾数据发布:智驾里程994万公里,小魔驼配送近5000单
2月24日,毫末智行公布了2024年智能驾驶春节数据报告。自2024年2月10日至2月23日,用户开启毫末辅助驾驶的行驶总里程突破994万公里,同比2023年春节激增283.4%。在末端物流自动配送领域,小魔驼配送订单比2023年春节同比增长9.2%。截止2024年2月,毫末累计智驾里程突破1.3亿公里,小魔驼累计配送订单近30万。自动驾驶伴随春节出行、购物配送等更多场景,让生活更美好。目前,毫末辅助驾驶产品HPilot已搭载超过20款车型,为用户出行提供了从高速到城市的全方位智慧体验。报告数据显示,春节期间,毫末
2/26/2024 10:19:00 AM
新闻助手
新模型 Stable Diffusion 3 与 Stable Cascade 全面解析
大家好,我是花生~
最近 Stability AI 又接连推出了 2 个新的模型:Stable Diffusion 3 和 Stable Cascade,在图像生成效率和质量上比半年前推出的 SDXL 1.0 有了明显提升,今天就为大家介绍一下 2 款新模型的特点和用法。
:一、Stable Diffusion 3 简介
官方介绍:
加入等候名单:
2 月 22 号,Stability AI 发布了新模型 Stable Diffusion 3(下面简称为 SD 3.0),这也是 Stable Diffusion
2/26/2024 8:13:29 AM
夏花生
7000字干货!Sora 提示词秘籍和竞品效果对比
2024 年 2 月 16 日凌晨,OpenAI 正式发布了文本到视频生成模型 Sora,直接生成 60s 视频,多角色多镜头切换的视频,还上了央视新闻。
目前 Sora 并未开放,只向少数导演艺术家开放邀请码。
至此,好莱坞的时代结束了,人人可以做视频电影的时代到来啦!
今天我们就 Sora 生成视频来拆解提示词秘籍公式,竞品视频生成效果对比,解析 Sora 优势劣势和 Sora 模型原理。一、AIGC 视频模型效果对比
首先让我们看看,目前主流的 AI 视频工具 Runway、Pika、Stable Video
2/26/2024 7:38:08 AM
yaoyao
幼儿园学历都能看懂! Sora 技术原理科普
本文来源于公众号赛博禅心 ,作者金色传说大聪明
写在前面本文的阅读门槛很高,需要至少幼儿园毕业
本文讲述 Sora 的 Spacetime Patches 技术,此处意义为时空碎片
图片主要来自《哆啦 A 梦:二次元口袋照相机》
OpenAI 好棒,哆啦 A 梦好棒,我好棒!大雄慵懒地躺在房间的地毯上,眼神迷离地看着天花板上的光斑。他翻来覆去地玩着手中的老旧玩具小兵,回想着上个暑假和小伙伴们的那场刺激的野营冒险。大雄:“哆啦 A 梦,那次野营真的很好玩,但我现在只能记得一点点。要是能有办法随时重温那种感觉就好了。”
2/26/2024 1:29:58 AM
从手机到AI PC,大模型时代荣耀要用AI使能全场景
2023年,ChatGPT为代表的大模型技术将AI浪潮推向了新高度。进入2024年,以OpenAI发布视频大模型Sora为开端,又开启了全球新一年大模型技术的竞争。持续的技术突破,让我们对大模型技术的普遍应用充满期待,特别是在手机、PC这样的端侧。于是今年的MWC,各大手机厂商的AI或者说大模型战略非常值得关注。刚刚,荣耀在2024 MWC世界移动通信大会上正式发布了全新的AI使能的全场景战略,推出平台级AI赋能,以人为中心的跨操作系统体验和基于意图识别的全新人机交互。而后,荣耀也发布了荣耀Magic6 Pro,A
2/26/2024 12:07:00 AM
李亚洲
8/8/6/3的Mamba论文,最终还是被ICLR 2024拒了,网友:悬着的心终于死了
几天前,ICLR 2024 的最终接收结果出来了。大家应该还记得,Mamba 被 ICLR 2024 大会 Decision Pending(待定)的消息在 1 月份引发过一波社区热议。当时,多位领域内的研究者分析,Decision Pending 的意思是延迟决定,虽然也可能会被拒,但这篇论文得到了 8/8/6/3 的打分,按理说不至于真被拒。论文审稿页面:,Decision 已出,Mamba 彻底被拒,悬着的心终于死了。「Mamba」发布之初即被视为「Transformer 的强劲竞争者」,它是一种选择性状态空
2/25/2024 8:06:00 PM
机器之心
香港也有大模型公司了,天使轮估值一亿美金!
近日,获悉多模态大模型初创公司香港 Weitu AI 公司完成了天使轮融资,天使轮估值一亿美金。天使轮投资人为拥有全球数亿月活的互联网科技公司和著名天使投资人。据了解,该公司目前刚刚成立,超过半数成员来自北美名校毕业并拥有海外大厂的工作经验。团队成员中包括了数位长期活跃在人工智能多模态领域的研究专家以及拥有大模型基础研发能力的技术专家。据 Weitu AI 公司创始人王历伟博士介绍,“多模态大模型的研发最重要的是两种能力需要同时具备,一种是基础的大模型的研发能力,一种是长期专注的多模态能力,对多模态数据,建模,任务
2/25/2024 8:00:00 PM
机器之心
谷歌Gemini生图功能紧急关闭,口碑一夜塌房,Yann LeCun:我早就知道
Gemini 好像终于被玩坏了。去年年底,谷歌 Gemini 震撼了业界,它是谷歌「最大、最有能力和最通用」的 AI 系统,号称第一个原生多模态大模型,能力超越 GPT-4,也被认为是谷歌反击微软和 OpenAI 的强大工具。对此,在 2 月 8 日,谷歌还把自家对标 ChatGPT 的服务 Bard 更名为 Gemini,以着重体现新使命 —— 旨在提供对「最强模型系列」的访问。上周谷歌还火速更新了 Gemini Pro 1.5 版。结果,推出不到一个月,这个 Gemini 就翻车了。多离谱呢,作为一个多模态的生
2/25/2024 7:49:00 PM
机器之心
补齐Transformer规划短板,田渊栋团队的Searchformer火了
Transformer 强大的泛化能力再次得到证明!最近几年,基于 Transformer 的架构在多种任务上都表现卓越,吸引了世界的瞩目。使用这类架构搭配大量数据,得到的大型语言模型(LLM)等模型可以很好地泛化用于真实世界用例。尽管有如此成功,但基于 Transformer 的架构和 LLM 依然难以处理规划和推理任务。之前已有研究证明 LLM 难以应对多步规划任务或高阶推理任务。为了提升 Transformer 的推理和规划性能,近些年研究社区也提出了一些方法。一种最常见且有效的方法是模拟人类的思考过程:先生
2/25/2024 7:45:00 PM
机器之心
下个爆点人形机器人?OpenAI、英伟达、贝索斯向同一家公司投了6.7亿刀
Figure AI 在本轮融资之前,估值就已有 20 亿美元了。生成式 AI 的竞争如火如荼,各家科技公司和机构也没有忘记投资下一个热点。本周五,彭博社援引消息人士的话报道称,亚马逊创始人杰夫・贝索斯、英伟达和其他大型科技公司正在不约而同地投资初创公司 Figure AI,该公司旨在开发人形机器人。该公司的产品 Figure 01,据称是世界上第一个具有商业可行性的自主人形机器人,身高 1.5 米,体重 60 公斤,可承载 20 公斤货物,采用电机驱动。它的可工作时长是 5 小时,行走速度每秒 1.2 米,可以说很
2/25/2024 7:42:00 PM
机器之心
AAAI 2024杰出论文奖出炉:西安电子科技大学获奖
让我们恭喜获奖者!本周,全球 AI 顶会 AAAI 2024 正式开幕,目前已公布了最佳论文(Outstanding Paper Award)等多个重要奖项。AAAI 全称为国际先进人工智能协会 (Association for the Advancement of Artificial Intelligence),其每年举办的现场会议是人工智能领域里历史最悠久、涵盖内容最广泛的的国际顶级学术会议之一,今年已是第 38 届。据中国计算机学会推荐国际学术会议和期刊目录,AAAI 为人工智能领域的 A 类会议。据了解,
2/25/2024 7:39:00 PM
机器之心
国内高校打造类Sora模型VDT,通用视频扩散Transformer被ICLR 2024接收
2 月 16 日,OpenAI Sora 的发布无疑标志着视频生成领域的一次重大突破。Sora 基于 Diffusion Transformer 架构,和市面上大部分主流方法(由 2D Stable Diffusion 扩展)并不相同。为什么 Sora 坚持使用 Diffusion Transformer,其中的原因从同时期发表在 ICLR 2024(VDT: General-purpose Video Diffusion Transformers via Mask Modeling)的论文可以窥见一二。这项工作由
2/25/2024 7:36:00 PM
机器之心
推出不到一个月,谷歌Gemini翻车了
机器之能报道编辑:Sia谷歌下架 Gemini 人物图像生成服务。三月前,谷歌 Gemini 轰轰烈烈亮相,被描述为谷歌“最大、最有能力和最通用”的 AI 系统,并补充说它具有复杂的推理和编码能力。2 月 8 日,谷歌聊天机器人 Bard 正式更名为 Gemini,以反映新聊天机器人的“使命”——提供对“最有能力的模型系列”的访问。结果,推出不到一个月,Gemini 就捅了个大篓子。用户使用人像生成服务时发现,让 Gemini 承认白人的存好像非常困难,AI 拒绝在图像中描绘白人,以至于生成不少违背基本事实(性别、
2/23/2024 6:20:00 PM
机器之能
2770亿美元,英伟达创史上最大单日涨幅,黄仁勋:生成式AI已到临界点
老黄即将跻身全球前 20 富豪行列。英伟达,现在已是「地球上最重要的一支股票」了。本周四,英伟达市值单日暴涨 2770 亿美元。这是华尔街历史上最大的股票单日涨幅,这家重量级芯片公司的最新季度报告超出了预期,点燃了人们对于人工智能的乐观情绪。 单日成交金额 659 亿美元,约合 4700 亿人民币。该公司股价飙升了 16.4% 收于 785.38 美元,创历史新高。其总市值升至 1.96 万亿美元,再次超越谷歌(Alphabet)成为全球第三大市值公司
2/23/2024 11:28:00 AM
机器之心
Stable Diffusion 3震撼发布,采用Sora同源技术,文字终于不乱码了
Stable Diffusion 3 和 Sora 一样采用了 diffusion transformer 架构。继 OpenAI 的 Sora 连续一周霸屏后,昨晚,生成式 AI 顶级技术公司 Stability AI 也放了一个大招 ——Stable Diffusion 3。该公司表示,这是他们最强大的文生图模型。与之前的版本相比,Stable Diffusion 3 生成的图在质量上实现了很大改进,支持多主题提示,文字书写效果也更好了。以下是一些官方示例:提示:史诗般的动漫作品,一位巫师在夜晚的山顶上向漆黑的
2/23/2024 11:23:00 AM
机器之心
目标检测新SOTA:YOLOv9问世,新架构让传统卷积重焕生机
在目标检测领域,YOLOv9 实现了一代更比一代强,利用新架构和方法让传统卷积在参数利用率方面胜过了深度卷积。继 2023 年 1 月 YOLOv8 正式发布一年多以后,YOLOv9 终于来了!我们知道,YOLO 是一种基于图像全局信息进行预测的目标检测系统。自 2015 年 Joseph Redmon、Ali Farhadi 等人提出初代模型以来,领域内的研究者们已经对 YOLO 进行了多次更新迭代,模型性能越来越强大。此次,YOLOv9 由中国台湾 Academia Sinica、台北科技大学等机构联合开发,相
2/23/2024 11:18:00 AM
机器之心
OpenAI工程师必备经典《苦涩的教训》,原来20多年前就有了原型
大量数据学习涌现出来的能力,终于超越了人们的想象。OpenAI 推出视频生成模型 Sora 已经一周的时间了,热度不减,作者团队还在持续放出让人眼前一亮的视频。比如「一群爱冒险的小狗探索天空废墟的电影预告片」,Sora 一次生成并自己完成剪辑。当然,一个个生动、逼真的 AI 视频让人们好奇为什么是 OpenAI 率先打造出了 Sora 并能够跑通所有 AGI 技术栈呢?这一问题在社交媒体上引发了热烈的讨论。其中,在一篇知乎文章中,加州大学伯克利分校计算机科学博士、作者 @SIY.Z 分析了 OpenAI 成功的一些
2/23/2024 11:06:00 AM
机器之心
资讯热榜
蚂蚁集团携手北医三院成立AI医疗联合实验室 打造专属AI就医助理
首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
OpenAI豪赌5000亿美元估值神话:60亿股权大甩卖背后,GPT-5却遭用户冷遇
深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题
国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
心理学家警告:与 AI 聊天可能导致严重心理健康问题
OpenAI加速推进GPT-6开发,奥尔特曼承诺打造"有记忆"的个性化AI助手
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
论文
Anthropic
代码
训练
算法
Stable Diffusion
AI新词
芯片
LLM
蛋白质
腾讯
开发者
苹果
生成式
Claude
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
RAG
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视频生成
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用