应用
清华叉院、理想提出DriveVLM,视觉大语言模型提升自动驾驶能力
在自动驾驶领域,研究人员也在朝着 GPT/Sora 等大模型方向进行探索。与生成式 AI 相比,自动驾驶也是近期 AI 最活跃的研究和开发领域之一。要想构建完全的自动驾驶系统,人们面临的主要挑战是 AI 的场景理解,这会涉及到复杂、不可预测的场景,例如恶劣天气、复杂的道路布局和不可预见的人类行为。现有的自动驾驶系统通常包括 3D 感知、运动预测和规划组成部分。具体来说,3D 感知仅限于检测和跟踪熟悉的物体,忽略了罕见物体及其属性, 运动预测和规划则关注物体的轨迹动作,通常会忽略物体和车辆之间的决策级交互。自动驾驶需
2/23/2024 10:56:00 AM
机器之心
Adobe & Figma :分手2个月后的境况
实际上早在去年年底12月的时候,Adobe 对 Figma 的 200 亿收购案就以失败收场,监管机构下场干预,Adobe 和 Figma 各有想法,最终以 Adobe 支付 Figma 10 亿美元和解,一场长达 15 个月的设计史上最大收购案落下帷幕,双方各自远扬。
欧盟和英国竞争委员会基于当地的反垄断法,针对这一收购案提出了反垄断指控。这类操作在科技领域内屡见不鲜,但是在 Adobe 和 Figma 两家之间,欧盟的操作倒是成了一次借坡下驴的绝佳机会。在不同场合、不同媒体的采访之下,这场原本看起来是「天作之合
2/23/2024 8:57:12 AM
陈子木
Sora全球爆火,对设计师来说是机会还是挑战?
想必最近大家在网上都看到了有关 Sora 的信息,这是 OpenAI 在春节期间发布的一项令人难以置信的新技术,在人工智能领域,这可以说是颠覆性的突破和创新。简单来说,它是一个视频生成器,你给它一段文字,它就能帮你创造出你想要的视频作品!我们先来看一个 Sora 生成的视频。
这个视频的咒语(Prompt):一位时尚的女士穿着黑色皮夹克、长红裙和黑色靴子,手拿黑色手袋,在东京一条灯光温暖、霓虹灯闪烁、带有动感城市标志的街道上自信而随意地行走。她戴着太阳镜,涂着红色口红。街道潮湿而有反光效果,色彩缤纷的灯光仿佛在地面
2/23/2024 6:56:02 AM
团队58UXD
新视频、造话题遇冷,火爆一时的苹果“杀手”Ai Pin会be吗?
·机器之能报道编辑:吴昕这个“杀手”不太冷。下月出货,吉凶难料。三大 iPhone “刺客” —— 苹果 Vsion Pro 、 Rabbit r1 和 Humane Ai Pin,前两者已相继出货并造成轰动。唯独 Humane Ai Pin 自发布以来,一直非常安静,安静得让人有点担忧。这款被 Humane 定位为智能手机继任者的小型无屏幕设备将于下月上市(已经没几天时间了),公司也一直试图通过在其社交媒体账户以及老板、员工账户上发布短视频来制造话题,然而,这些视频并没给人留下深刻印象,收获理想的关注度。这也是
2/22/2024 4:34:00 PM
机器之能
开源大模型王座易主!谷歌Gemma杀入场,笔记本可跑,可商用
刚刚,谷歌杀入开源大模型。开源领域大模型,迎来了重磅新玩家。谷歌推出了全新的开源模型系列「Gemma」。相比 Gemini,Gemma 更加轻量,同时保持免费可用,模型权重也一并开源了,且允许商用。Gemma 官方页面::Gemma 2B 和 Gemma 7B。每种规模都有预训练和指令微调版本。想使用的人可以通过 Kaggle、谷歌的 Colab Notebook 或通过 Google Cloud 访问。当然,Gemma 也第一时间上线了 HuggingFace 和 HuggingChat,每个人都能试一下它的生成
2/22/2024 11:02:00 AM
机器之心
爆火Sora背后的技术,一文综述扩散模型的最新发展方向
为了使机器具有人类的想象力,深度生成模型取得了重大进展。这些模型能创造逼真的样本,尤其是扩散模型,在多个领域表现出色。扩散模型解决了其他模型的限制,如 VAEs 的后验分布对齐问题、GANs 的不稳定性、EBMs 的计算量大和 NFs 的网络约束问题。因此,扩散模型在计算机视觉、自然语言处理等方面备受关注。扩散模型由两个过程组成:前向过程和反向过程。前向过程把数据转化为简单的先验分布,而反向过程则逆转这一变化,用训练好的神经网络模拟微分方程来生成数据。与其他模型相比,扩散模型提供了更稳定的训练目标和更好的生成效果。
2/22/2024 10:53:00 AM
机器之心
模型融合、混合专家、更小的LLM,几篇论文看懂2024年LLM发展方向
还有 10 个月,2024 年还有很多期待空间。在过去的 2023 年中,大型语言模型(LLM)在潜力和复杂性方面都获得了飞速的发展。展望 2024 年的开源和研究进展,似乎我们即将进入一个可喜的新阶段:在不增大模型规模的前提下让模型变得更好,甚至让模型变得更小。现在,2024 年的第一个月已经过去,也许是时候盘点一番新年首月进展了。近日,AI 研究者 Sebastian Raschka 发布了一份报告,介绍了四篇与上述新阶段有关的重要论文。它们的研究主题简单总结起来是这样:1. 权重平均和模型融合可将多个 LLM
2/22/2024 10:49:00 AM
机器之心
AI 视频新王者诞生!一文盘点 Sora 模型 14 项功能特点!
大家好,我是花生~
2 月 16 日 OpenAI 发布了一个新的 AI 视频生成模型 Sora,它可以根据文本生成 60s 的高质量视频,完全突破了之前 AI 文生视频存在的各种局限,所以一出现就引起广泛关注和热烈讨论,大家应该对它都有所了解。今天就根据网上已公布的视频,对 Sora 的功能特性进行一个盘点总结,其中包含与 Runway、Pika 等 AI 视频工具的生成效果对比,让大家对 Sora 的能力有一个更直观全面的了解。
相关推荐:一、60s 超长视频
之前优设已经推荐过 AI 视频工具,比如 Runw
2/22/2024 8:51:19 AM
夏花生
超多实战案例!大厂出品的AIGC设计实践手册
一、前言
随着技术的不断迭代,AIGC 能力的可控性得到了进一步提升,可应用的场景也越来越多,在文本、图像、视频等多个领域都有了广泛应用。用户已经可以用自然语言来与 AI 工具进行交互,革新传统办公方式,工作任务可以更具创造性,并且提高了生产效率。
本文将从 AIGC 体系化应用角度聊一聊,设计团队如何利用 AIGC 来优化工作流,提升效率的同时,更多推动 AIGC 能力应用与落地。二、AIGC 对设计的影响
如何更好的利用 AI 工具帮助我们提升设计效率与价值,我们尝试了从产品设计类需求、运营设计类需求、视频/动
2/22/2024 6:48:10 AM
团队WOWDesign
阿联酋技术创新研究院启动“Falcon Foundation”,引领生成式人工智能模型开源运动
基金会将推动知识共享,加速人工智能的民主化,TII承诺3亿美元未来项目资金
2/21/2024 8:31:00 PM
新闻助手
旨在构建首个通用生物学AI模型,前Google DeepMind科学家联手创建Biooptimus
编辑 | X随着法国初创企业生态系统的持续繁荣,比如 Mistral、Poolside 和 Adaptive。2 月 20 日,总部位于巴黎的 Biooptimus 在获得 3500 万美元的种子轮融资后,从隐身中脱颖而出,其使命是建立第一个用于生物学的通用人工智能基础模型。新的开放科学模型将把不同规模的生物学与生成人工智能连接起来——从分子到细胞、组织和整个生物体。Bioptimus 联合了一个由 Google DeepMind alumni 和 Owkin 科学家组成的团队,其中 AI 生物技术初创公司 Owk
2/21/2024 3:40:00 PM
ScienceAI
想想就能控制鼠标,马斯克披露首位植入Neuralink大脑芯片患者近况
编辑:Sia第一个植入Neuralink芯片的人现在能用思维控制鼠标了。但围绕这一消息的伦理质疑也从未迟到。Neuralink 联合创始人马斯克表示,第一个植入该公司大脑芯片的人现在能用思维控制鼠标。据路透社报道,马斯克周一在 X Spaces 活动中表示:“进展良好,患者似乎已完全康复,没有出现我们所知的不良影响。患者可以通过思维移动屏幕上的鼠标。”马斯克在昨天的聊天中表示,Neuralink 与患者的主要工作是试图使命令更加复杂,以便芯片可用于不同类型的动作控制。“我们试图通过让被试通过思考按下尽可能多的按钮。
2/21/2024 3:24:00 PM
机器之能
Sora为何出自OpenAI?一线员工作息时间线揭秘:我们疯狂地卷
数数每天几个小时?为什么是 OpenAI 率先打造出了 Sora?现在全世界不论研究员、工程师还是投资人都在问这个问题。最近几天,人们对于视频大模型 Sora 的讨论热度持续升高,信息早已破了圈,相关的投资热点都已经出现了两轮。 Sora 生成的「Flower tiger」视频。试问这种生成能力会催生多少新脑洞?在一篇文章中,加州大学伯克利分校计算机科学博士、知乎作者 @SIY.Z 分析了 OpenAI 成功的一些原因,包括:目标和商业模式明确:目标就是
2/21/2024 3:00:00 PM
机器之心
出圈的Sora带火DiT,连登GitHub热榜,已进化出新版本SiT
好的研究不会被埋没,只会历久弥新。虽然已经发布近一周时间,OpenAI 视频生成大模型 Sora 的影响仍在继续!其中,Sora 研发负责人之一 Bill Peebles 与纽约大学助理教授谢赛宁撰写的 DiT(扩散 Transformer)论文《Scalable Diffusion Models with Transformers》被认为是此次 Sora 背后的重要技术基础之一。该论文被 ICCV 2023 接收。论文地址: 地址:,DiT 论文和 GitHub 项目的热度水涨船高,重新收获大量关注。论文出现在
2/21/2024 2:54:00 PM
机器之心
CS领域杨笛一、杜少雷、金驰等7位华人学者获奖,2024斯隆奖出炉
在 2024 年度斯隆奖名单中,计算机科学领域共有 22 位获奖者,其中 7 位华人。今天凌晨,斯隆基金会公布了 2024 年度斯隆研究奖获得者名单。自 1955 年起,斯隆研究奖由美国艾尔弗・斯隆基金会(The Alfred P. Sloan Foundation)每年颁发一次,以表彰那些具有创造性、创新性和研究成就的美国和加拿大的杰出年轻研究人员。斯隆研究奖的获奖者将获得为期两年、价值 7.5 万美元的研究资金,可灵活地用于推动自身的研究。斯隆奖历来被认为是「诺奖风向标」:2007 年以来,该奖项历届获得者中已
2/21/2024 2:47:00 PM
机器之心
20分钟学会装配电路板!开源SERL框架精密操控成功率100%,速度三倍于人类
现在,机器人学会工厂精密操控任务了。近年来,机器人强化学习技术领域取得显著的进展,例如四足行走,抓取,灵巧操控等,但大多数局限于实验室展示阶段。将机器人强化学习技术广泛应用到实际生产环境仍面临众多挑战,这在一定程度上限制了其在真实场景的应用范围。强化学习技术在实际应用的过程中,任需克服包括奖励机制设定、环境重置、样本效率提升及动作安全性保障等多重复杂的问题。业内专家强调,解决强化学习技术实际落地的诸多难题,与算法本身的持续创新同等重要。面对这一挑战,来自加州大学伯克利、斯坦福大学、华盛顿大学以及谷歌的学者们共同开发
2/21/2024 2:40:00 PM
机器之心
6000字干货!全面了解顶尖AI产品 ChatGPT-4
GPT-4 的看点都有哪些呢?逻辑推理,强到可以代替你考律师啦
角色扮演,cosplay 认定角色不轻易被忽悠
多模态,可以看到图片啦
更安全,想要再轻易忽悠它越狱很难了GPT-4 的论文:
搭载了 GPT-4 的 ChatGPT Plus:
申请 GPT-4 的 API:
接下来的内容会详细介绍 GPT-4 的一切。GPT-4 具有更广泛的通识知识和问题解决能力,可以更有效的解决难题
1. 它更有创造力
GPT-4 比以往任何时候都更具创造性和协作性。它可以与用户一起生成、编辑和迭代创意和技术写作任务,例如
2/21/2024 8:34:37 AM
逗砂
如何用AIGC 做好UI设计?实战案例来了!
热爱,是做好一件关键的事情。
“AI 到底会不会取代我们”?这个问题我们留在结尾与大家探讨,现在我就开始学习如何用 AIGC 去做界面、以及怎样指导我们进行优化。
利用“AI”做界面主要会用到四个工具:Chat GPT、Figma(Wireframe Designer 插件)、即时设计(即时 AI)、文心一言(作为无法使用 Chat GPT 同学的备用方案)一、UI 设计的基本原则与 AIGC 的融合
UI 设计更多是创建直观、易用、吸引人的用户界面,而 AIGC 则是指通过人工智能技术生成的文本、图像、音频或视频
2/21/2024 12:22:36 AM
文轩没有大脑袋
资讯热榜
蚂蚁集团携手北医三院成立AI医疗联合实验室 打造专属AI就医助理
首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
OpenAI豪赌5000亿美元估值神话:60亿股权大甩卖背后,GPT-5却遭用户冷遇
深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题
国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
心理学家警告:与 AI 聊天可能导致严重心理健康问题
OpenAI加速推进GPT-6开发,奥尔特曼承诺打造"有记忆"的个性化AI助手
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
论文
Anthropic
代码
训练
算法
Stable Diffusion
AI新词
芯片
LLM
蛋白质
腾讯
开发者
苹果
生成式
Claude
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
RAG
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视频生成
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用