应用
推出不到一个月,谷歌Gemini翻车了
机器之能报道编辑:Sia谷歌下架 Gemini 人物图像生成服务。三月前,谷歌 Gemini 轰轰烈烈亮相,被描述为谷歌“最大、最有能力和最通用”的 AI 系统,并补充说它具有复杂的推理和编码能力。2 月 8 日,谷歌聊天机器人 Bard 正式更名为 Gemini,以反映新聊天机器人的“使命”——提供对“最有能力的模型系列”的访问。结果,推出不到一个月,Gemini 就捅了个大篓子。用户使用人像生成服务时发现,让 Gemini 承认白人的存好像非常困难,AI 拒绝在图像中描绘白人,以至于生成不少违背基本事实(性别、
2/23/2024 6:20:00 PM
机器之能
2770亿美元,英伟达创史上最大单日涨幅,黄仁勋:生成式AI已到临界点
老黄即将跻身全球前 20 富豪行列。英伟达,现在已是「地球上最重要的一支股票」了。本周四,英伟达市值单日暴涨 2770 亿美元。这是华尔街历史上最大的股票单日涨幅,这家重量级芯片公司的最新季度报告超出了预期,点燃了人们对于人工智能的乐观情绪。 单日成交金额 659 亿美元,约合 4700 亿人民币。该公司股价飙升了 16.4% 收于 785.38 美元,创历史新高。其总市值升至 1.96 万亿美元,再次超越谷歌(Alphabet)成为全球第三大市值公司
2/23/2024 11:28:00 AM
机器之心
Stable Diffusion 3震撼发布,采用Sora同源技术,文字终于不乱码了
Stable Diffusion 3 和 Sora 一样采用了 diffusion transformer 架构。继 OpenAI 的 Sora 连续一周霸屏后,昨晚,生成式 AI 顶级技术公司 Stability AI 也放了一个大招 ——Stable Diffusion 3。该公司表示,这是他们最强大的文生图模型。与之前的版本相比,Stable Diffusion 3 生成的图在质量上实现了很大改进,支持多主题提示,文字书写效果也更好了。以下是一些官方示例:提示:史诗般的动漫作品,一位巫师在夜晚的山顶上向漆黑的
2/23/2024 11:23:00 AM
机器之心
目标检测新SOTA:YOLOv9问世,新架构让传统卷积重焕生机
在目标检测领域,YOLOv9 实现了一代更比一代强,利用新架构和方法让传统卷积在参数利用率方面胜过了深度卷积。继 2023 年 1 月 YOLOv8 正式发布一年多以后,YOLOv9 终于来了!我们知道,YOLO 是一种基于图像全局信息进行预测的目标检测系统。自 2015 年 Joseph Redmon、Ali Farhadi 等人提出初代模型以来,领域内的研究者们已经对 YOLO 进行了多次更新迭代,模型性能越来越强大。此次,YOLOv9 由中国台湾 Academia Sinica、台北科技大学等机构联合开发,相
2/23/2024 11:18:00 AM
机器之心
OpenAI工程师必备经典《苦涩的教训》,原来20多年前就有了原型
大量数据学习涌现出来的能力,终于超越了人们的想象。OpenAI 推出视频生成模型 Sora 已经一周的时间了,热度不减,作者团队还在持续放出让人眼前一亮的视频。比如「一群爱冒险的小狗探索天空废墟的电影预告片」,Sora 一次生成并自己完成剪辑。当然,一个个生动、逼真的 AI 视频让人们好奇为什么是 OpenAI 率先打造出了 Sora 并能够跑通所有 AGI 技术栈呢?这一问题在社交媒体上引发了热烈的讨论。其中,在一篇知乎文章中,加州大学伯克利分校计算机科学博士、作者 @SIY.Z 分析了 OpenAI 成功的一些
2/23/2024 11:06:00 AM
机器之心
清华叉院、理想提出DriveVLM,视觉大语言模型提升自动驾驶能力
在自动驾驶领域,研究人员也在朝着 GPT/Sora 等大模型方向进行探索。与生成式 AI 相比,自动驾驶也是近期 AI 最活跃的研究和开发领域之一。要想构建完全的自动驾驶系统,人们面临的主要挑战是 AI 的场景理解,这会涉及到复杂、不可预测的场景,例如恶劣天气、复杂的道路布局和不可预见的人类行为。现有的自动驾驶系统通常包括 3D 感知、运动预测和规划组成部分。具体来说,3D 感知仅限于检测和跟踪熟悉的物体,忽略了罕见物体及其属性, 运动预测和规划则关注物体的轨迹动作,通常会忽略物体和车辆之间的决策级交互。自动驾驶需
2/23/2024 10:56:00 AM
机器之心
Adobe & Figma :分手2个月后的境况
实际上早在去年年底12月的时候,Adobe 对 Figma 的 200 亿收购案就以失败收场,监管机构下场干预,Adobe 和 Figma 各有想法,最终以 Adobe 支付 Figma 10 亿美元和解,一场长达 15 个月的设计史上最大收购案落下帷幕,双方各自远扬。
欧盟和英国竞争委员会基于当地的反垄断法,针对这一收购案提出了反垄断指控。这类操作在科技领域内屡见不鲜,但是在 Adobe 和 Figma 两家之间,欧盟的操作倒是成了一次借坡下驴的绝佳机会。在不同场合、不同媒体的采访之下,这场原本看起来是「天作之合
2/23/2024 8:57:12 AM
陈子木
Sora全球爆火,对设计师来说是机会还是挑战?
想必最近大家在网上都看到了有关 Sora 的信息,这是 OpenAI 在春节期间发布的一项令人难以置信的新技术,在人工智能领域,这可以说是颠覆性的突破和创新。简单来说,它是一个视频生成器,你给它一段文字,它就能帮你创造出你想要的视频作品!我们先来看一个 Sora 生成的视频。
这个视频的咒语(Prompt):一位时尚的女士穿着黑色皮夹克、长红裙和黑色靴子,手拿黑色手袋,在东京一条灯光温暖、霓虹灯闪烁、带有动感城市标志的街道上自信而随意地行走。她戴着太阳镜,涂着红色口红。街道潮湿而有反光效果,色彩缤纷的灯光仿佛在地面
2/23/2024 6:56:02 AM
团队58UXD
新视频、造话题遇冷,火爆一时的苹果“杀手”Ai Pin会be吗?
·机器之能报道编辑:吴昕这个“杀手”不太冷。下月出货,吉凶难料。三大 iPhone “刺客” —— 苹果 Vsion Pro 、 Rabbit r1 和 Humane Ai Pin,前两者已相继出货并造成轰动。唯独 Humane Ai Pin 自发布以来,一直非常安静,安静得让人有点担忧。这款被 Humane 定位为智能手机继任者的小型无屏幕设备将于下月上市(已经没几天时间了),公司也一直试图通过在其社交媒体账户以及老板、员工账户上发布短视频来制造话题,然而,这些视频并没给人留下深刻印象,收获理想的关注度。这也是
2/22/2024 4:34:00 PM
机器之能
开源大模型王座易主!谷歌Gemma杀入场,笔记本可跑,可商用
刚刚,谷歌杀入开源大模型。开源领域大模型,迎来了重磅新玩家。谷歌推出了全新的开源模型系列「Gemma」。相比 Gemini,Gemma 更加轻量,同时保持免费可用,模型权重也一并开源了,且允许商用。Gemma 官方页面::Gemma 2B 和 Gemma 7B。每种规模都有预训练和指令微调版本。想使用的人可以通过 Kaggle、谷歌的 Colab Notebook 或通过 Google Cloud 访问。当然,Gemma 也第一时间上线了 HuggingFace 和 HuggingChat,每个人都能试一下它的生成
2/22/2024 11:02:00 AM
机器之心
爆火Sora背后的技术,一文综述扩散模型的最新发展方向
为了使机器具有人类的想象力,深度生成模型取得了重大进展。这些模型能创造逼真的样本,尤其是扩散模型,在多个领域表现出色。扩散模型解决了其他模型的限制,如 VAEs 的后验分布对齐问题、GANs 的不稳定性、EBMs 的计算量大和 NFs 的网络约束问题。因此,扩散模型在计算机视觉、自然语言处理等方面备受关注。扩散模型由两个过程组成:前向过程和反向过程。前向过程把数据转化为简单的先验分布,而反向过程则逆转这一变化,用训练好的神经网络模拟微分方程来生成数据。与其他模型相比,扩散模型提供了更稳定的训练目标和更好的生成效果。
2/22/2024 10:53:00 AM
机器之心
模型融合、混合专家、更小的LLM,几篇论文看懂2024年LLM发展方向
还有 10 个月,2024 年还有很多期待空间。在过去的 2023 年中,大型语言模型(LLM)在潜力和复杂性方面都获得了飞速的发展。展望 2024 年的开源和研究进展,似乎我们即将进入一个可喜的新阶段:在不增大模型规模的前提下让模型变得更好,甚至让模型变得更小。现在,2024 年的第一个月已经过去,也许是时候盘点一番新年首月进展了。近日,AI 研究者 Sebastian Raschka 发布了一份报告,介绍了四篇与上述新阶段有关的重要论文。它们的研究主题简单总结起来是这样:1. 权重平均和模型融合可将多个 LLM
2/22/2024 10:49:00 AM
机器之心
AI 视频新王者诞生!一文盘点 Sora 模型 14 项功能特点!
大家好,我是花生~
2 月 16 日 OpenAI 发布了一个新的 AI 视频生成模型 Sora,它可以根据文本生成 60s 的高质量视频,完全突破了之前 AI 文生视频存在的各种局限,所以一出现就引起广泛关注和热烈讨论,大家应该对它都有所了解。今天就根据网上已公布的视频,对 Sora 的功能特性进行一个盘点总结,其中包含与 Runway、Pika 等 AI 视频工具的生成效果对比,让大家对 Sora 的能力有一个更直观全面的了解。
相关推荐:一、60s 超长视频
之前优设已经推荐过 AI 视频工具,比如 Runw
2/22/2024 8:51:19 AM
夏花生
超多实战案例!大厂出品的AIGC设计实践手册
一、前言
随着技术的不断迭代,AIGC 能力的可控性得到了进一步提升,可应用的场景也越来越多,在文本、图像、视频等多个领域都有了广泛应用。用户已经可以用自然语言来与 AI 工具进行交互,革新传统办公方式,工作任务可以更具创造性,并且提高了生产效率。
本文将从 AIGC 体系化应用角度聊一聊,设计团队如何利用 AIGC 来优化工作流,提升效率的同时,更多推动 AIGC 能力应用与落地。二、AIGC 对设计的影响
如何更好的利用 AI 工具帮助我们提升设计效率与价值,我们尝试了从产品设计类需求、运营设计类需求、视频/动
2/22/2024 6:48:10 AM
团队WOWDesign
阿联酋技术创新研究院启动“Falcon Foundation”,引领生成式人工智能模型开源运动
基金会将推动知识共享,加速人工智能的民主化,TII承诺3亿美元未来项目资金
2/21/2024 8:31:00 PM
新闻助手
旨在构建首个通用生物学AI模型,前Google DeepMind科学家联手创建Biooptimus
编辑 | X随着法国初创企业生态系统的持续繁荣,比如 Mistral、Poolside 和 Adaptive。2 月 20 日,总部位于巴黎的 Biooptimus 在获得 3500 万美元的种子轮融资后,从隐身中脱颖而出,其使命是建立第一个用于生物学的通用人工智能基础模型。新的开放科学模型将把不同规模的生物学与生成人工智能连接起来——从分子到细胞、组织和整个生物体。Bioptimus 联合了一个由 Google DeepMind alumni 和 Owkin 科学家组成的团队,其中 AI 生物技术初创公司 Owk
2/21/2024 3:40:00 PM
ScienceAI
想想就能控制鼠标,马斯克披露首位植入Neuralink大脑芯片患者近况
编辑:Sia第一个植入Neuralink芯片的人现在能用思维控制鼠标了。但围绕这一消息的伦理质疑也从未迟到。Neuralink 联合创始人马斯克表示,第一个植入该公司大脑芯片的人现在能用思维控制鼠标。据路透社报道,马斯克周一在 X Spaces 活动中表示:“进展良好,患者似乎已完全康复,没有出现我们所知的不良影响。患者可以通过思维移动屏幕上的鼠标。”马斯克在昨天的聊天中表示,Neuralink 与患者的主要工作是试图使命令更加复杂,以便芯片可用于不同类型的动作控制。“我们试图通过让被试通过思考按下尽可能多的按钮。
2/21/2024 3:24:00 PM
机器之能
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
Sora
3D
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind