AI在线 AI在线

应用

Pika、Gen-2、ModelScope、SEINE……AI视频生成哪家强?这个框架一测便知

AI 视频生成,是最近最热门的领域之一。各个高校实验室、互联网巨头 AI Lab、创业公司纷纷加入了 AI 视频生成的赛道。Pika、Gen-2、Show-1、VideoCrafter、ModelScope、SEINE、LaVie、VideoLDM 等视频生成模型的发布,更是让人眼前一亮。v⁽ⁱ⁾大家肯定对以下几个问题感到好奇:到底哪个视频生成模型最牛?每个模型有什么特长?AI 视频生成领域目前还有哪些值得关注的问题待解决?为此,我们推出了 VBench,一个全面的「视频生成模型的评测框架」,来告诉你 「视频模型哪
1/22/2024 11:34:00 AM
机器之心

普林斯顿博士生高天宇指令微调进展速览:数据、算法和评估

自 ChatGPT 等大型语言模型推出以来,为了提升模型效果,各种指令微调方法陆续被提出。本文中,普林斯顿博士生、陈丹琦学生高天宇汇总了指令微调领域的进展,包括数据、算法和评估等。图源:(LLM)很强大,但要想真正帮助我们处理各种日常和工作任务,指令微调就必不可少了。近日,普林斯顿大学博士生高天宇在自己的博客上总结了指令微调研究方向的近期进展并介绍了其团队的一项近期研究成果。具有十亿级参数且使用万亿级 token 训练的大型语言模型(LLM)非常强大,直接就能用于解决大量不同的任务。但是,要用于真实世界应用以及作为
1/22/2024 11:27:00 AM
机器之心

奥特曼筹数十亿美元建全球晶圆厂网络,自造AI芯片

可以低成本代替英伟达?据彭博社消息,OpenAI CEO 萨姆・奥特曼(Sam Altman)近日再次为一家人工智能芯片企业筹集了数十亿美元的资金,希望建立一个范围覆盖全球的晶圆厂「企业网络(network of factories)」,并计划与未具名的顶级芯片制造商合作。报道称,奥特曼已与几家大型潜在投资者进行了谈判,希望能筹集到晶圆厂所需的巨额资金。在生成式 AI 快速爆发的时代,运行 AI 模型面临的主要困难是算力限制。在 ChatGPT 、 DALL-E 等生成式 AI 模型的背后,研究者们投入了大量的算力
1/22/2024 11:15:00 AM
机器之心

一张照片,为深度学习巨头们定制人像图片

主题驱动的文本到图像生成,通常需要在多张包含该主题(如人物、风格)的数据集上进行训练,这类方法中的代表工作包括 DreamBooth、Textual Inversion、LoRAs 等,但这类方案因为需要更新整个网络或较长时间的定制化训练,往往无法很有效地兼容社区已有的模型,并无法在真实场景中快速且低成本应用。而目前基于单张图片特征进行嵌入的方法(FaceStudio、PhotoMaker、IP-Adapter),要么需要对文生图模型的全参数训练或 PEFT 微调,影响原本模型的泛化性能,缺乏与社区预训练模型的兼容
1/22/2024 11:00:00 AM
机器之心

高手总结!十五个 Midjourney V6 与 V5.1 镜头对比(附超多实用提示词)

最近人工智能新闻铺天盖地,属 OpenAI 耀眼,1 月 11 日推出 GPT 商店,由于登录的人数较多,网站一直登录不上,只能耐心等待... 本篇图片来自 @4rtofficial 相机镜头(部分)第二卷 PDF 文件。开头/文末已给出完整的 PDF 文件和福利。 更多V6 介绍:一、CANON EF 50MM F/1.8 STM LENS 佳能(Canon)EF 50mm f/1.8 STM 镜头的型号。这是一款标准定焦镜头,适用于街头摄影、旅行摄影等。焦距:50mm,是一款标准定焦镜头,适用于多种拍摄场景。
1/22/2024 7:22:52 AM
团队RaDesign

百度实战案例复盘!如何设计问答式AI产品?

前言 在传统营销中,客户在策划广告推广时需要层层搭建计划、手动添加素材、时刻关注效果,这个繁琐流程需要大量表单填写和反复跳转,重复的基建工作量很大,导致商业营销成为繁重的体力活,影响整体投放效率。 借助文心大模型,我们推出了轻舸:一个成本优化、高效经营的智能营销平台。 更多AI产品设计干货:一、探索方向 轻舸平台核心想要解决的,是如何利用生成式 AI 的能力,让交互过程回归自然,让客户可以通过自然语言对话这种最本能的方式完整表达原生诉求,全面解决传统广告投放中曲折繁复、学习门槛高、分析操作耗时的痛点,降低营销门槛,
1/22/2024 1:12:52 AM
团队百度MEUX

煮咖啡只是热身,人形机器人要去宝马工厂上班了

机器之能报道编辑:吴昕人形机器人何时能从研究项目过渡到商业产品?答案似乎是 2024 年。少数资金相对雄厚的公司将在商业试点项目中部署自己的机器人,以确定它们是否真的准备好为人类工作。看了十小时视频、透过端到端的系统学会如何做咖啡后, Figure 01 又要去工厂打工了。今天,总部位于加州的人形机器人初创公司Figure 宣布与宝马签署一项商业协议,将在宝马的美国制造工厂部署 Figure 01。这也是 Figure 自 2022 年成立以来签署的第一个商业协议。公司的人形机器人会被部署到位于南卡罗来纳州的斯帕坦
1/19/2024 4:14:00 PM
机器之能

不担心字节跳动、腾讯等大厂竞争,英矽智能CEO Alex Zhavoronkov谈AI药物发现

编译 | 紫罗人工智能在生物制药领域的应用越来越广泛,其应用超出了发现设备的范畴。2024 年 1 月 8 日-11 日,在旧金山举行的第 42 届摩根大通医疗保健大会( J.P. Morgan Healthcare Conference)上,这是一个热点问题。在会议刚刚开始之际,礼来公司和诺华公司甚至宣布与 Alphabet 的 Isomorphic Labs 达成数百万美元的发现协议。在人工智能的热潮中,外媒与英矽智能(Insilico Medicine)首席执行官 Alex Zhavoronkov 进行了座谈
1/19/2024 4:02:00 PM
ScienceAI

国内首个网络安全大模型评测平台SecBench发布

2024年1月19日,业界首个网络安全大模型评测平台SecBench正式发布,该平台由腾讯朱雀实验室和腾讯安全科恩实验室,联合腾讯混元大模型、清华大学江勇教授/夏树涛教授团队、香港理工大学罗夏朴教授研究团队、上海人工智能实验室OpenCompass团队共同建设,主要解决开源大模型在网络安全应用中安全能力的评估难题,旨在为大模型在安全领域的落地应用选择基座模型提供参考,加速大模型落地进程。同时,通过建设安全大模型评测基准,为安全大模型研发提供公平、公正、客观、全面的评测能力,推动安全大模型建设。行业首发,弥补大模型在
1/19/2024 2:11:00 PM
新闻助手

扎克伯格宣战AGI:Llama 3训练中,今年要囤35万块H100,砸近百亿美元

「事情越来越明确了,各大科技公司的下一代服务会构建在通用 AI 之上。」为了通用人工智能(AGI)的宏大目标,扎克伯格正在给 Meta 的 AI 研究部门进行大幅度的改组。本周四,Meta 首席执行官马克・扎克伯格宣布,他的公司正在致力于为人工智能助手构建「通用智能」并「负责任地开源」,Meta 正在将其两个主要研究小组(FAIR 和 GenAI)合并在一起以实现这一目标 。为此,Meta 将准备屯集业内最为强大的 AI 算力。扎克伯格表示,公司将购买超过 35 万块英伟达 H100 GPU—— 这是目前业界构建生
1/19/2024 11:47:00 AM
机器之心

视觉Mamba来了:速度提升2.8倍,内存能省87%

Vision Mamba 不是个普通模型。号称「全面包围 Transformer」的 Mamba,推出不到两个月就有了高性能的视觉版。本周四,来自华中科技大学、地平线、智源人工智能研究院等机构的研究者提出了 Vision Mamba(Vim)。论文地址:::Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Model效果如何呢?在 ImageNet 分类任务、COCO 对象检测任务和 ADE20
1/19/2024 11:41:00 AM
机器之心

一键实景转动画,清华系初创公司全球首发4D骨骼动画框架,还能生成个性化角色

前几日,苹果宣布首款虚拟头显设备 Vision Pro 将于 2 月 2 日正式发售,XR 设备作为下一代终端预计将迎来快速发展。未来随着虚拟显示设备的普及,数字交互将从平面走向立体,立体模型、立体动画将成为未来主流的内容形态,虚实融合下的多维沉浸式交互也将成为潮流。但从数据规模看,现阶段内容产业的数据积累仍以 2D 图像、平面视频为主,3D 模型、4D 动画等数据基础较为薄弱。其中,4D 动画是在传统 3D 模型的基础上引入时间序列,即随时间变化的 3D 模型,可以呈现出动态立体效果,在游戏动画、电影特效、虚拟现
1/19/2024 11:35:00 AM
机器之心

AIGC时代的「数字生命计划」已启动!

从碳基生命到硅基生命的剧变正在悄然降临。即使总是伴随着关于伦理、人性与法律等问题的争论,人类从来没有放弃过挣脱时空限制、实现灵魂永恒的尝试。近几年《上载新生》《万神殿》《爱死机》《西部世界》这些剧作,无不在重温着二十多年前《黑客帝国》和《楚门世界》的内核。而《流浪地球 2》的上映,更将「数字生命」的讨论推向了高潮。影片中研究员图恒宇在女儿丫丫濒死时用数字生命卡保留了她生命的数据,在超级计算机 550 w 的多次迭代后,数据形态的图丫丫拥有了自我意识,获得了「完整的一生」。《流浪地球 2》剧照,图恒宇和丫丫简而言之,
1/19/2024 11:23:00 AM
机器之心

论学手艺,波士顿动力机器人可不是他们的对手

机器之能报道编辑:陈萍、Sia波士顿动力机器人运动技能的提升并没有很大程度改善人形机器人进入日常家庭服务的能力。基于大型语言模型(LLM)的生成 AI 取得突破后,人形机器人“大脑”演化也开始狂飙突进,曾被认为过于耸人听闻且效率低下的人形机器人开始以新的方式掌握人类基本生活技能,走进我们的生活。Keppler人形机器人人类拥有灵活的双手,可以辅助我们完成复杂的任务。可惜,除了跑酷跳跃,我们没有看到波士顿动力的机器人做过任何家务,比如叠衣服或者其他需要用到灵活手指的活儿。不过,给下面这些人形机器人安上一双手后,大家干
1/18/2024 5:04:00 PM
机器之能

奥数能力金牌级:DeepMind几何推理模型登上Nature,代码开源,菲尔兹奖得主点赞

这项工作代表了 AI 在数学推理上的能力突破,是开发通用 AI 系统方面的重要里程碑。这一次,人工智能算法在数学奥林匹克竞赛(IMO)上取得了重大成绩突破。在今天发表的国际权威期刊《自然》杂志最新一期上,论文《Solving olympiad geometry without human demonstrations》向世人介绍了 AlphaGeometry,专家表示,这是人工智能朝着具有人类推理能力方向迈进的重要一步。论文链接: 也在论文发表的第一时间将代码和模型开源,GitHub:,来自 Google Deep
1/18/2024 11:56:00 AM
机器之心

新一代注意力机制Lightning Attention-2:无限序列长度、恒定算力开销、更高建模精度

Lightning Attention-2 是一种新型的线性注意力机制,让长序列的训练和推理成本与 1K 序列长度的一致。大语言模型序列长度的限制,极大地制约了其在人工智能领域的应用,比如多轮对话、长文本理解、多模态数据的处理与生成等。造成这一限制的根本原因在于当前大语言模型均采用的 Transformer 架构有着相对于序列长度的二次计算复杂度。这意味着随着序列长度的增加,需要的计算资源成几何倍数提升。如何高效地处理长序列一直是大语言模型的挑战之一。之前的方法往往集中在如何让大语言模型在推理阶段适应更长的序列。比
1/18/2024 11:39:00 AM
机器之心

参会指南|倒计时 2 天,AI 视频生成论坛即将开启!

「视频生成前沿研究与应用」机器之心 AI 技术论坛将于本周六(1月20日)正式开启。本次活动是 2024 年机器之心主办的首场线下交流活动,期待到场的朋友们都能收获满满。为了帮助大家更全面、充分地了解大会内容,丝滑参会,机器之心特别整理了一份详细的参会指南,请查收!签到指南签到时间:2024.01.20  09:00-09:25签到地点:北京市西城区设计之都大厦一层昆仑巢签到程序:参会者持活动行签到二维码扫码签到确认后,领取活动日程和参会手环。(二维码和手环是活动结束后领取奖品的必要证明,请注意留存。)午休时间:1
1/18/2024 11:34:00 AM
机器之心

数智上海 2023 峰会 | 上海云网协同高性能算力基础设施建设进展如何?产业链各方分享最新进展

云赛智联所属上海科技网络通信有限公司总经理肖晓滨,中国通信服务上海公司绿色数据中心产品基地技术总监王斌,联通(上海)产业互联网有限公司副总经理朱奕健,中科曙光上海区域技术总监韩雪兵等进行了主题演讲。圆桌环节,机器之心运营总监、副主编闻菲主持,中国通信服务上海公司副总经理、上海市算力网络协会副理事长武广,科华数据云集团副总裁欧阳江涛,UCloud 优刻得服务器中心及 AI 算力负责人丁振雷等交流了观点。智算服务供应商、运营商、云计算服务商以及行业协会代表从各自视角出发,分享了上海算力新型基础设施建设前沿进展及智算趋势
1/18/2024 11:07:00 AM
新闻助手