资讯列表
马斯克的首款多模态大模型来了,GPT-4V又被超越了一次
自从 2023 年 11 月 Grok 首次亮相以来,马斯克的 xAI 正在大模型领域不断取得进步,向 OpenAI 等先行者发起进攻。在 Grok-1 开源后不到一个月,xAI 的首个多模态模型就问世了。昨天,xAI 推出了 Grok-1.5V,该模型不仅能理解文本,还能处理文档、图表、截图和照片中的内容。官方博文表示:「Grok-1.5V 在许多领域都能媲美当前顶尖的多模态模型,从多学科推理到理解文档、科学图表、图表、截图和照片。」 xAI 还表示,在接下来的几个月里,预计将在图像、音频和视频等各种模态上显著提
4/15/2024 9:24:00 AM
机器之心
培育发展金融领域新质生产力,“AI+金融”论坛在浦东新区成功举办
4 月 12 日,在上海市浦东新区科技和经济委员会指导下,由上海市浦东新区产业发展促进中心、上海市浦东新区投资促进二中心、上海陆家嘴(集团)有限公司主办,上海浦东科技创业中心、中国建设银行上海浦东分行、机器之心(上海)科技有限公司承办的 “AI 金融” 论坛在张江科学城・数智天地成功举办。浦东新区科技和经济委员会副主任夏玉忠,北蔡镇人民政府党委书记殷宏、上海陆家嘴(集团)有限公司总经理蔡嵘,建行上海浦东分行党委书记邹林出席了本次论坛。来自大模型企业、金融科技企业、金融机构及高校的嘉宾和 300 多位专业观众参加了本
4/15/2024 9:16:00 AM
机器之心
曾爆火的 InstantID又有了新玩法:风格化图像生成,已开源
InstantID 原班团队推出了风格迁移的新方法 InstantStyle。风格化图像生成,也常称为风格迁移,其目标是生成与参考图像风格一致的图像。此前基于 diffusion 的方法(比如 LoRA)通常需要批量的同风格数据进行训练,无法迁移到新的风格中,或者基于 inversion(如 StyleAlign),通过将风格图像还原到 latent noise 后,将其前向传播得到的 K、V 用于替换风格图像生成中的 K、V,但这类方法往往由于 inversion 的操作,造成风格退化。最近,InstantID
4/15/2024 9:12:00 AM
机器之心
GPT超越扩散、视觉生成Scaling Law时刻!北大&字节提出VAR范式
新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了!使 GPT 风格的自回归模型在图像生成首次超越扩散模型,并观察到与大语言模型相似的 Scaling Laws 缩放定律、Zero-shot Task Generalization 泛化能力: 论文标题: "Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale P
4/15/2024 9:09:00 AM
机器之心
全球AI顶会NeurlPS开始收高中生论文了
卷高考之后的下一步,卷论文?培养 AI 人才,要从娃娃抓起,这句话似乎越来越不像开玩笑了。本周五,顶级学术会议 NeurIPS 开设高中生论文 Track 的消息引爆了人工智能社区。消息援引自大会组织方的一项新公告。请注意,这不是 workshop,是主会议:NeurIPS 2024 邀请高中生提交有关机器学习社会影响主题的研究论文。组委会将选出一部分决赛入围者以虚拟方式展示他们的项目,并将在 NeurIPS 主页上重点展示他们的作品。此外,最多五个获奖项目的主要作者将受邀参加在温哥华举行的 NeurIPS 202
4/15/2024 9:04:00 AM
机器之心
OpenAI推销ChatGPT to B业务,微软客户也是目标
奥特曼接待了数百名 500 强公司的高管。技术领先的 OpenAI,正在稳步推进大模型能力的落地。据路透社等媒体报道,OpenAI 首席执行官山姆・奥特曼(Sam Altman)本月在旧金山、纽约和伦敦接待了数百名《财富》500 强公司高管,他和其他 OpenAI 高管在会上推销了供企业使用的人工智能服务,同时还与自己的资金支持者微软的产品进行了一番比对。这些类似路演的活动表明,在通过消费级产品 ChatGPT 引发生成式人工智能爆炸式增长之后,OpenAI 正在寻求从世界各地的企业那里增加新的收入来源 —— 其中
4/15/2024 9:01:00 AM
机器之心
CVPR 2024 | 仅需文本或图像提示,新框架CustomNeRF精准编辑3D场景
美图影像研究院(MT Lab)与中国科学院信息工程研究所、北京航空航天大学、中山大学共同提出了 3D 场景编辑方法 ——CustomNeRF,同时支持文本描述和参考图像作为 3D 场景的编辑提示,该研究成果已被 CVPR 2024 接收。自 2020 年神经辐射场 (Neural Radiance Field, NeRF) 提出以来,将隐式表达推上了一个新的高度。作为当前最前沿的技术之一,NeRF 快速泛化应用在计算机视觉、计算机图形学、增强现实、虚拟现实等领域,并持续受到广泛关注。有赖于易于优化和连续表示的特点,
4/15/2024 8:59:00 AM
机器之心
谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024
最近,来自澳大利亚蒙纳士大学、蚂蚁集团、IBM 研究院等机构的研究人员探索了模型重编程 (model reprogramming) 在大语言模型 (LLMs) 上应用,并提出了一个全新的视角:高效重编程大语言模型进行通用时序预测 –- 其提出的 Time-LLM 框架无需修改语言模型即可实现高精度时序预测,在多个数据集和预测任务中超越了传统的时序模型,让 LLMs 在处理跨模态的时间序列数据时展现出色,就像大象起舞一般!近期,受到大语言模型在通用智能领域的启发,「大模型 时序 / 时空数据」这个新方向迸发出了许
4/15/2024 8:55:00 AM
机器之心
阿尔特曼“亲自带货”,消息称 OpenAI 向数百名世界 500 强高管推荐 ChatGPT 企业版
据路透社报道,OpenAI 首席执行官萨姆・阿尔特曼本月在旧金山、伦敦和纽约等地分别接待了数百名《财富》世界 500 强公司的高管。与会者表示,阿尔特曼与其他 OpenAI 高管一同在这些地方为企业提供了人工智能服务,某些情况下更与其“金主”微软进行正面交锋。OpenAI 以消费产品引起了生成式 AI 的爆炸式发展,目前这一最新举动标志着 OpenAI 正寻求从全球企业获得新的收入来源。仅在上个星期之内,就已有两次在美国举行的会面和一次在英国伦敦举行的会面。与会者表示,阿尔特曼在每个城市的活动中直接面向 100 多
4/15/2024 8:08:29 AM
清源
古尔曼:苹果 iOS 18 的首批 AI 功能将完全运行于设备端
据彭博社记者马克・古尔曼 (Mark Gurman)透露,苹果将于 iOS 18 推出的首批全新 AI 功能将完全运行于设备端,而无需依赖云服务器。古尔曼今日在其 Power On 通讯的问答环节中表示:“随着全球都在翘首期盼苹果在 6 月 10 日发布的重磅 AI 技术,目前看来首批功能将完全在设备上运行。这意味着为这些新功能提供支持的大型语言模型将不会用到云端处理。”古尔曼还指出,苹果未来可能会提供一些基于云端的 AI 功能,这些功能可能由谷歌的 Gemini 或其他供应商提供支持。据报道,苹果已经与谷歌、Op
4/15/2024 6:49:36 AM
远洋
设计素材不用愁!6 组高质量插画类 Midjourney 提示词
大家好,这里是和你们一起探索 AI 的花生~
插画是平面设计中不可或缺的一部分,扁平、3D、等距、孟菲斯等风格的插画素材目前在设计中也被广泛应用。所以今天继续为大家整理 5 类插画主题的 Midjourney 提示词,帮助我们更快速高效地生成相关素材~
上期回顾:一、黑白线条插画
① A shrimp, hand-drawn outline style, isolated on white background, black and white --ar 1:1 --style raw
一只虾,手绘轮廓风格,隔绝在
4/15/2024 1:05:51 AM
夏花生
工信部:应大力发展基于 AI 大模型的智能装备、软件等产品
据工信部官网,人工智能赋能新型工业化企业座谈会暨第八次制造业企业座谈会于前日召开。工业和信息化部党组书记、部长金壮龙在会上表示,要大力发展基于 AI 大模型的智能装备、软件等智能产品。会中,来自人工智能技术供给侧、智能化转型需求侧的 11 家企业负责人互相交流发言,介绍了底层核心技术研发、工业应用场景开拓、产业生态构建等方面的创新实践,并提出针对性意见建议。另有 14 家企业作书面交流。IT之家注意到,工业和信息化部党组书记、部长金壮龙指出,要落实全国新型工业化推进大会部署,以人工智能和制造业深度融合为主线,以智能
4/14/2024 5:43:07 PM
漾仔
国内首个公共安全领域大模型算法“天擎”通过备案,支持案情推理等
感谢4 月 11 日,国家互联网信息办公室发布第五批深度合成服务算法备案信息的公告,由国投智能研发的“天擎公共安全大模型算法”通过深度合成服务算法备案,成为国内首个通过备案的公共安全领域大模型算法。IT之家了解到,国投智能为国投集团参与国家数字经济安全稳定发展平台,研发发布了美亚“天擎”公共安全大模型。据介绍,美亚“天擎”公共安全大模型拥有丰富的公共安全行业知识,具备强大的警务意图识别、警务情报分析、案情推理,智能指挥调度,法律法规知识库,报告文书生成等业务理解和推理能力,能够从海量数据中持续自我进化,实现行业知识
4/14/2024 5:37:42 PM
浩渺
世界首个 AI 程序员 Devin 视频竟造假?博主逐帧解析,Devin 代码任务完成很糟糕
【新智元导读】全球首个 AI 程序员 Devin 被爆视频造假?YouTube 博主近日揭露了背后明星初创公司 Cognition 的谎言,通过逐帧分析发现,Devin 并不能独立完成 Upwork 工作。全网爆火的世界首个 AI 程序员 Devin,如今被爆出视频竟是作假?最近,一位有 35 年软件工程师经验的 YouTube 博主去逐帧复现了,Devin 完成 Upwork 任务的宣传视频。却意外发现,AI 并不能像人类工程师一样完成任务,而且非常糟糕。他将 25 分钟「揭穿 Devin 的谎言」视频公开后,一
4/14/2024 12:47:11 PM
清源
Claude 3 说服力堪比人类!Anthropic 最新研究揭秘 LLM 惊人能力
新智元报道 编辑:flynne【新智元导读】Anthropic 发布最新研究,发现 Claude 3 Opus 的说服力与人类大致相当,该成果在评估语言模型说服力方面迈出了重要的一步。人工智能模型在对话说服力方面表现如何?对这一问题大家可能都心存疑惑。长期以来,人们一直在质疑人工智能模型是否会在某天变得像人类一样具有改变人们想法的说服力。但由于之前对模型说服力的实证研究有限,因此对这一问题的探讨也就不了了之。近日,Claude 的东家 Anthropic 发表博文,称他们开发了一种测量模型说服力的基本方法,并且在
4/14/2024 12:44:45 PM
远洋
大厂实战案例!京东2024年货节视觉设计完整复盘
京东家电家居生活事业部2024年货节主打场景化营销,结合龙年这一特殊的中国年属性去表达家的概念,传播家电家居品类,全时期主打【辞旧迎新大扫除】【阖家团圆年夜饭】【走亲访友送好礼】三大主题场景。
4/14/2024 12:23:18 AM
团队京东JellyDesign
公安部公布 10 起网络谣言典型案例,4 起涉及使用 AI 造谣
感谢日前,公安部公布 10 起打击整治网络谣言违法犯罪典型案例,其中 4 起涉及使用 AI 造谣。去年 12 月以来,公安部部署全国公安机关统一开展打击整治网络谣言专项行动。截至目前,公安机关累计排查网络谣言线索 8 万余条,侦办网络谣言类案件 1 万余起,抓获犯罪嫌疑人 1500 余名,行政处罚 10700 余人,开展公开辟谣等 4200 余次。近年来,人工智能 AI 等新技术降低造谣成本。2023 年,最高人民法院、最高人民检察院、公安部联合发布的《关于依法惩治网络暴力违法犯罪的指导意见》中规定,对“利用‘深度
4/13/2024 5:50:33 PM
浩渺
马斯克 xAI 展示首个多模态模型 Grok-1.5V:可将流程图转成 Python 代码
感谢马斯克旗下人工智能公司 xAI 于 3 月下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI 表示:“Grok-1.5V 在多学科推理、文档理解、科学图表、表格处理、屏幕截图和照片等多个领域都能媲美现有的前沿多模态模型”。xAI 在官方新闻稿中演示了 7 个 Grok-1.5V 案
4/13/2024 1:35:07 PM
故渊