资讯列表
从直观物理学谈到认知科学,Sora不是传统物理模拟器盖棺定论了?
本文篇幅很长,主题很多,但循序渐进,对「Sora 究竟是不是世界模拟器」这一说法给出了非常详实的解读。最近,OpenAI 的文生视频模型 Sora 爆火。除了能够输出高质量的视频之外,OpenAI 更是将 Sora 定义为一个「世界模拟器」(world simulators)。当然,这一说法遭到了包括图灵奖得主 Yann LeCun 在内很多学者的反驳。LeCun 的观点是:仅仅根据 prompt 生成逼真视频并不能代表一个模型理解了物理世界,生成视频的过程与基于世界模型的因果预测完全不同。近日,澳大利亚麦考瑞大学
3/18/2024 11:47:00 AM
机器之心
大模型能自己优化Prompt了,曾经那么火的提示工程要死了吗?
人类设计 prompt 的效率其实很低,效果也不如 AI 模型自己优化。2022 年底,ChatGPT 上线,同时引爆了一个新的名词:提示工程(Prompt Engineering)。简而言之,提示工程就是寻找一种编辑查询(query)的方式,使得大型语言模型(LLM)或 AI 绘画或视频生成器能得到最佳结果或者让用户能绕过这些模型的安保措施。现在的互联网上到处都是提示工程指南、快捷查询表、建议推文,可以帮助用户充分使用 LLM。在商业领域,现在也有不少公司竞相使用 LLM 来构建产品 copilot、自动化繁琐的
3/18/2024 11:39:00 AM
机器之心
COLING24|自适应剪枝让多模态大模型加速2-3倍,哈工大等推出SmartTrim
基于 Transformer 结构的视觉语言大模型(VLM)在各种下游的视觉语言任务上取得了巨大成功,但由于其较长的输入序列和较多的参数,导致其相应的计算开销地提升,阻碍了在实际环境中进一步部署。为了追求更为高效的推理速度,前人提出了一些针对 VLM 的加速方法,包括剪枝和蒸馏等,但是现有的这些方法大都采用静态架构,其针对不同输入实例采用同样的计算图进行推理,忽略了不同实例之间具有不同计算复杂性的事实:针对复杂的跨模态交互实例,自然需要更多计算才能完全理解图像和相关问题的复杂细节;相反,简单的实例则可以用更少的计算
3/18/2024 11:34:00 AM
机器之心
流浪地球里的数字生命计划启动了?DeepMind在电脑里造果蝇,网友:能造人吗?
「质疑图恒宇,理解图恒宇,成为图恒宇。」在《流浪地球 2》中,刘德华饰演的图恒宇是一个令人印象深刻的角色。为了让在车祸中去世的女儿拥有「完整的一生」,他不顾人类世界对「数字生命计划」的禁令,一直在暗中独自努力完善数字生命的架构,并最终决定公然违规,将女儿的数据上传至量子计算机,之后因此被捕入狱。 电影《流浪地球 2》中的数字生命图丫丫。电影上映后,有关「数字生命」的话题经过了很多讨论。最近,这个话题被再次提起,起因是不少失去亲友的人正在尝试用 AI 技术「复活
3/18/2024 11:28:00 AM
机器之心
苹果为杀入AI领域低调收购,iOS 18要有大动作
苹果一直是人工智能公司的最大买家,甚至超过了微软和谷歌。在 AI 领域百花齐放的当下,作为全球顶尖的科技公司苹果,似乎掀起的水花不是很大。苹果在 AI 领域的布局到底是什么,或许苹果 CEO 蒂姆・库克的一句话可以为我们答疑解惑。此前在 2024 苹果股东大会上,库克表示,今年将在 GenAI 领域实现重大进展。此外,苹果宣布放弃 10 年之久的造车项目之后,一部分造车团队成员也开始转向 GenAI。如此种种,苹果向外界传达了加注 GenAI 的决心,很多人开始感叹苹果在生成式 AI 领域终于不再低调了。显然,苹果
3/18/2024 11:19:00 AM
机器之心
一句指令就能冲咖啡、倒红酒、锤钉子,清华具身智能CoPa「动」手了
近期,具身智能方向取得了诸多进展。从谷歌的 RT-H 到 OpenAI、Figure 联合打造的 Figure 01,机器人的交互性、通用性越来越强。如果未来机器人成为人们日常生活的助手,你期待它们能够完成哪些任务?泡一杯热气腾腾的手冲咖啡,整理桌面,甚至帮你精心安排一场浪漫的约会,这些任务,只需一句指令,清华的具身智能新框架「CoPa」都能完成。CoPa(Robotic Manipulation through Spatial Constraints of Parts)是清华叉院高阳教授机器人研究团队最新提出的具
3/18/2024 11:15:00 AM
机器之心
总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述
大语言模型(Large Language Models, LLMs)在过去两年内迅速发展,涌现出一些现象级的模型和产品,如 GPT-4、Gemini、Claude 等,但大多数是闭源的。研究界目前能接触到的大部分开源 LLMs 与闭源 LLMs 存在较大差距,因此提升开源 LLMs 及其他小模型的能力以减小其与闭源大模型的差距成为了该领域的研究热点。LLM 的强大能力,特别是闭源 LLM,使得科研人员和工业界的从业者在训练自己的模型时都会利用到这些大模型的输出和知识。这一过程本质上是知识蒸馏(Knowledge,
3/18/2024 11:09:00 AM
机器之心
马斯克 xAI 宣布正在开源 Grok-1 模型,体量 3140 亿参数号称“全球最大”
感谢马斯克旗下 AI 初创企业 xAI 今天发布新闻稿,宣布正在开源 3140 亿参数的混合专家模型 Grok-1,该模型遵循 Apache 2.0 协议开放模型权重和架构,号称是“迄今为止全球参数量最大的开源大语言模型”。截至IT之家发稿,官方已经在 GitHub 中发布了 Grok-1 论文源代码,但还未开源模型主体。就在本月,马斯克宣布起诉 OpenAI 及其 CEO 阿尔特曼,声称 OpenAI 及其 CEO 阿尔特曼违背了公司成立的协议,该协议旨在推动 AI 技术朝着造福人类而非牟利的方向推进。马斯克对
3/18/2024 9:41:06 AM
漾仔
北京近期将发布第一代通用开放人形机器人本体
据北京青年报报道,年初,目标规模 100 亿元的北京机器人产业发展投资基金注册落地经开区,将助力北京打造世界领先的人形机器人产业发展高地。最近,北京人形机器人创新中心传来好消息,近期将发布第一代通用开放人形机器人本体。▲ 图源公众号“北京亦庄”报道称,人形机器人集成人工智能、高端制造、新材料等先进技术,有望成为继计算机、智能手机、新能源汽车后的颠覆性产品,深刻变革人类生产生活方式,重塑全球产业发展格局。作为人形机器人行业的聚合高点,2023 年年底,北京人形机器人创新中心有限公司正式成立,由人形机器人行业领军企事业
3/18/2024 8:37:26 AM
浩渺
消息称英伟达 Blackwell“B100”GPU 将配 192GB HBM3e 显存,B200 配 288GB 显存
感谢英伟达将在明日举行 GTC 2024 主题演讲,黄仁勋预计将宣布名为 Blackwell 的下一代 GPU 架构。据 XpeaGPU 爆料称,明天推出的 B100 GPU 将采用两个基于台积电 CoWoS-L 封装技术的芯片。CoWoS(晶圆基片芯片)是一项先进的 2.5D 封装技术,涉及将芯片堆叠在一起,提高处理能力,同时节省空间并降低功耗。XpeaGPU 透露,B100 GPU 的两个计算芯片将连接到 8 个 8-Hi HBM3e 显存堆栈,总容量为 192GB。值得注意的是,AMD 已经提供了 192GB
3/18/2024 8:32:17 AM
汪淼
第二波!2024年3月精选实用设计工具合集
大家好,这是 2024 年 3 月的第 2 波干货合集!这一期干货合集提供了 2 个颇为不错的灵感网站,一个是 404 网站内容合集,另一个则是一个专业的产品设计网站,此外这次合集当中还推荐了一款非常独特的配色工具,一款在线图片包装工具,一款在线 3D 服装设计工具,以及一项经过深入调教的 AI 角色生成服务。
当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、优质 404 页面大合集网站
页面算是网页设计当中绕不开的一个组件。用户打开一个不存在的链接,404 页面会告诉用
3/18/2024 3:17:02 AM
陈子木
AI 程序员 Devin 卧底工作群修 bug!和 CTO 聊技术,网友:顶级码农水平
首个 AI 程序员 Devin,现身明星创业公司内部群。为解决一个技术问题,Devin 借用了其创造者的账号,与客户公司的 CTO 交流,并根据回复调整了代码方案。对话之专业,围观者看了直呼这个世界太疯狂。事情发生在办公软件 Slack,截图中的 akshat 是 AI 基础设施创业公司 Modal Labs 的 CTO Akshat Bubna。Modal Labs 也是 Devin 开发商 Cognition 的首批客户之一。此时 Devin 正披着他的创造者之一、IOI 金牌得主 Steven Hao 的马甲
3/17/2024 5:15:57 PM
远洋
谷歌推出 Cappy “打分”框架,可评估 AI 准确性“教模型更聪明”
据谷歌官方新闻稿,谷歌近日推出了一项名为 Cappy 的模型打分框架,该框架以 RoBERTa 语言模型为基础,主要用于检测模型输出的内容,并为相关内容打分,之后相关分数将会作为参考基准让模型学习,从而让模型更聪明。▲ 图源 谷歌官方新闻稿(下同)此外,Cappy 框架也可以作为大语言模型的“候选机制”,该框架可以内置在模型中,并对模型预输出的内容生成分数,并选择分数最高的回应作为最终输出,以提高大语言模型输出内容的正确性。研究人员提到,相对于业界其他方案,Cappy 框架的 RAM 用量更低,这是由于相关框架无需
3/17/2024 4:18:59 PM
漾仔
ChatGPT 参数规模被扒:只有 7B
ChatGPT 惨遭攻击,参数规模终于被扒出来了 —— 很可能只有 7B(70 亿)。消息来自南加州大学最新研究,他们使用一种攻击方法,花费不到 1000 美元就把最新版 gpt-3.5-turbo 模型的机密给挖了出来。果然,OpenAI 不 Open,自有别人帮他们 Open。具体来说,南加大团队三位作者破解出了未公布的 gpt-3.5-turbo 嵌入向量维度(embedding size)为 4096 或 4608。而几乎所有已知的开源大模型如 Llama 和 Mistral,嵌入向量维度 4096 的时候
3/17/2024 3:41:32 PM
远洋
中国电动汽车百人会2024丨毫末顾维灏:自动驾驶3.0时代,大模型重塑汽车智能化路线
“以大模型、大算力、大数据为代表的自动驾驶3.0时代已经到来,这些都是智能汽车新质生产力关键要素。毫末将以技术领先的‘极致性价比’智驾产品,助力车企智能化革命。”2024年3月17日,毫末智行CEO顾维灏受邀出席中国电动汽车百人会论坛(2024),并在现场发表主题演讲《自动驾驶3.0时代,大模型重塑汽车智能化路线》。顾维灏透露,毫末第二代HPilot极致性价比无图NOH智驾产品,已陆续进入交付状态。顾维灏出席中国电动汽车百人会论坛(2024)本届中国电动汽车百人会论坛(2024)以“巩固和扩大新能源汽车发展优势”为
3/17/2024 2:32:00 PM
新闻助手
Devin 第一手使用体验:完成度很高,开始编码就停不下来,但要替代程序员还很远
【新智元导读】Devin 到底是一个漂亮的 Demo,还是一个已经能替代程序员的智能体,使用体验怎么样,拿到测试资格的网友第一时间分享了自己的体验。由 10 枚 IOI 金牌在手的创业团队 Cognition AI 开发的全球首个 AI 程序员智能体 Devin,一发布就让科技圈坐立不安。在演示中,Devin 几乎已经可以独立完成很多人类程序员需要大量时间才能完成的工作,效果一点不比普通程序员差。但是,产品能力的边界在哪里,实际体验和演示时候有差距,还得看上手实测之后的效果。这位斯坦福的小哥在 Devin 发布的第
3/17/2024 8:58:23 AM
清源
比 ChatGPT4 还强?深度测评最新AI神器 Claude3
Claude3,正式上线。
这个由 OpenAI 分裂出去的兄弟公司 Anthropic,在悄然无息之间,就这么默默地把 Claude3 发了。
没有所谓的发布会,没有什么华丽的舆论,就仅仅在 X 上发了个帖子。我发现现在的这些 AI 公司真挺有意思,都把 X 当成发布主阵地了。。。
字很少,但是事挺大。一口气发了 3 个模型,Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。
这个名字就取的...很有故事。
Opus 大概意思就是史诗级乐章,牛逼上天那种。
Sonnet
3/17/2024 8:11:25 AM
基于CPU服务器实现Llama2等应用落地,英特尔展示五代至强可扩展芯片实践
本周,英特尔数据中心产品技术媒体分享会在北京举行。多位英特尔技术专家为我们从多个角度,以实践应用的角度解析了最新一代服务器 CPU 产品的技术特性及独特价值。当前,AI 技术落地的速度正在加快,有全球调研结果显示,58% 的企业期待在近未来导入生成式 AI 等技术。预计到 2026 年,生成式 AI 的市场规模将达到 3000 亿美元,这其中包括硬件、软件、解决方案等。约会有 80% 以上的公司,会在 2026 年之前会导入某种程度的生成式 AI 以提高企业生产力。据预测,到 2026 年,有 50% 以上的边缘应
3/16/2024 9:07:00 PM
李泽南