应用
商汤科技 CEO 徐立:AI 行业很热但未到“超级时刻”,需要应用来支撑
在今日开幕的 2024 世界人工智能大会期间,商汤科技董事长兼 CEO 徐立发表演讲。徐立在演讲指出,当前 AI 行业确实很热,但“还没有到一个超级时刻”—— 因为 AI 暂未真正走进行业垂直应用,或引起广泛变化。徐立认为,当下的大模型只是一个“记忆器”,只是背下了所有的知识点,仅有的一点点智能其实是来自互联网上的数据背后带有的一个“高阶逻辑思维链”。徐立在谈到“超级时刻”时补充说,超级时刻和应用是相互成就的。“超级时刻”带来认知变化,才能推动应用。如果有应用来支撑,那么当下就是“超级时刻”。“就像 iPhone
7/4/2024 8:56:24 PM
清源
8月正式发布,小鹏MONA M03开启全球首秀
量化之美,破风而来。7月3日下午14点,小鹏MONA M03开启全球首秀。这款为年轻用户打造的智能纯电掀背轿跑,以其独特的AI量化美学设计吸引了行业关注。小鹏汽车董事长CEO何小鹏携手造型中心副总裁胡安马·洛佩兹(JuanMa Lopez)共同出席了此次直播,深入解读了小鹏MONA M03的设计创作理念和背后的技术实力。AI量化美学设计 为年轻而来作为MONA系列的首款车型,小鹏MONA M03承载了小鹏汽车对于电动市场和用户需求的全新思考。当下,20万内的汽车市场占据了行业近乎一半的市场份额,中规中矩的A级轿车已
7/4/2024 8:42:00 PM
新闻助手
首个开源、原生多模态生成大模型:一键生成 「煎鸡蛋」图文菜谱
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]生成式人工智能研究实验室(GAIR,主页:)由上海交通大学刘鹏飞副教授2023年4月回国创建,是国内首个聚焦于生成式人工智能的高校研究组。汇聚了来自于CMU、复旦、交大(ACM班、IEEE
7/4/2024 6:33:00 PM
机器之心
揭秘:阶跃星辰万亿MoE+多模态大模型矩阵亮相
在 2024 年世界人工智能大会的现场,很多人在一个展台前排队,只为让 AI 大模型给自己在天庭「安排」一个差事。具体流程是这样的:首先, AI 会管你要一张个人照片,并参考《大闹天宫》画风生成你在仙界的形象照。接下来,它会引导你进入一个交互式的剧情选择和交谈环节(其实是 AI 大模型自己编的剧情),然后根据你的选择和回答评估出你的 MBTI 人格类型,并根据这个类型为你在天庭「安排」一个差事。 当然,除了现场排队,你还可以在线体验(扫描下方二维码即可)。这是大模型创业公司阶跃星辰与上影合作的 AI 互动体验《AI
7/4/2024 6:29:00 PM
机器之心
AI主战场,万卡是标配:国产GPU万卡万P集群来了!
Scaling Law 持续见效,让算力就快跟不上大模型的膨胀速度了。「规模越大、算力越高、效果越好」成为行业圭皋。主流大模型从百亿跨越到 1.8 万亿参数只用了1年,META、Google、微软这些巨头也从 2022 年起就在搭建 15000 卡以上的超大集群。「万卡已然成为 AI 主战场的标配。」然而在国内,全国产化的 GPU 万卡集群,则是屈指可数。有超大规模,同时还具备超强通用性的万卡集群,更是行业空白。当国产 GPU 万卡万 P 集群首次亮相时,自然就引发了行业广泛关注。7 月 3 日,摩尔线程在上海重磅
7/4/2024 6:24:00 PM
机器之心
8人小团队单挑OpenAI,半年仿出GPT-4o,还开源了
最近,一个对标 GPT-4o 的开源实时语音多模态模型火了。这个开源模型来自法国一个仅有 8 人的非营利性 AI 研究机构 ——Kyutai,模型名为 Moshi,具备听、说、看的多模态功能。图灵奖得主 Yann LeCun 转发说道:「Moshi 能听懂带有法国口音的英语。」据悉,该团队开发这个模型仅用了 6 个月。的确,在研究团队演示的视频中,我们发现 Moshi 可以非常流利地回答人们提出的问题,进行日常对话交流,甚至可以猜出提问者的意图。例如,当提问者说「下个月打算去攀登珠穆朗玛峰,我在想......」,提
7/4/2024 6:18:00 PM
机器之心
AI 搜索热潮背后:注定要逾越场景的门槛
在 2024 上半年并算不明朗的 AI 应用局势中,AI 搜索正成为新共识并迎来了一波热潮,短时间内涌现出了多个 AI 搜索产品。 其中,国外原生 AI 搜索工具 Perplexity AI 最新估值已经接近30 亿美元、GenSpark、You 均表现不俗;国内天工 AI 、秘塔搜索等也在打磨自身产品力。 AI 搜索不仅在产品形态上革新了传统搜索引擎的信息罗列模式以及备受诟病的竞价排名广告,还能解决聊天机器人信息滞后和幻觉问题,让传统搜索引擎的交互变得更加智能。
7/4/2024 6:11:00 PM
王悦
陶哲轩支持!AI数学奥林匹克竞赛进步奖公布,奖金100多万美元
大模型做数学题到底如何,不妨让它参与一下这种级别的比赛。 「AI 数学奥林匹克竞赛(AIMO 进步奖)的初步成绩已公布。根据排行榜的数据,目前看来,获胜的程序在私人测试中正确回答了 29/50 道题,这一成绩比预期的要高。」刚刚,陶哲轩在个人博客中公布了这一消息。AIMO 最初由一家搞机器学习量化交易的非银行金融机构 XTX Markets 发起,主要是让参与者使用 AI 模型解决国际数学难题,而本次进步奖的目标是创建能够解决用 LaTeX 格式编写的复杂数学问题的算法和模型。这将有助于推动人工智能模型的数学推理能
7/4/2024 6:09:00 PM
机器之心
全新TextGrad框架:用GPT-4o作引擎,自动优化端到端任务
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]该文章的作者团队来自于斯坦福大学,共同第一作者团队Mert Yuksekgonul,Federico Bianchi, Joseph Boen, Sheng Liu, Zhi HuangM
7/4/2024 6:07:00 PM
机器之心
央视点赞国产AI复活召唤术,兵马俑竟与宝石老舅对唱Rap?
沉睡了两千多年的兵马俑,苏醒了?一句秦腔开场,将我们带到了黄土高原。如果不是亲眼所见,很多观众可能难以想象,有生之年还能看到兵马俑和宝石 Gem 同台对唱《从军行》。「青海长云暗雪山,孤城遥望玉门关。」古调虽存音乐变,声音依旧动人情:这场表演背后的「AI 复活召唤术」,叫做 EMO,来自阿里巴巴通义实验室。仅仅一张照片、一个音频,EMO 就能让静止形象变为惟妙惟肖的唱演视频,且精准卡点音频中的跌宕起伏、抑扬顿挫。在央视《2024 中国・AI 盛典》中,同样基于 EMO 技术,北宋文学家苏轼被「复活」,与李玉刚同台合
7/4/2024 6:01:00 PM
机器之心
一张照片创造 1 分钟人物视频,商汤发布首个“可控”人物视频生成大模型 Vimi
感谢商汤科技在世界人工智能大会(WAIC)上发布了首个“可控”人物视频生成大模型 Vimi,通过一张任意风格的照片就能生成和目标动作一致的人物类视频,并支持多种驱动方式,可通过已有人物视频、动画、声音、文字等多种元素进行驱动。与图片表情控制类技术只能控制头部表情动作不同,商汤称 Vimi 不但可以实现精准的人物表情控制,还可实现在半身区域内控制照片中人物的自然肢体变化,并自动生成与人物相符的头发、服饰及背景变化。同时 Vimi 可稳定生成 1 分钟的单镜头人物类视频,画面效果不会随着时间的变化而劣化或失真,满足娱乐
7/4/2024 5:59:12 PM
沛霖(实习)
不到60秒就能生成3D「手办」,Meta发力3D生成,ChatGPT时刻要来了吗?
3D 生成,一直在等待它的「ChatGPT时刻」。一直以来,创作 3D 内容是设计和开发视频游戏、增强现实、虚拟现实以及影视特效中最重要的部分。然而,3D 生成具有独特而艰巨的挑战,这是图像和视频等其他生成内容所不具备的。首先,3D 内容在艺术质量、生成速度、3D 网格结构和拓扑质量、UV 贴图结构以及纹理清晰度和分辨率方面具有严格的标准;其次,与其他研究相比,可用的数据量少。虽然该领域有数十亿张图像和视频可供学习,但可用于训练的 3D 内容数量要少三到四个数量级。因此,现阶段的3D 生成还必须从非 3D 的图像和
7/4/2024 5:55:00 PM
机器之心
售价预计 2 万美元,特斯拉二代人形机器人 Optimus 亮相世界人工智能大会
据上证报报道,特斯拉二代人形机器人 Optimus 今日正式亮相 2024 世界人工智能大会(WAIC 2024)。第二代 Optimus 最早于去年 12 月 13 日首次亮相,相比前代产品,其改进包括如下方面:采用了全部由特斯拉自主设计和制造的执行器和传感器;整体外观设计更加精细;行走速度提高了 30%;重量减轻了 10 公斤,同时平衡感和身体控制能力得到改善,视频中演示了其做深蹲的动作;配备了全新的双手,能够抓握更重的物体并进行更加精细的操作。近期,二代 Optimus 已经在特斯拉工厂尝试“打工”。借助视觉
7/4/2024 5:36:03 PM
远洋
中国首款全尺寸通用人形机器人开源公版机“青龙”发布:高 185cm / 重 80kg,算力支持 400TOPS
据《上海证券报》报道,今天开幕的 2024 世界人工智能大会(WAIC 2024)期间,中国首款全尺寸通用人形机器人开源公版机“青龙”正式发布。IT之家汇总该机器人主要信息如下:“青龙”身高 185cm,体重 80kg,全身拥有 43 个主动自由度,关节峰值扭矩最大 400N・m,算力支持 400TOPS。其拥有高度仿生的躯干构型、拟人化的运动控制,支持多模态机动 / 感知 / 交互 / 操控。其同时具备高机动下肢行走配置、轻量化高精度上肢作业配置,支持快速行走、敏捷避障、稳健上下坡、抗冲击干扰四大运动功能。据报道
7/4/2024 5:33:21 PM
清源
全球 AI 面临 6000 亿美元难题,人工智能泡沫正在接近临界点
【新智元导读】AI 基础设施的巨额投资,和实际的 AI 生态系统实际收入之间,差距已经到了不可思议的地步。曾经全球 AI 面临的 2000 亿美元难题,如今已经翻成了 6000 亿美元。现在,业内关于 AI 模型收入的质疑声,已经越来越大。动辄投入几万亿美元打造基础设施,跟部分国家的 GDP 不相上下,然而从 AI 模型中得到的回报,究竟能有几何?在 2023 年 9 月,来自红杉资本的 David Cahn 发表了一篇名为《AI 的 2000 亿美元问题》的文章,目的是探讨:「AI 的收入都去哪了?」根据报告,当
7/4/2024 5:14:30 PM
清源
华为云 CEO 张平安:中国的 AI 应追求在行业领域构筑大模型的全球领先地位
感谢2024 世界人工智能大会今日在上海世博中心开幕,华为常务董事、华为云 CEO 张平安表示,中国的 AI 发展离不开算力基础设施的创新,并且要敢于开放行业场景,让 AI 在行业应用上领先。张平安提出,中国的 AI 发展道路,追求的应该是在行业领域构筑大模型的全球领先地位。如果各行各业都积极拥抱 AI,积极地开放行业的业务场景,中国很有机会在 2B 领域构筑起全球的领先优势。以钢铁行业为例,目前盘古大模型已经在宝钢的一条热轧生产线上线,预测钢板精度提高 5%,每年有望多生产 2 万吨钢板,增收 9000 多万元。
7/4/2024 4:55:21 PM
沛霖(实习)
北京:预计两年打造 AI 原生城市,2025 年智算供给规模达 45EFLOPS
据上观新闻报道,在 7 月 3 日召开的 2024 全球数字经济大会智能计算与决策技术论坛上,北京市经济和信息化局总经济师、数字经济专班执行长唐建国表示:“北京市明确提出,到 2025 年本地智算供给规模达到 45EFLOPS,形成北京市内东西南北四个亿级以上算力中心,构建‘京津冀蒙’算力供给走廊,为人工智能大模型的训练和推理应用提供高效的算力供给。”IT之家注:EFLOPS 即每秒百亿亿次(10 的 18 次方)浮点运算次数。图源 Pexels唐建国表示,北京市还将推出一系列人工智能商业场景,预计利用两年时间打造
7/4/2024 4:51:31 PM
清源
Nature子刊,准确率达96%,AI从序列中预测蛋白-配体互作
编辑 | 萝卜皮在药物研发中,确定小分子配体对蛋白质的结合亲和力和功能效应至关重要。目前的计算方法可以预测这些蛋白质-配体相互作用特性,但如果没有高分辨率的蛋白质结构,通常会失去准确性,并且无法预测功能效应。莫纳什大学(Monash University)和格里菲斯大学(Griffith University)的研究人员开发了 PSICHIC(PhySIcoCHemICal graph neural network),这是一个结合物理化学约束的框架,可直接从序列数据解码相互作用指纹(fingerprints)。这使
7/4/2024 3:41:00 PM
ScienceAI
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
Anthropic
英伟达
代码
训练
算法
Stable Diffusion
芯片
LLM
AI新词
蛋白质
开发者
腾讯
生成式
Claude
苹果
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
人形机器人
xAI
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
场景
大型语言模型
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
特斯拉
应用