应用
日本大阪将在多座车站部署实时语音识别系统:透明显示屏形态,支持 23 种语言翻译
据日媒 ROBOSTART 报道,JR 西日本和阪急电铁将于 7 月 12 日至 9 月 13 日在 JR 大阪站、阪急大阪梅田站部署新型实时语音识别系统 YYSystem 进行乘客引导示范测试。据悉,该系统可借助 AI 将对话实时翻译成多种语言,日语和目标语言都将即时显示在一块配有定向麦克风的透明显示屏上。IT之家获悉,该系统支持 23 种语言,有望为入境旅客或听障人士提供更加顺畅的服务。此次测试将会对所获得数据进行分析,以验证其是否可以对车站信息中常用的词语或表达方式作出响应,目标是在明年的大阪-关西世博会开幕
7/4/2024 9:45:15 PM
清源
国产大模型群雄逐“沪”,讯飞星火如何闪耀WAIC?
7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议(简称“WAIC 2024”)在上海世博中心开幕,WAIC 2024作为全球最高规格的AI产业盛会,今年共有500多家企业参展,汇聚了超1500件展品,大模型成为本届大会的“重头戏”,国内主流大模型齐聚上海滩,既包括科大讯飞星火、百度文心一言、阿里通义、腾讯元宝、华为盘古等市场热门产品,又囊括百川智能、智谱AI、Minimax、阶跃星辰等新锐实力。从今年WAIC 2024展会可以看出,大模型产业逐步由虚向实、锚定场景、深耕行业,不断发挥赋能价值。本次是讯
7/4/2024 9:19:00 PM
新闻助手
杉数科技重磅发布智能建模与计算新品,开启人工智能应用新篇章
7月3日,由全球数字经济大会组委会、北京市经济和信息化局、北京市朝阳区人民政府、杉数科技共同举办的“智能计算与决策技术论坛”在北京圆满落幕。论坛以“创新智能计算引擎 打造企业芯智生产力”为主题,邀请了政府相关领导、国际知名学者、高校教授、企业技术专家、投资机构等学术与产业界精英齐聚一堂,共话智能计算与决策技术前沿和产业创新,探讨如何以人工智能技术加快推进现代化产业体系建设,推动数字经济和实体经济深度融合,为我国经济高质量发展贡献力量。 大会现场
7/4/2024 9:17:00 PM
新闻助手
商汤科技 CEO 徐立:AI 行业很热但未到“超级时刻”,需要应用来支撑
在今日开幕的 2024 世界人工智能大会期间,商汤科技董事长兼 CEO 徐立发表演讲。徐立在演讲指出,当前 AI 行业确实很热,但“还没有到一个超级时刻”—— 因为 AI 暂未真正走进行业垂直应用,或引起广泛变化。徐立认为,当下的大模型只是一个“记忆器”,只是背下了所有的知识点,仅有的一点点智能其实是来自互联网上的数据背后带有的一个“高阶逻辑思维链”。徐立在谈到“超级时刻”时补充说,超级时刻和应用是相互成就的。“超级时刻”带来认知变化,才能推动应用。如果有应用来支撑,那么当下就是“超级时刻”。“就像 iPhone
7/4/2024 8:56:24 PM
清源
8月正式发布,小鹏MONA M03开启全球首秀
量化之美,破风而来。7月3日下午14点,小鹏MONA M03开启全球首秀。这款为年轻用户打造的智能纯电掀背轿跑,以其独特的AI量化美学设计吸引了行业关注。小鹏汽车董事长CEO何小鹏携手造型中心副总裁胡安马·洛佩兹(JuanMa Lopez)共同出席了此次直播,深入解读了小鹏MONA M03的设计创作理念和背后的技术实力。AI量化美学设计 为年轻而来作为MONA系列的首款车型,小鹏MONA M03承载了小鹏汽车对于电动市场和用户需求的全新思考。当下,20万内的汽车市场占据了行业近乎一半的市场份额,中规中矩的A级轿车已
7/4/2024 8:42:00 PM
新闻助手
首个开源、原生多模态生成大模型:一键生成 「煎鸡蛋」图文菜谱
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]生成式人工智能研究实验室(GAIR,主页:)由上海交通大学刘鹏飞副教授2023年4月回国创建,是国内首个聚焦于生成式人工智能的高校研究组。汇聚了来自于CMU、复旦、交大(ACM班、IEEE
7/4/2024 6:33:00 PM
机器之心
揭秘:阶跃星辰万亿MoE+多模态大模型矩阵亮相
在 2024 年世界人工智能大会的现场,很多人在一个展台前排队,只为让 AI 大模型给自己在天庭「安排」一个差事。具体流程是这样的:首先, AI 会管你要一张个人照片,并参考《大闹天宫》画风生成你在仙界的形象照。接下来,它会引导你进入一个交互式的剧情选择和交谈环节(其实是 AI 大模型自己编的剧情),然后根据你的选择和回答评估出你的 MBTI 人格类型,并根据这个类型为你在天庭「安排」一个差事。 当然,除了现场排队,你还可以在线体验(扫描下方二维码即可)。这是大模型创业公司阶跃星辰与上影合作的 AI 互动体验《AI
7/4/2024 6:29:00 PM
机器之心
AI主战场,万卡是标配:国产GPU万卡万P集群来了!
Scaling Law 持续见效,让算力就快跟不上大模型的膨胀速度了。「规模越大、算力越高、效果越好」成为行业圭皋。主流大模型从百亿跨越到 1.8 万亿参数只用了1年,META、Google、微软这些巨头也从 2022 年起就在搭建 15000 卡以上的超大集群。「万卡已然成为 AI 主战场的标配。」然而在国内,全国产化的 GPU 万卡集群,则是屈指可数。有超大规模,同时还具备超强通用性的万卡集群,更是行业空白。当国产 GPU 万卡万 P 集群首次亮相时,自然就引发了行业广泛关注。7 月 3 日,摩尔线程在上海重磅
7/4/2024 6:24:00 PM
机器之心
8人小团队单挑OpenAI,半年仿出GPT-4o,还开源了
最近,一个对标 GPT-4o 的开源实时语音多模态模型火了。这个开源模型来自法国一个仅有 8 人的非营利性 AI 研究机构 ——Kyutai,模型名为 Moshi,具备听、说、看的多模态功能。图灵奖得主 Yann LeCun 转发说道:「Moshi 能听懂带有法国口音的英语。」据悉,该团队开发这个模型仅用了 6 个月。的确,在研究团队演示的视频中,我们发现 Moshi 可以非常流利地回答人们提出的问题,进行日常对话交流,甚至可以猜出提问者的意图。例如,当提问者说「下个月打算去攀登珠穆朗玛峰,我在想......」,提
7/4/2024 6:18:00 PM
机器之心
AI 搜索热潮背后:注定要逾越场景的门槛
在 2024 上半年并算不明朗的 AI 应用局势中,AI 搜索正成为新共识并迎来了一波热潮,短时间内涌现出了多个 AI 搜索产品。 其中,国外原生 AI 搜索工具 Perplexity AI 最新估值已经接近30 亿美元、GenSpark、You 均表现不俗;国内天工 AI 、秘塔搜索等也在打磨自身产品力。 AI 搜索不仅在产品形态上革新了传统搜索引擎的信息罗列模式以及备受诟病的竞价排名广告,还能解决聊天机器人信息滞后和幻觉问题,让传统搜索引擎的交互变得更加智能。
7/4/2024 6:11:00 PM
王悦
陶哲轩支持!AI数学奥林匹克竞赛进步奖公布,奖金100多万美元
大模型做数学题到底如何,不妨让它参与一下这种级别的比赛。 「AI 数学奥林匹克竞赛(AIMO 进步奖)的初步成绩已公布。根据排行榜的数据,目前看来,获胜的程序在私人测试中正确回答了 29/50 道题,这一成绩比预期的要高。」刚刚,陶哲轩在个人博客中公布了这一消息。AIMO 最初由一家搞机器学习量化交易的非银行金融机构 XTX Markets 发起,主要是让参与者使用 AI 模型解决国际数学难题,而本次进步奖的目标是创建能够解决用 LaTeX 格式编写的复杂数学问题的算法和模型。这将有助于推动人工智能模型的数学推理能
7/4/2024 6:09:00 PM
机器之心
全新TextGrad框架:用GPT-4o作引擎,自动优化端到端任务
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]该文章的作者团队来自于斯坦福大学,共同第一作者团队Mert Yuksekgonul,Federico Bianchi, Joseph Boen, Sheng Liu, Zhi HuangM
7/4/2024 6:07:00 PM
机器之心
央视点赞国产AI复活召唤术,兵马俑竟与宝石老舅对唱Rap?
沉睡了两千多年的兵马俑,苏醒了?一句秦腔开场,将我们带到了黄土高原。如果不是亲眼所见,很多观众可能难以想象,有生之年还能看到兵马俑和宝石 Gem 同台对唱《从军行》。「青海长云暗雪山,孤城遥望玉门关。」古调虽存音乐变,声音依旧动人情:这场表演背后的「AI 复活召唤术」,叫做 EMO,来自阿里巴巴通义实验室。仅仅一张照片、一个音频,EMO 就能让静止形象变为惟妙惟肖的唱演视频,且精准卡点音频中的跌宕起伏、抑扬顿挫。在央视《2024 中国・AI 盛典》中,同样基于 EMO 技术,北宋文学家苏轼被「复活」,与李玉刚同台合
7/4/2024 6:01:00 PM
机器之心
一张照片创造 1 分钟人物视频,商汤发布首个“可控”人物视频生成大模型 Vimi
感谢商汤科技在世界人工智能大会(WAIC)上发布了首个“可控”人物视频生成大模型 Vimi,通过一张任意风格的照片就能生成和目标动作一致的人物类视频,并支持多种驱动方式,可通过已有人物视频、动画、声音、文字等多种元素进行驱动。与图片表情控制类技术只能控制头部表情动作不同,商汤称 Vimi 不但可以实现精准的人物表情控制,还可实现在半身区域内控制照片中人物的自然肢体变化,并自动生成与人物相符的头发、服饰及背景变化。同时 Vimi 可稳定生成 1 分钟的单镜头人物类视频,画面效果不会随着时间的变化而劣化或失真,满足娱乐
7/4/2024 5:59:12 PM
沛霖(实习)
不到60秒就能生成3D「手办」,Meta发力3D生成,ChatGPT时刻要来了吗?
3D 生成,一直在等待它的「ChatGPT时刻」。一直以来,创作 3D 内容是设计和开发视频游戏、增强现实、虚拟现实以及影视特效中最重要的部分。然而,3D 生成具有独特而艰巨的挑战,这是图像和视频等其他生成内容所不具备的。首先,3D 内容在艺术质量、生成速度、3D 网格结构和拓扑质量、UV 贴图结构以及纹理清晰度和分辨率方面具有严格的标准;其次,与其他研究相比,可用的数据量少。虽然该领域有数十亿张图像和视频可供学习,但可用于训练的 3D 内容数量要少三到四个数量级。因此,现阶段的3D 生成还必须从非 3D 的图像和
7/4/2024 5:55:00 PM
机器之心
售价预计 2 万美元,特斯拉二代人形机器人 Optimus 亮相世界人工智能大会
据上证报报道,特斯拉二代人形机器人 Optimus 今日正式亮相 2024 世界人工智能大会(WAIC 2024)。第二代 Optimus 最早于去年 12 月 13 日首次亮相,相比前代产品,其改进包括如下方面:采用了全部由特斯拉自主设计和制造的执行器和传感器;整体外观设计更加精细;行走速度提高了 30%;重量减轻了 10 公斤,同时平衡感和身体控制能力得到改善,视频中演示了其做深蹲的动作;配备了全新的双手,能够抓握更重的物体并进行更加精细的操作。近期,二代 Optimus 已经在特斯拉工厂尝试“打工”。借助视觉
7/4/2024 5:36:03 PM
远洋
中国首款全尺寸通用人形机器人开源公版机“青龙”发布:高 185cm / 重 80kg,算力支持 400TOPS
据《上海证券报》报道,今天开幕的 2024 世界人工智能大会(WAIC 2024)期间,中国首款全尺寸通用人形机器人开源公版机“青龙”正式发布。IT之家汇总该机器人主要信息如下:“青龙”身高 185cm,体重 80kg,全身拥有 43 个主动自由度,关节峰值扭矩最大 400N・m,算力支持 400TOPS。其拥有高度仿生的躯干构型、拟人化的运动控制,支持多模态机动 / 感知 / 交互 / 操控。其同时具备高机动下肢行走配置、轻量化高精度上肢作业配置,支持快速行走、敏捷避障、稳健上下坡、抗冲击干扰四大运动功能。据报道
7/4/2024 5:33:21 PM
清源
全球 AI 面临 6000 亿美元难题,人工智能泡沫正在接近临界点
【新智元导读】AI 基础设施的巨额投资,和实际的 AI 生态系统实际收入之间,差距已经到了不可思议的地步。曾经全球 AI 面临的 2000 亿美元难题,如今已经翻成了 6000 亿美元。现在,业内关于 AI 模型收入的质疑声,已经越来越大。动辄投入几万亿美元打造基础设施,跟部分国家的 GDP 不相上下,然而从 AI 模型中得到的回报,究竟能有几何?在 2023 年 9 月,来自红杉资本的 David Cahn 发表了一篇名为《AI 的 2000 亿美元问题》的文章,目的是探讨:「AI 的收入都去哪了?」根据报告,当
7/4/2024 5:14:30 PM
清源
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
Sora
3D
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind