AI在线 AI在线

应用

小冰联合视美泰共创ShiMeta数字人解决方案:大模型加持,让每一个大屏终端都成为全新的交互载体

2024年6月21日,小冰公司与AIoT头部企业视美泰宣布达成战略合作,共同推出ShiMeta数字人解决方案。双方联合打造多种形态的数字人智能交互大屏终端,将小冰AI大模型、数字人技术与视美泰丰富的硬件商业生态相融合,让数字人走入各类行业场景,为千行百业注入全新的生产力,提升用户体验和服务效率,带来更多智能化变革。小冰×视美泰:丰富的硬件商业生态方案将小冰大模型以及神经网络渲染、超级自然语音等先进数字人技术,与视美泰高性能主板、高清摄像头、麦克风阵列、设备管理平台等进行了深入整合,实现大屏终端“开箱即用”,同时后台
6/21/2024 6:11:00 PM
新闻助手

一手测评Claude 3.5:玩梗、看病、耍心眼 、做数学题,它真比GPT-4o强吗?

机器之能报道编辑:杨文玩梗、看病、耍心眼、做数学题,「新王」Claude 3.5能力真那么玄乎?它来了,它来了,它带着 Claude 3.5 Sonnet 走来了!蛰伏三个月,就在昨晚,OpenAI 的「劲敌」Anthropic 上新了,推出新一代模型 ——Claude 3.5 Sonnet!这款大模型有啥独到之处?首先,它更能把握住细微差别、幽默和复杂指令,并且书写语气更自然、亲切。它还是Anthropic最强的视觉模型,擅长解释图表、图形或者从不完美的图像中转录文本等任务。此外,它在推理、阅读理解、数学、科学和
6/21/2024 6:02:00 PM
机器之能

乐聚夸父人形机器人亮相 HDC 2024,搭载华为云盘古具身智能大模型

乐聚夸父人形机器人今日下午亮相 HDC 2024 华为开发者大会,搭载华为云盘古具身智能大模型。▲ 夸父与华为常务董事、华为云 CEO 张平安击掌华为常务董事、华为云 CEO 张平安在介绍盘古具身大模型的环节中,向观众展示了夸父人形机器人搭载盘古具身智能大模型后,在工业、家庭场景中展现的潜力,并与夸父人形机器人进行击掌互动。IT之家查阅 HDC 2024 日程表获悉,6 月 22 日,乐聚机器人董事长冷晓琨将在盘古具身智能大模型专题论坛上作《建设“人形机器人 ”开放生态平台,打造通用具身智能解决方案》主题报告;6
6/21/2024 5:51:02 PM
汪淼

快手可灵上线图生视频与最长 3 分钟的视频续写功能

感谢快手可灵新功能“图生视频”和“视频续写”今日上线。图生视频功能,支持将静态图像转化为 5 秒钟视频,用户可通过提示词文本控制图像中物体的运动;视频续写功能,支持对生成视频一键续写和连续多次续写,最长可生成约 3 分钟视频;此外文生视频新增 9:16 和 1:1 视频尺寸选择。 IT之家附快手可灵官方网站:,能够生成大幅度的合理运动,模拟物理世界特性。可灵使用了 DiT 架构,快手对模型中的隐空间编 / 解码、时序建模等模块进行了升维处理。在隐空间编 / 解码上,快手自研了 3D VAE 网络,实现时空同步压缩,
6/21/2024 5:06:01 PM
沛霖(实习)

抢疯了,腾讯给大模型人才,定了一个前所未有的标准

「21 世纪什么最贵?人才!」二十年前的黎叔语录,现在听来也不过时。这两年,大模型赛道风起云涌。科技公司们全力投入生成式 AI 技术的研发,期待将新的突破整合到自家产品中。OpenAI 是一个非常成功的样本,并受到了研究员、工程师和投资人们的广泛关注与深刻讨论:为什么是 OpenAI?它的成功不只来自于多年的坚持技术探索、投资者不断注入的资金,更重要的是一批顶尖 AI 研究人员的聚集。我们能看到,在 ChatGPT、Sora、GPT-4o 等划时代产品的背后,有一长串名单的核心贡献者,一家科技公司想要持续「伟大」,
6/21/2024 3:37:00 PM
机器之心

2024 WAIC「全球创新项目路演」征集!最高可获千万算力补贴

新一代人工智能正在全球范围内蓬勃兴起,为经济社会发展注入了新动能,我国正以开放的胸襟拥抱 AI,上海更以包容的氛围滋养 AI,持续打造更加融通开放的生态、更加活跃的创新集群、更加泛在的超级场景、更加安全的敏捷治理。 7月4日-6日,2024 世界人工智能大会(WAIC)如期在上海举行,本次将围绕“以共商促共享 以善治促善智”的主题,打造“会议论坛、展览展示、评奖赛事、智能体验”四大核心内容。 在每年的世界人工智能大会上,「全球创新项目路演」亦成为重要看点。
6/21/2024 3:25:00 PM
王悦

Luma、Runway轮番炸场,视频生成卷出新高度,Sora还能称霸吗?来这场WAIC视频生成论坛寻找答案

2023 年 PIKA 发布时,马斯克曾论断称 2024 年将是「人工智能电影」元年。年初 Sora 惊艳亮相、大杀四方,接着 Stable Video Diffusion 、LTX Studio、谷歌 Veo 轮番炸场,再到近期的可灵、Luma 和 Runway 隔空斗法……短短半年时间,众多 AI 视频应用如雨后春笋般涌现,不仅将视频生成技术推向了新的高度,而且拓展了 AI 视频的应用范围,赋予未来更多可能性。如今,发展多模态能力已成为 AIGC 应用的大势所趋,伴随着视频生成技术的不断完善,以及越来越多 AI
6/21/2024 3:23:00 PM
机器之心

无论真实还是AI视频,「摩斯卡」都能重建恢复4D动态可渲染场景

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]雷嘉晖,美国宾夕法尼亚大学计算机系博士生 (2020 - 今), 导师为 Kostas Daniilidis 教授,目前主要研究方向为四维动态场景几何的建模表示和算法以及应用。他在计算机视
6/21/2024 3:08:00 PM
机器之心

力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用

如今,大模型领域更卷了!前脚 OpenAI 发布 GPT4o,硬控全场,后脚就被最大的竞争对手 Anthropic 超越了。刚刚,Anthropic 发布了全新大模型 Claude 3.5 Sonnet,号称是迄今为止最智能的模型。据介绍,Claude 3.5 Sonnet 是 Anthropic 即将推出的 Claude 3.5 系列的首个版本。该模型提高了整个领域的智能水平,在绝大多数基准评估中都超越了竞品大模型和自家前代最强 Claude 3 Opus。与此同时,运行速度、成本与自家前代 Claude 3 S
6/21/2024 3:03:00 PM
机器之心

腾讯混元文生图大模型开源训练代码,发布LoRA与ControlNet插件

6月21日,腾讯混元文生图大模型(以下简称为混元DiT模型)宣布全面开源训练代码,同时对外开源混元DiT LoRA 小规模数据集训练方案与可控制插件ControlNet。这意味着,全球的企业与个人开发者、创作者们,都可以基于混元DiT训练代码进行精调,创造更具个性化的专属模型,进行更大自由度的创作;或基于混元DiT的代码进行修改和优化,基于此构建自身应用,推动技术的快速迭代和创新。作为中文原生模型,用户在通过混元DiT的训练代码进行精调时,可以直接使用中文的数据与标签,无需再将数据翻译成英文。此前,腾讯混元文生图大
6/21/2024 2:04:00 PM
新闻助手

阿里云推出首个 AI 程序员,具备架构师、开发 / 测试工程师等岗位技能

在今天的阿里云上海 AI 峰会上,阿里云推出首个“AI 程序员”,具备架构师、开发工程师、测试工程师等岗位技能,能完成任务分解、代码编写、测试、问题修复、代码提交整个过程,号称最快“分钟级”完成应用开发。据介绍,该“AI 程序员”是基于通义大模型构建的多智能体,包含任务分解、编码、测试等不同板块,与“通义灵码”有所不同。在收到用户需求后,“AI 程序员”就可实现软件开发“一条龙”:理解需求-拆分任务-编写代码-识别并解决报错-提交代码。 据IT之家此前报道,阿里云去年 11 月推出了 AI 编程工具通义灵码,兼容 
6/21/2024 1:39:41 PM
清源

武大等开源大幅面高清卫星影像数据集:涵盖 21 万 + 地理目标,复杂地理空间场景知识精准生成

AI 卫星影像知识生成模型数据集稀缺的问题,又有新解了。来自武汉大学、上海 AI 实验室、西工大等 9 家机构共同推出了该领域的大型数据集,涵盖了 21 万个地理目标和 40 万个目标-关系三元组。而且像机场、港口、立交桥等这样复杂地理空间场景,也都包括在了数据集当中。具体来说,该数据集名为 RSG,主要面向卫星影像中的目标检测(OBD)和场景图生成(SGG)任务。SGG 有助于促进模型对地理空间场景从感知到认知的智能理解,但一直缺乏大幅面、超高分辨率的卫星影像数据。而 RSG 的出现很好地填补了这一空白,一同提出
6/21/2024 1:28:04 PM
汪淼

软银创始人孙正义:新一轮投资将致力于打造“超级人工智能”

据彭博社报道,软银集团创始人孙正义今天在年度大会上对股东表示,他计划打造一个“超级人工智能”时代。孙正义此次描绘了创造出“比人类聪明数千倍”的人工智能的雄心壮志。他表示,Arm 的芯片将支持一个由机器人和强大数据中心组成的生态系统,可以共同治疗癌症、打扫房屋、与孩子一起玩耍。孙正义在今天的大会上出现了数次情绪激动的状况,直言想在永远离开世界之前“改变世界”。他谈到了自己的故友史蒂夫・乔布斯,“当我意识到自己的遗产与乔布斯的遗产相比,实在是相形见绌时,我常常会泪流满面。”“实现超级人工智能是我要做的事情,”孙正义说道
6/21/2024 1:21:56 PM
清源

捕捉关键球员默契度,TuGraph程序员用图计算加大模型做足球预测

2024年欧洲杯比赛正酣。在赛场之外,一些围绕观赛的自发科技创新也开始涌现,成为了一道独特的风景。近日,据TuGraph图计算官方微信,其创新小组研发了一项融合图计算、大模型等技术的足球赛事分析工具“智猜足球”,旨在探索新兴人工智能技术在体育赛事应用的可行性。据介绍,这项应用分析了一年多以来欧洲各球队和俱乐部的赛事公开数据,利用图算法构建了一张球员关系网络图,分析了近30000名球员之间的协作关系,并借助图神经网络(GNN)、Transformer、大语言模型等前沿技术,量化球员间的默契配合与竞技对抗元素,训练了近
6/21/2024 11:34:00 AM
新闻助手

百图生科、智子引擎获新投资;Anthropic发布其最强大模型Claude3.5;Ilya创立安全超级智能公司丨AI情报局

融资快报百图生科获得港投公司的战略投资:百图生科由百度创始人李彦宏牵头发起,依托原BV百度风投生物智能团队及其50家全球被投企业的生态基础组建。 计划投入上百亿元建设自主可控的生物计算平台,利用前沿算法、智能传感器、智能芯片、微纳机器人等AI能力解决生命科学问题。 (IT桔子)智子引擎获得Pre-A轮投资:智子引擎是一家多模态大模型研究和开发商,发布了第一款应用级多模态ChatGPT产品“元乘象 ChatImg”。
6/21/2024 10:17:00 AM
我在思考中

德国研究团队发布新 AI 模型,可根据网球运动员肢体语言识别情绪

据 ScienceDaily17 日报道,德国卡尔斯鲁厄理工学院和杜伊斯堡-埃森大学研究人员借助计算机辅助神经网络,准确识别了网球运动员在比赛中的肢体语言所表达的情绪。团队首次利用实际比赛数据训练了这一基于 AI 的模型,研究成果登上了最新一期人工智能领域学术期刊《知识系统》。IT之家附链接:,两所学校的体育科学、软件开发与计算机科学研究人员开发了一种特殊的 AI 模型,利用卷积神经网络识别网球运动员的情感状态,并使用模式识别程序分析了实际比赛中网球运动员的视频。卡尔斯鲁厄理工学院体育与运动科学研究所 Darko
6/21/2024 10:10:06 AM
清源

“力压 GPT-4o 和 Gemini 1.5 Pro”,Anthropic 推出 Claude 3.5 Sonnet AI 模型

Anthropic 今天(6 月 21 日)推出了 Claude 3.5 Sonnet,这是 Claude 3.5 系列的首个模型版本,在各项评估中优于 OpenAI 的 GPT-4o 和谷歌的 Gemini 1.5 Pro。Claude 3.5 Sonnet 在前代的基础上迭代升级,性能更快,编码、视觉和自然语言理解能力更强。Claude 3.5 Sonnet 属于中等尺寸模型,介于小型 Haiku 和高端 Opus 之间,但 Anthropic 声称,根据内部基准测试,Sonnet 的性能甚至超过了顶级 Opu
6/21/2024 9:28:39 AM
故渊

有望不再建议往披萨里加胶水?数据显示谷歌已降低 Reddit 对 AI 搜索结果的影响

今年的谷歌 I / O 大会上,谷歌推出了“重磅功能”—— 基于 AI 的搜索(AI 摘要 / AI Overviews)。然而在此功能上线后不久,不少用户反馈称 AI 会生成一些奇怪的结果,例如往披萨里加胶水防止配料掉落、每天吃几块小石头等等。据悉,部分奇怪回复是 AI 系统从 Reddit 帖子中提取信息而造成的,例如往披萨里加胶水就来自一个 11 年前的 Reddit 帖子。根据搜索引擎优化平台 SERanking 当地时间 20 日公布的数据显示,Reddit 已经不再是谷歌“AI 摘要”功能信息来源的前十
6/21/2024 8:31:22 AM
清源