应用
海尔联合乐聚展出人形机器人“夸父”:支持洗衣、浇花等操作,搭载开源鸿蒙
感谢3 月 14 日至 16 日,海尔机器人、乐聚机器人在 2024 年中国家电及消费电子博览会(简称:AWE)联合展出了国内首款面向家庭场景的人形机器人 ——Kuavo(夸父)。IT之家从官方获悉,Kuavo(夸父)作为国内首款可跳跃、可适应多地形行走的开源鸿蒙人形机器人,在 AWE 展会现场除了展示其跳跃、快走等控制性能,还展示了洗衣、浇花、插花、晾衣服等近期学习的手部操作成果。去年 12 月底,乐聚机器人与海尔家庭机器人达成了战略合作,计划推进人工智能及机器人在海尔智慧家庭场景中的应用及服务机器人产业发展。官
3/15/2024 8:02:36 AM
浩渺
李开复旗下 AI 模型“零一万物 API”上线,支持文档理解、图片问答等
感谢李开复旗下零一万物日前上线官方 API ,用户可以体验 Yi 系列 AI 大模型,其中包含 yi-34b-chat-0205、yi-34b-chat-200k、yi-vl-plus。IT之家汇总如下:yi-34b-chat-0205:基于开源版进行深度优化的版本,指令遵循能力提升近 30%,模型回复延迟大大降低。适用于聊天、问答、对话、协作、翻译等场景。yi-34b-chat-200k:200K 超长上下文,支持处理约 20w ~ 30w 个中文汉字(约为 1 本《哈利波特》)或英文单词。适用于多篇文档内容理解
3/15/2024 7:17:11 AM
浩渺
3 个实用小技巧,帮你更好地使用 Midjourney 新功能 Character Reference !
大家好,这里是和你们一起探索 AI 绘画的花生~
继推出 Style Reference 风格一致性功能后,Midjourney 终于在前几天上线了备受大家期待的新功能 Character Reference (角色参考),用于保持角色形象的一致性。前面已经有文章详细讲解了 Character Reference 的具体用法,今天我再推荐 3 个实用小技巧,帮助大家更好地使用这项新功能。
相关推荐回顾:一、提升人物面部相似度
Character Reference 可以让我们在生成不同图像时,保持其中角色形象的一致
3/15/2024 1:09:15 AM
夏花生
因聚而生,数智有为:华为举办中国合作伙伴大会2024
今天上午,华为中国合作伙伴大会 2024 在深圳开幕。大会以 “因聚而生,数智有为” 为主题,面向数智化转型的浪潮,华为携手伙伴共同探讨如何通过强化 “伙伴 华为” 体系,帮助客户抓住数智化转型的巨大机遇,加速迈向智能世界。我们正处于数字经济迅猛发展的前沿,数字化、智能化、低碳化已经成为经济和社会发展的关键驱动力,为千行万业的数智化转型带来了前所未有的商业机会和经济价值,而可持续化也正给中国政企市场的发展带来巨大的机遇。在这个大趋势下,各行业和企业数智化转型升级需求正在不断涌现。华为常务董事、ICT 基础设施业
3/14/2024 5:52:00 PM
新闻助手
AI4Science与LLM的碰撞:生物分子+文本的联合建模,人大高瓴、微软、华科、中科大团队最新综述
作者 | 裴启智随着大模型和 AI4Science 的蓬勃发展,越来越多的工作开始关注生物分子(Biomolecule)与自然语言(Language)的联合建模。这种方法利用文本数据中所包含的生物分子的丰富、多方面的描述,增强模型对其的理解,提高生物分子属性预测等下游任务的效果,为全面表示和分析生物分子开辟了新的途径。近日,人大高瓴联合微软、华科、中科大等机构发布了综述文章:《Leveraging Biomolecule and Natural Language through Multi-Modal Learni
3/14/2024 4:30:00 PM
ScienceAI
可训练24万亿参数的大模型,Cerebras 推出其下一代晶圆级 AI 芯片
图:Cerebras 第三代晶圆级 AI 巨型芯片 WSE-3。(来源:Cerebras)编辑 | 白菜叶人工智能超级计算机公司 Cerebras 表示,其下一代晶圆级人工智能芯片可以在消耗相同电量的情况下将性能提高一倍。Wafer Scale Engine 3 (WSE-3,文中又称 CS-3) 包含 4 万亿个晶体管,由于使用了更新的芯片制造技术,比上一代增加了 50% 以上。该公司表示将在新一代人工智能计算机中使用 WSE-3,这些计算机目前正在 Dallas 的一个数据中心组装,这将是一台能够执行 8 ex
3/14/2024 4:28:00 PM
ScienceAI
上海AI实验室开源发布高质量语料“万卷CC”
近日,上海人工智能实验室(上海AI实验室)发布新一代高质量大模型预训练语料“万卷CC”(WanJuan-CC),首批开源的语料覆盖过去十年互联网上的公开内容,包含1千亿字符(100B token),约400GB的高质量英文数据。 作为“大模型语料数据联盟”今年首发的开源语料,WanJuan-CC将为学界和业界提供大规模、高质量的数据支撑,助力构建更智能可靠的AI大模型。 预训练数据的质量对大模型整体性能至关重要。
3/14/2024 3:40:00 PM
王悦
零一万物API正式上线:支持输入30万汉字,看不懂《百年孤独》的人有救了
2024 年,大模型领域的一个趋势越来越清晰:重视优化,面向应用。在去年的百模大战中,科技巨头、创业力量你追我赶,将大模型技术卷到了一个新的高度。有了强大的模型之后,更重要的是将这些能力输出到现实中的应用场景,提升用户体验、构建生态。正因此,大模型厂商们或是开源,或是推出模型 API,都是希望让成果为开发者所用,以此为基础设施构建起繁荣的大模型生态。国内的大模型独角兽公司零一万物,也在今天正式发布了 Yi 大模型 API 开放平台。零一万物 API 开放平台链接: API 开放平台提供以下模型:Yi-34B-Cha
3/14/2024 3:04:00 PM
机器之心
智能体的ChatGPT时刻!DeepMind通用AI向人类玩家进化,开始理解游戏
在 AI 智能体这个领域,谷歌 DeepMind 又有了一项里程碑式研究。视频游戏是 AI 系统的重要试验场。与现实世界一样,游戏也是丰富的学习环境,具有反应灵敏的实时设置和不断变化的目标。从早期与雅达利游戏的合作,到人类大师级水平的《星际争霸 II》系统 AlphaStar,谷歌 DeepMind 在人工智能和游戏领域陆续推出过不少影响力研究。刚刚,谷歌宣布了又一项里程碑式研究:SIMA(Scalable Instructable Multiworld Agent),一种适用于 3D 虚拟环境的通用 AI 智能体
3/14/2024 2:58:00 PM
机器之心
4万亿个晶体管,单机可训练比GPT4大10倍的模型,最快最大的芯片面世
刚刚,芯片创业公司 Cerebras 宣布了该公司历史上最重要的消息,「我们发布了世界上最快的芯片,该芯片拥有高达 4 万亿个晶体管。」一直以来,Cerebras 一直在往「大」的芯片方面发展,此前他们发布的晶圆级引擎(Wafer Scale Engine,WSE-1)面积比 iPad 还大。第二代 WSE-2 虽然在面积上没有变化,但却拥有惊人的 2.6 万亿个晶体管以及 85 万个 AI 优化的内核。而现在推出的 WSE-3 包含 4 万亿个晶体管,在相同的功耗和价格下,WSE-3 的性能是之前记录保持者 WS
3/14/2024 2:54:00 PM
机器之心
四足机器人 ANYmal 解锁新技能:可跑酷,应对工地、灾区等复杂地形
四足机器人 ANYmal 解锁新技能--跑酷。来自苏黎世联邦理工学院的科研团队近日再次升级四足机器人 ANYmal,让其驾驭城市复杂环境,利用运动技巧顺利通过障碍物,并且能熟练应对建筑工地或灾区常见的复杂地形。该团队由机械与工艺工程系的 Marco Hutter 教授领导,结合机器学习与基于模型的控制,升级算法让其可以准确识别和通过碎石堆中的缝隙 / 凹槽,从而可以灵活穿梭复杂地形。ANYmal 可以攀爬障碍物,并执行动态动作从障碍物上跳下来。在这个过程中,ANYmal 像孩子一样通过不断尝试和犯错来学习。现在,当
3/14/2024 2:08:39 PM
故渊
OpenAI机器人,一出手就是王炸
机器之能报道作者:机器之心编辑部网友:波士顿动力要整点新舞步,才能让Figure 01下热搜。「借助 OpenAI 的能力,Figure 01 现在可以与人全面对话了!」本周三,半个硅谷都在投的明星机器人创业公司 Figure,发布了自己第一个 OpenAI 大模型加持的机器人 demo。这家公司在 3 月 1 日刚刚宣布获得 OpenAI 等公司的投资,才十几天就直接用上了 OpenAI 的多模态大模型。如你所见,得到 OpenAI 大模型能力加持的 Figure 01 现在是这个样子的。它可以为听从人类的命令,
3/14/2024 10:30:00 AM
机器之能
专访上海大学倪兰教授:语言学与手语识别技术的融合突破,解锁交流障碍|GAIR live
在语言学的广阔天地中,手语研究曾是一片未被充分开垦的荒地。 上海大学的倪兰教授,作为中国大陆培养的第一位「手语语言学」方向博士,在谈到自己选择手语方向时仍忍不住感慨,“往前推二十年,语言学界几乎无人涉足这一领域。 ”然而,时光流转至今,这一领域的现状是否得到了改善?
3/14/2024 10:00:00 AM
吴彤
首款生成式 AI 安全解决方案,微软 Copilot for Security 4 月 1 日上线
感谢微软去年 3 月宣布推出 Security Copilot 服务, 当时微软声称这是世界上第一个基于生成式 AI 的安全产品。现在,微软宣布更名后的“Copilot for Security”将于 4 月 1 日正式上线。据介绍,这款行业领先的产品是唯一一款生成式 AI 解决方案,可帮助安全和 IT 专业人员增强其技能、进行更多协作、查看更多内容并更快地做出响应。 在微软最近进行的一项研究中,经验丰富的安全分析师通过使用 Copilot ,在处理常见安全任务中速度提高了 22%,同时将准确性提高了 7%。 此外
3/14/2024 8:33:51 AM
浩渺
定位“神队友”,谷歌发布 SIMA 模型:具备约 600 项游戏技能
谷歌 DeepMind 团队近日发布了 SIMA 模型,通过训练和学习游戏技能,让其整体操作风格更接近于人类。SIMA 的全称是“Scalable, Instructable, Multiworld Agent”(可扩展、可指导、多世界 Agent),目前仅处于研究阶段,未来可以和你一起玩游戏。SIMA 的定位并非是游戏中的 AI NPC,而是要成为你的队友,默契配合你的操作。SIMA 结合自然语言和图像识别技术,能够理解 3D 游戏世界,希望能成为玩家的默契队友。谷歌与 Hello Games、Embracer、
3/14/2024 8:26:30 AM
故渊
OpenAI 提供支持,Figure 01 人形机器人演示,网友:未来 5-10 年开启疯狂时代
感谢初创公司 Figure AI 今天发布一段新视频,展示了人形机器人 Figure 01 所具备的技能,网友在视频中留言:“未来 5-10 年绝对是一个疯狂的时代”。Figure 01 身高 167.64 厘米(5 英尺 6 英寸),重 59.8 千克(132 磅),最多可负重 20 千克(44 磅),移动速度为每秒 1.2 米(约每小时 2.7 英里)。Figure 01 最大的亮点在于利用 OpenAI 的大型语言模型,可以和人类进行正常的完整对话。由于 OpenAI 模型还支持多模态输入,因此可为 Figu
3/14/2024 8:11:11 AM
故渊
Midjourney 重大更新!深度解析「角色一致性」命令
预告了好久的 MJ 角色一致性功能终于来了, 新的命令“ --cref ”与 样式参考 “--sref”功能类似,但它不是匹配参考样式,而是尝试让角色匹配 "角色参考 "图像,--cref 目前只适用于 niji 6 和 v6 模型。官方文档说明看下图:一、基础使用方法
在提示后输入 --cref URL 并输入字符图像的 URL 网址,再使用--cw 来修改参考强度
默认强度 100 (--cw 100),使用脸部、头发和衣服
3/14/2024 2:24:01 AM
猫仔MAoMAo
OpenAI 首席技术官:文生视频工具 Sora 数月内将公开发布,拟支持生成音频
《华尔街日报》当地时间 13(今)日刊登了对 OpenAI 首席技术官米拉・穆拉蒂的采访。她表示,Sora 将在今年推出,“可能要等几个月”。穆拉蒂表示,除了面向公众公开提供 Sora 外,OpenAI 还计划加入音频生成功能,可能会使场景更为逼真。此外,公司还计划允许用户自己编辑 Sora 生成的内容,“因为 AI 工具并不总能生成准确的结果”。她说,公司正在试图找寻方法,使用户可以自行编辑、创作影音内容。当被问及 OpenAI 使用了哪些数据来训练 Sora 时,穆拉蒂没有给出非常具体的答案:“我不打算详谈所使
3/13/2024 10:30:35 PM
清源
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
蛋白质
xAI
开发者
生成式
人形机器人
神经网络
机器学习
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
字节跳动
工具
华为
AGI
计算
大型语言模型
AI设计
搜索
生成式AI
视频生成
亚马逊
DeepMind
AI模型
特斯拉
场景
深度学习
Transformer
架构
MCP
Copilot
编程
视觉