应用

对话上交苏剑波教授：直面手语的「方言」多样性与系统「通用性」挑战｜GAIR live

作为上海交通大学自动化系的资深教授，苏剑波坚守着一条科研信条：研究工作需源源不断地注入活力。他曾阐释这一理念：“一个研究者在踏入某一科学领域时，应选取一个能够长期深耕、并随着理论及技术进步而能不断更新研究内容的主题，这才是研究者始终能保持学术活力的根本原因。 ”苏教授的研究领域覆盖了智能机器人理论与技术、多传感器信息与智能融合、机器学习与人机交互等科学研究持续的热点领域。

3/15/2024 5:20:00 PM

吴彤

对话南佛罗里达大学孙宇教授：当大语言模型用于机器人任务规划丨IJAIRR

现代化社会，哪些工作场景最需要机器人的帮助？在工业领域，有著名的机器人“四大家族”——发那科、ABB、安川、库卡，经过百余年的发展技术越发成熟，在工业场景已经得到深入而广泛的应用。相比之下，生活场景中的服务型机器人历史则短得多。

3/15/2024 4:03:00 PM

乔燕薇

腾讯联合清华大学、香港科技大学推出全新图生视频模型“Follow-Your-Click”：用户指哪动哪

感谢腾讯和清华大学、香港科技大学联合推出全新图生视频模型 “Follow-Your-Click”，目前已经上架 GitHub（代码四月公开），同时还发表了一篇研究论文（IT之家附 DOI:2403.08268）。这款图生视频模型主要功能包括局部动画生成和多对象动画，支持多种动作表达，如头部调整、翅膀拍动等。据介绍， Follow-Your-Click 可以通过用户的点击和简短动作提示生成局部图像动画。用户只需点击对应区域，加上少量提示词，就可以让图片中原本静态的区域动起来，一键转换成视频，比如让物体微笑、跳舞或飘动

3/15/2024 3:49:15 PM

问舟

人形机器人：视频里性感，现实中孤独

机器之能报道编辑：Sia“我们的一些竞争对手曾公开声明，他们使用五根手指的手基本上是为了进行品牌推广。”昨天 Figure 01 又让无数人惊掉下巴。这次不是融资金额，而是一边归置餐具一边唠嗑的能力。形成鲜明对比的是，在北美最大的制造业和供应链贸易盛会 MODEX 上，人形机器人少得可怜。除了 Digit，还有一个给人取零食的人形机器人，不过是靠远程操控。Reflex Robotics 的人形机器人能从不同高度的货架上拿取物品，底部是轮子，不是自主运行，而是远程操控。对手上热搜，一支由八台 Digit 组成的工作小

3/15/2024 3:49:00 PM

机器之能

智谱AI狂飙：与商业化博弈的一年

2023 年 12 月 AI 科技评论在搜狐网络大厦见到智谱AI COO 张帆时，张帆如是说。张帆在 2023 年 3 月加入中国大模型领域“当红炸子鸡”智谱负责商业化，他感慨：“大模型不仅把知识给压缩了，还把时间给压缩了。 ”最直接的体现是，在过去的 9 个月，张帆以每个月见大约 100 家客户的速度在推进智谱的大模型商业化，2023 年结束时，张帆团队已拜访了上千家客户。

3/15/2024 3:36:00 PM

张进

苹果大模型MM1杀入场：300亿参数、多模态、MoE架构，超半数作者是华人

苹果也在搞自己的大型多模态基础模型，未来会不会基于该模型推出相应的文生图产品呢？我们拭目以待。今年以来，苹果显然已经加大了对生成式人工智能（GenAI）的重视和投入。此前在 2024 苹果股东大会上，苹果 CEO 蒂姆・库克表示，今年将在 GenAI 领域实现重大进展。此外，苹果宣布放弃 10 年之久的造车项目之后，一部分造车团队成员也开始转向 GenAI。如此种种，苹果向外界传达了加注 GenAI 的决心。目前多模态领域的 GenAI 技术和产品非常火爆，尤以 OpenAI 的 Sora 为代表，苹果当然也想要在

3/15/2024 3:35:00 PM

机器之心

Sora竟是用这些数据训练的？OpenAI CTO坦白惹众怒

采访首次揭示出 Sora「有所为（比如，将生成效果逼向极限）」和「有所为不为（比如短期内不开放、不生成公众人物）」背后的深层考量——找到一条将 AI 融入日常生活的正确道路是极其困难的，但也绝对值得一试。OpenAI 的 Sora 在今年 2 月横空出世，把文生视频带向了新阶段。它能够根据文字提示生成超现实场景。Sora 的可适用人群受限，但是在各媒体平台上，Sora 的身影无处不在，大家都在期待着使用它。在前几天的访谈中，三位作者透露出 Sora 的更多细节，包括它处理手部时仍然存在困难，但正在优化。他们也对 S

3/15/2024 3:28:00 PM

机器之心

18个月，开创AI药研先例，Insilico公开其首款AI药物研发全过程，登Nature子刊

编辑 | 凯霞去年 6 月，Insilico Medicine 宣布全球首款 AI 设计的药物 INS018_055 进入 II 期临床试验，首批患者给药。近日，Insilico 在《Nature Biotechnology》发表题为《A small-molecule TNIK inhibitor targets fibrosis in preclinical and clinical models》的文章，重点介绍了其声称的第一个 AI 生成和发现的药物 INS018_055 的整个历程。Insilico 创始人

3/15/2024 3:17:00 PM

ScienceAI

星舰首次进入太空轨道，里程碑式突破：人类离火星旅行又近一步

它会带我们飞向外星吗？成功入轨，星舰 Starship 这次向前迈进了一大步。美国东部时间 3 月 14 日早上 9 点 25 分，随着人们整齐一致的倒数声，星舰在得克萨斯州南部博卡奇卡海滩附近的 Starbase 基地顺利升空。今天的发射准备工作较为顺利。在短暂推迟后，33 台猛禽发动机均成功点火并顺利升空。火箭在 52 秒达到最大动压点（Max Q），这是一个航空术语，指飞行器在飞行过程中经历最大动态压力的位置。2 分 42 秒后，一二级火箭成功完成了热分离。星舰飞船 SN28 启动 6 台猛禽发动机把自己推离

3/15/2024 3:13:00 PM

机器之心

技术大揭秘！荣耀曝光首款AI PC，MagicBook Pro 16现场谍照抢先看

笔记本未来已来？生成式人工智能在个人电脑（PC）领域的应用成为新一轮角力之处，当前芯片厂商和 PC 品牌商都十分看好 AI PC 市场。相较于普通的 PC，AI PC 通过在电脑端运行经过压缩和优化的大模型，让用户体验到更多生成式 AI 应用，比如文生图、智能创作。2024 开年伊始，芯片和 PC 厂商便开始在 AI PC 领域发力。在 1 月 CES2024 博览会上，英伟达、AMD、英特尔和高通均秀起了各自在集成 AI 技术方面的最新进展。而对于 PC 厂商而言，要抓住这波生成式 AI 发展机遇，通过性能强大、

3/15/2024 3:05:00 PM

机器之心

讲座预约 | 四位专家大论道：AI+手语识别，技术革新与应用前景｜GAIR live

在这个充满创新的时代，技术正以前所未有的速度改变我们的生活。然而，对于那些生活在无声世界中的听障和聋哑人士来说，沟通的障碍依然存在。幸运的是，手语识别技术的出现，为打破这一障碍带来了希望。

3/15/2024 9:46:00 AM

吴彤

海尔联合乐聚展出人形机器人“夸父”：支持洗衣、浇花等操作，搭载开源鸿蒙

感谢3 月 14 日至 16 日，海尔机器人、乐聚机器人在 2024 年中国家电及消费电子博览会（简称：AWE）联合展出了国内首款面向家庭场景的人形机器人 ——Kuavo（夸父）。IT之家从官方获悉，Kuavo（夸父）作为国内首款可跳跃、可适应多地形行走的开源鸿蒙人形机器人，在 AWE 展会现场除了展示其跳跃、快走等控制性能，还展示了洗衣、浇花、插花、晾衣服等近期学习的手部操作成果。去年 12 月底，乐聚机器人与海尔家庭机器人达成了战略合作，计划推进人工智能及机器人在海尔智慧家庭场景中的应用及服务机器人产业发展。官

3/15/2024 8:02:36 AM

浩渺

李开复旗下 AI 模型“零一万物 API”上线，支持文档理解、图片问答等

感谢李开复旗下零一万物日前上线官方 API ，用户可以体验 Yi 系列 AI 大模型，其中包含 yi-34b-chat-0205、yi-34b-chat-200k、yi-vl-plus。IT之家汇总如下：yi-34b-chat-0205：基于开源版进行深度优化的版本，指令遵循能力提升近 30%，模型回复延迟大大降低。适用于聊天、问答、对话、协作、翻译等场景。yi-34b-chat-200k：200K 超长上下文，支持处理约 20w ~ 30w 个中文汉字（约为 1 本《哈利波特》）或英文单词。适用于多篇文档内容理解

3/15/2024 7:17:11 AM

浩渺

3 个实用小技巧，帮你更好地使用 Midjourney 新功能 Character Reference ！

大家好，这里是和你们一起探索 AI 绘画的花生~ 继推出 Style Reference 风格一致性功能后，Midjourney 终于在前几天上线了备受大家期待的新功能 Character Reference （角色参考），用于保持角色形象的一致性。前面已经有文章详细讲解了 Character Reference 的具体用法，今天我再推荐 3 个实用小技巧，帮助大家更好地使用这项新功能。相关推荐回顾：一、提升人物面部相似度 Character Reference 可以让我们在生成不同图像时，保持其中角色形象的一致

3/15/2024 1:09:15 AM

夏花生

因聚而生，数智有为：华为举办中国合作伙伴大会2024

今天上午，华为中国合作伙伴大会 2024 在深圳开幕。大会以 “因聚而生，数智有为” 为主题，面向数智化转型的浪潮，华为携手伙伴共同探讨如何通过强化 “伙伴华为” 体系，帮助客户抓住数智化转型的巨大机遇，加速迈向智能世界。我们正处于数字经济迅猛发展的前沿，数字化、智能化、低碳化已经成为经济和社会发展的关键驱动力，为千行万业的数智化转型带来了前所未有的商业机会和经济价值，而可持续化也正给中国政企市场的发展带来巨大的机遇。在这个大趋势下，各行业和企业数智化转型升级需求正在不断涌现。华为常务董事、ICT 基础设施业

3/14/2024 5:52:00 PM

新闻助手

AI4Science与LLM的碰撞：生物分子+文本的联合建模，人大高瓴、微软、华科、中科大团队最新综述

作者 | 裴启智随着大模型和 AI4Science 的蓬勃发展，越来越多的工作开始关注生物分子（Biomolecule）与自然语言（Language）的联合建模。这种方法利用文本数据中所包含的生物分子的丰富、多方面的描述，增强模型对其的理解，提高生物分子属性预测等下游任务的效果，为全面表示和分析生物分子开辟了新的途径。近日，人大高瓴联合微软、华科、中科大等机构发布了综述文章：《Leveraging Biomolecule and Natural Language through Multi-Modal Learni

3/14/2024 4:30:00 PM

ScienceAI

可训练24万亿参数的大模型，Cerebras 推出其下一代晶圆级 AI 芯片

图：Cerebras 第三代晶圆级 AI 巨型芯片 WSE-3。（来源：Cerebras）编辑 | 白菜叶人工智能超级计算机公司 Cerebras 表示，其下一代晶圆级人工智能芯片可以在消耗相同电量的情况下将性能提高一倍。Wafer Scale Engine 3 (WSE-3，文中又称 CS-3) 包含 4 万亿个晶体管，由于使用了更新的芯片制造技术，比上一代增加了 50% 以上。该公司表示将在新一代人工智能计算机中使用 WSE-3，这些计算机目前正在 Dallas 的一个数据中心组装，这将是一台能够执行 8 ex

3/14/2024 4:28:00 PM

ScienceAI

上海AI实验室开源发布高质量语料“万卷CC”

近日，上海人工智能实验室（上海AI实验室）发布新一代高质量大模型预训练语料“万卷CC”（WanJuan-CC），首批开源的语料覆盖过去十年互联网上的公开内容，包含1千亿字符（100B token），约400GB的高质量英文数据。作为“大模型语料数据联盟”今年首发的开源语料，WanJuan-CC将为学界和业界提供大规模、高质量的数据支撑，助力构建更智能可靠的AI大模型。预训练数据的质量对大模型整体性能至关重要。

3/14/2024 3:40:00 PM

王悦

资讯热榜

Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 Ollama 支持全线的 Qwen 3 模型 Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流小米开源“Xiaomi MiMo”大模型：为推理而生，以 7B 参数超越 OpenAI o1-mini Unsloth发布Qwen3动态量化2.0版本，优化本地运行体验小米首个推理大模型Xiaomi MiMo开源 DeepSeek-Prover-V2-671B 模型开源，数学推理领域迎来新突破性能与效率的双赢:Qwen3横空出世，MoE架构大幅降低部署成本

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 模型数据机器人谷歌大模型 Midjourney 智能用户开源学习 GPT 微软 Meta 图像 AI创作技术论文 Gemini Stable Diffusion 马斯克算法蛋白质芯片代码生成式英伟达腾讯神经网络研究计算 Anthropic Sora 3D AI for Science AI设计机器学习开发者 GPU AI视频华为场景人形机器人预测百度苹果伟达 Transformer 深度学习 xAI Claude 模态字节跳动大语言模型搜索驾驶具身智能神器推荐文本 Copilot LLaMA 算力安全视觉视频生成训练干货合集应用大型语言模型亚马逊科技智能体 AGI DeepMind

应用

对话上交苏剑波教授：直面手语的「方言」多样性与系统「通用性」挑战｜GAIR live

对话南佛罗里达大学孙宇教授：当大语言模型用于机器人任务规划丨IJAIRR

腾讯联合清华大学、香港科技大学推出全新图生视频模型“Follow-Your-Click”：用户指哪动哪

人形机器人：视频里性感，现实中孤独

智谱AI狂飙：与商业化博弈的一年

苹果大模型MM1杀入场：300亿参数、多模态、MoE架构，超半数作者是华人

Sora竟是用这些数据训练的？OpenAI CTO坦白惹众怒

18个月，开创AI药研先例，Insilico公开其首款AI药物研发全过程，登Nature子刊

星舰首次进入太空轨道，里程碑式突破：人类离火星旅行又近一步

技术大揭秘！荣耀曝光首款AI PC，MagicBook Pro 16现场谍照抢先看

讲座预约 | 四位专家大论道 ：AI+手语识别，技术革新与应用前景｜GAIR live

海尔联合乐聚展出人形机器人“夸父”：支持洗衣、浇花等操作，搭载开源鸿蒙

李开复旗下 AI 模型“零一万物 API”上线，支持文档理解、图片问答等

3 个实用小技巧，帮你更好地使用 Midjourney 新功能 Character Reference ！

因聚而生，数智有为：华为举办中国合作伙伴大会2024

AI4Science与LLM的碰撞：生物分子+文本的联合建模，人大高瓴、微软、华科、中科大团队最新综述

可训练24万亿参数的大模型，Cerebras 推出其下一代晶圆级 AI 芯片

上海AI实验室开源发布高质量语料“万卷CC”

讲座预约 | 四位专家大论道：AI+手语识别，技术革新与应用前景｜GAIR live