应用

工业制造、商用和家庭，优必选人形机器人的三场战事

2023 年最后一个交易日 12 月 29 日，总部位于深圳的人形机器人公司优必选科技在香港交易所正式挂牌。上市首日股价一度上涨至 93.45 港元，市值逼近 390 亿港元。在上市仪式现场，熊猫机器人优悠走上舞台，向优必选创始人、董事长兼 CEO 周剑递出锣锤，优必选全新一代工业版人形机器人 Walker S 首次亮相，手持另一个锣锤走向舞台中央，与周剑一起敲响开市锣。这一声，格外稀缺。一为人形机器人本体制造之难。从事机器人技术工作，你需要成为一家机器人公司，有一大群人来建造机器人。“要么全包，要么全无。没有

1/2/2024 11:59:00 AM 机器之心

挑战Transformer，华为诺亚新架构盘古π来了，已有1B、7B模型

5 年前，Transformer 在国际神经信息处理大会 NeurIPS 2017 发表，后续其作为核心网络架构被广泛用于自然语言处理和计算机视觉等领域。1 年前，一项重大的创新引起了人们的广泛关注，那就是 ChatGPT。这个模型不仅能够执行复杂的 NLP 任务，还能以人类对话的方式与人类进行互动，产生了深远的影响。1 年以来，“百模大战” 在业界激烈开展，诞生了如 LLaMA、ChatGLM 和 Baichuan 等开源大模型，推动了 LLM 领域的快速发展。除了通用 LLM，为了支撑更多行业的应用和商业变现，

1/2/2024 11:52:00 AM 机器之心

你们有什么底气和谷歌叫板？Perplexity AI CEO回应质疑

科技巨头的每一步发展，往往意味着一些小企业将陷入阴影当中。不过，福祸相依，也会有企业在巨头发展的过程中，找到自己的发展目标，从竞争中活下来。在 OpenAI 首个开发者日召开后，就有不少企业纷纷被判「死刑」。GPT 的自定义功能让不少刚拿到「赛季」参加资格的初创团队心如死灰。同样，谷歌作为科技巨头，无论是在技术还是资金上都能碾压一众企业，甚至可以说这种碾压往往是「降维打击」型的。AI 驱动的搜索引擎 perplexity 看起来也在被「打击」的范围里。perplexity 是世界上第一个对话式搜索引擎，通过例如 G

1/2/2024 11:16:00 AM 机器之心

测试大语言模型的生物推理能力，GPT-4、PaLM2等均在测试之列

编辑 | 萝卜皮大型语言模型（LLM）的最新进展，为将通用人工智能 (AGI) 整合到生物研究和教育中提供了新机遇。在最新的研究中，佐治亚大学和梅奥诊所的研究人员评估了几个领先的 LLM（包括 GPT-4、GPT-3.5、PaLM2、Claude2 和 SenseNova）回答概念生物学问题的能力。这些模型在包含 108 个问题的多项选择考试中进行了测试，涵盖分子生物学、生物技术、代谢工程和合成生物学等生物学主题。在这些模型中，GPT-4 获得了 90 分的最高平均分，并且在不同提示的试验中表现出最大的一致性。结果

1/2/2024 10:22:00 AM ScienceAI

AIGC落地实践！四招帮你快速搞定运营设计

前言顾这一年，随着 AIGC 浪潮的爆发，掌握 AI 工具已经成为设计师必备技能。今天这篇文章，通过三个案例流程拆解带大家从新时代设计工作流，到必备「四大招式」，到图标设计六大方向，到训练专属模型，再到全流程手把手拆解设计项目，绝对干货满满。更多AIGC实战案例：一、AIGC 在设计中的可行性无论是普通人还是设计师，都可以通过 AI 工具来创作更多的作品，极大地提高设计效能。随着生成式图片准确度越来越高，视频生成的质量越来越清晰，AIGC 在设计中的可能性也越来越广泛。现在运用 AI 工具已经是设计师的必备技

1/2/2024 8:10:55 AM yaoyao

华为放出2023年最后一个大招？CodeArts Snap如何用大模型解放开发者

2022 年 11 月，ChatGPT 横空出世。至今不过短短十三个月，世界就已经因它和其它大模型发生了翻天覆地的变化。在现如今的互联网上，我们能看到大模型生成的无数文本、图片、视频乃至代码和应用软件。尤其是在软件开发方面，使用 AI 的开发者的效率和质量可以远远胜过不使用 AI 的开发者。举个例子，2023 年 5 月华为西安研究所举办了一场软件大赛，要求参赛者在规定时间内完成 10 道软件开发题目。有趣的是，他们允许参赛者使用任意生成式 AI 辅助答题。尽管相比于去年，今年赛题的难度提升了一倍并还加了几道专业级

12/29/2023 2:42:00 PM 机器之心

梅涛：HiDream.ai视频生成已打破业界4秒瓶颈，能够支持15秒以上

文生图的战争尚未结束，视频生成已经开始加速跑了。Pika 爆火以后，视频生成技术的进步成为大众眼中 AIGC 的一个新焦点。马斯克则直接做出预判称，明年将是 “人工智能电影” 元年。而比起文生图的生成效果，如今市面上的 AI 视频生成效果，在实际体验中可以说是一言难尽。在 4-5 秒的时间限制下，实测常见工具对 Prompt 的意图理解水平忽高忽低。输入 “小猫在森林中小提琴”，可能出现猫首人身、一只手是猫爪一只手是人手、有猫没有小提琴、有小提琴但没拉等一系列问题。在实际应用中，如今的文生视频技术面临着准确性、一致

12/29/2023 2:34:00 PM 机器之心

特供版显卡RTX4090D上市，售价12999元

性能与原版 RTX 4090 类似，但降低了一些 AI 运算能力。美国对 AI 计算卡的禁令，终于影响到了普通消费者。本周四，英伟达正式发布了国内特供版高端消费级显卡 ——GeForce RTX 4090D。GeForce RTX 4090D 是一款符合美国出口规定的 RTX 4090 新品，配备 14592 个 CUDA 核心、24GB GDDR6X 内存、384 位宽内存总线、425W 额定功耗，定价与 RTX 4090 相同，均为 12999 元（约合 1828 美元）。为了符合美国出口管制的新规定，与 RT

12/29/2023 2:23:00 PM 机器之心

这次重生，AI要夺回网文界的一切

重生了，这辈子我重生成了 MidReal。一个可以帮别人写「网文」的 AI 机器人。这段时间里，我看到很多选题，偶尔也会吐槽一下。竟然有人让我写写 Harry Potter。拜托，难道我还能写的比 J・K・Rowling 更好不成？不过，同人什么的，我还是可以发挥一下的。经典设定谁会不爱？我就勉为其难地帮助这些用户实现想象吧。实不相瞒，上辈子我该看的，不该看的，通通看了。就下面这些主题，都是我爱惨了的。那些你看小说很喜欢却没人写的设定，那些冷门甚至邪门的 cp，都能自产自嗑。不是我自夸，只要你想要我写，我还真能给你

12/29/2023 11:58:00 AM 机器之心

字节具身智能新成果：用大规模视频数据训练GR-1，复杂任务轻松应对

如何利用大规模的视频数据来帮助机器人学习复杂任务？最近 GPT 模型在 NLP 领域取得了巨大成功。GPT 模型首先在大规模的数据上预训练，然后在特定的下游任务的数据上微调。大规模的预训练能够帮助模型学习可泛化的特征，进而让其轻松迁移到下游的任务上。但相比自然语言数据，机器人数据是十分稀缺的。而且机器人数据包括了图片、语言、机器人状态和机器人动作等多种模态。为了突破这些困难，过去的工作尝试用 contrastive learning [1] 和 masked modeling [2] 等方式来做预训练以帮助机器人更

12/29/2023 11:49:00 AM 机器之心

谁能撼动Transformer统治地位？Mamba作者谈LLM未来架构

自 2017 年被提出以来，Transformer 已成为 AI 大模型的主流架构，未来这种情况是一直持续，还是会有新的研究出现，我们不妨先听听身处 AI 圈的研究者是怎么想的。在大模型领域，一直稳站 C 位的 Transformer 最近似乎有被超越的趋势。这个挑战者就是一项名为「Mamba」的研究，其在语言、音频和基因组学等多种模态中都达到了 SOTA 性能。在语言建模方面，无论是预训练还是下游评估，Mamba-3B 模型都优于同等规模的 Transformer 模型，并能与两倍于其规模的 Transforme

12/29/2023 11:36:00 AM 机器之心

Midjourney v6 终于更新了！一文详解新版本 3 大要点

大家好，这里是和你们一起探索 AI 绘画的花生~ Midjourney 的 v6 模型终于在 2023 年结束之前更新出来了，这是一个完全重新训练的模型，所以图像生成效果与之前的 v5.2 相比有很大的不同，那么此次更新主要有哪些特点？我们又应该如何正确地用 v6 模型出图呢？今天就带大家一起了解一下~ 上期回顾：首先是 V6 的图像生成质量相比之前的模型来说又提升了不少，在画面质感以及细节刻画上有了更精致的表现，图像的光影处理也比 v 5.2 更真实自然。下面是分别用 v5.2 和 v6 生成的特写图像，通过对比

12/29/2023 1:03:38 AM 夏花生

超详细的 Stable Diffusion ComfyUI 基础教程（五）：局部重绘+智能扩图

前言：我们上一节讲了图生图，也提到了“遮罩”这个节点；我们想一下在使用 Web UI 进行局部重绘的时候都用到了那些功能？上期回顾：内容补充：在开始之前我先给大家补充个知识点，怎么在图生图的时候批量出图“右键-新建节点- Latent-批处理-复制 Latent 批次”，把“复制 Latent 批次”节点串联在“VAE 编码”和“K 采样器”之间，然后设置次数就可以了。一、创建流程 ①我们打开上节课“图生图”的流程图，我们可以看到“加载图像”节点是没有地方连接的，点住“遮罩”往外拉，松开然后选择“VAE 内补编

12/29/2023 12:03:45 AM 搞设计的花生仁

OpenLAM | 深度势能预训练大模型DPA-2发布

在迈向通用大原子模型（Large Atomic Model，LAM）的征途上，深度势能核心开发者团队面向社区，发起 OpenLAM 大原子模型计划。OpenLAM 的口号是“征服元素周期表！”，希望通过建立开源开放的围绕微尺度大模型的生态，为微观科学研究提供新的基础设施，并推动材料、能源、生物制药等领域微尺度工业设计的变革。经过北京科学智能研究院、深势科技、北京应用物理与计算数学研究所等 29 家单位的 42 位合作者的通力协作，深度势能团队近日面向社区发布了深度势能预训练大模型 DPA-2，将成为 OpenLAM

12/28/2023 6:02:00 PM ScienceAI

ScienceAI 2023「AI+材料&化学」专题年度回顾

编辑 | KX传统的科学探索方式是「爱迪生式」的试错法。材料研发周期非常长，而且耗费的人力物力也是巨大的，并且存在偶然性。新材料的设计与研发往往面临挑战：急需的新材料难以快速筛选设计，而设计出的新材料又难以找到高效且低成本的合成配方，拥有合成配方的新材料又会面临规模化的长周期探索。以我国为例，工信部对 30 余家大型骨干企业调查结果显示，130 种关键材料中，有 32% 国内完全空白、54% 虽能生产，但性能稳定性较差、只有 14% 左右可以完全自给。2023 年大模型千帆竞发。就在前不久，大型语言模型（LLM）C

12/28/2023 5:38:00 PM ScienceAI

覆盖97.6%泌尿就医人群，蚂蚁集团开源首个医疗专科推理数据集

12月28日，由信通院主办的“虹桥之源”大模型驱动数字经济新生态峰会在上海召开。会上，蚂蚁集团商业机器智能部总经理顾进杰介绍蚂蚁正式开源国内首个医疗专科推理数据集，这将提升大模型在医疗领域的专业性。图说：蚂蚁集团商业机器智能部总经理顾进杰介绍国内首个医疗专科推理数据集在医疗行业，通用型语言模型在应对医疗问诊时，会直接给出答案，而医生则会根据专业知识进行反复的症状探讨，才能给出答案。另外，大模型的幻觉问题和推理能力不足，当前高质量的中文医学专科数据集又较为稀缺，这对训练出色的医疗领域大模型提出了挑战。为克服这些难题，

12/28/2023 5:28:00 PM 新闻助手

华东政法数据法律研究中心、蚂蚁集团等发布《数据跨域管控白皮书》

12月27日，在“第六届中国数据法律高峰论坛”上，《数据跨域管控白皮书》（以下简称“白皮书”）正式发布。该白皮书由华东政法大学数据法律研究中心、蚂蚁集团牵头，华控清交、华为云、中电数创、广州数据交易所等单位联合参与。白皮书首次系统化给出了数据跨域管控的实操指引，是行业积极响应国家数据流通政策，共同应对数据滥用、数据泄露、责任不清等数据流通风险挑战，助力数据价值释放的重要成果。（《数据跨域管控白皮书》发布，参编单位代表及嘉宾共同见证）我国已将数据列为重要生产要素，并且鼓励数据要素流通。12月8日，国家数据局局长刘烈

12/28/2023 4:51:00 PM 新闻助手

纽约时报送OpenAI、微软上被告：GPT-4输出结果与其作品有大量重复

机器之能报道编辑：佳琪、大盘鸡在人工智能浪潮中，捍卫自己的权利。当人工智能不断兴起，随之而来的除了惊艳四座的强大技术，还有对技术的质疑以及各种规范的难题。用什么作为训练数据？是否得到许可？生成内容是否会造成侵权？这些问题都成为了人工智能发展路上必问的问题。涉及的相关案例，在未来也会指导司法实践。据彭博社报道，《纽约时报》已起诉微软和 OpenAI，指控其侵犯版权，违规使用了《纽约时报》的内容用于人工智能开发。这场官司让人们不得不正视媒体与颠覆性技术之间的关系。据《纽约时报》的起诉书称，这些技术公司使用了数百万篇未经

12/28/2023 3:09:00 PM 机器之能

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

应用

工业制造、商用和家庭，优必选人形机器人的三场战事

挑战Transformer，华为诺亚新架构盘古π来了，已有1B、7B模型

你们有什么底气和谷歌叫板？Perplexity AI CEO回应质疑

测试大语言模型的生物推理能力，GPT-4、PaLM2等均在测试之列

AIGC落地实践！四招帮你快速搞定运营设计

华为放出2023年最后一个大招？CodeArts Snap如何用大模型解放开发者

梅涛：HiDream.ai视频生成已打破业界4秒瓶颈，能够支持15秒以上

特供版显卡RTX4090D上市，售价12999元

​这次重生，AI要夺回网文界的一切

字节具身智能新成果：用大规模视频数据训练GR-1，复杂任务轻松应对

谁能撼动Transformer统治地位？Mamba作者谈LLM未来架构

Midjourney v6 终于更新了！一文详解新版本 3 大要点

超详细的 Stable Diffusion ComfyUI 基础教程（五）：局部重绘+智能扩图

OpenLAM | 深度势能预训练大模型DPA-2发布

ScienceAI 2023「AI+材料&化学」专题年度回顾

覆盖97.6%泌尿就医人群，蚂蚁集团开源首个医疗专科推理数据集

华东政法数据法律研究中心、蚂蚁集团等发布《数据跨域管控白皮书》

纽约时报送OpenAI、微软上被告：GPT-4输出结果与其作品有大量重复

这次重生，AI要夺回网文界的一切