应用

强如 GPT-4，也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试

编译 | 赖文昕编辑 | 陈彩娴语言大模型能依据人类设定的规则生成内容吗？这背后关乎人类用户使用大模型的安全问题。例如，AI 科技评论想使用 GPT-4 制作一张包含对话框的图片，但没有针对目标生成对话的内容给予明确指示，而 GPT-4 生成的图文效果便如下，显示文本逻辑混乱、字不成章，还有部分“重影”：语言大模型能否遵循人类指示生成合格内容，是人类能否操控人工智能的重要评测标准之一。

3/13/2024 3:31:00 PM 赖文昕

星尘数据MorningStar正式发布！狙击“数据债”成最大看点

3月11日，AI数据技术公司星尘数据（Stardust AI）正式发布MorningStar——一款面向AI的数据闭环产品。 MorningStar是目前首个专注数据价值发现的AI数据平台，基于DataOps的理念打造，全面覆盖AI算法从训练到生产全链路中的数据发现、管理、协作、迭代等各个环节。 ▲MorningStar正式发布数据技术已经推动了人工智能的三次变革。

3/13/2024 3:31:00 PM 王悦

比 Sora DiT 架构早两个月的 U-ViT，由这家中国 AIGC 公司提出

「Sora 出来之后，团队就开始连轴转，没休息过。」这是 AI 科技评论了解到的，目前国内诸多 AIGC 创业公司的现状。 Sora 的确让世界范围内的创业公司措手不及。

3/13/2024 3:10:00 PM 林军

向数字世界AGI迈进！智能体已经从头开玩「荒野大镖客 2」了

通用计算机控制信息革命产生了数字世界，数字世界为大模型的诞生提供了数据，也最容易实现通用人工智能（AGI）。向数字世界 AGI 迈进，北京智源人工智能研究院、新加坡南洋理工大学、北京大学携手提出通用计算机控制 General Computer Control (GCC)，即智能体需要像人一样看屏幕，通过键盘、鼠标完成计算机上的所有任务。在过去很长一段时间里，人工智能研究以游戏为场景，而 GCC 将为通用人工智能研究提供场景，也将进一步促进大模型和 AI Agents 的落地与产业化。为此，研究团队提出通用计算机控制

3/13/2024 2:54:00 PM 机器之心

首个AI软件工程师上线！已通过公司面试抢程序员饭碗，华人创始团队手握10块IOI金牌

前段时间，英伟达 CEO 黄院士发出惊人言论：「都别学编程了，以后交给 AI 就行了，以后人人都是软件工程师。」当时还有很多人反对，说「AI 永远不会取代程序员。」没想到，首个人工智能软件工程师 Devin 一发布，程序员的饭碗可能真要被 AI 端走了。在 SWE-Bench 基础测试中，无需人类协助，Devin 就可以解决 13.86% 的问题。而目前的 SOTA 模型，在没有人类帮忙的情况下，只能完成 1.96% 的任务。仅从评测结果看，Devin 解决真实世界软件问题的能力要远好于当前的 GPT-4 和 Cl

3/13/2024 2:47:00 PM 机器之心

GPT-4.5 Turbo意外曝光，官方网页被扒出，网传明天就上线

虽然没等到 GPT-5 的消息，但我们离 GPT-4.5 不远了。Claude 3 一经推出，AI 初创公司 Anthropic 被推上了大模型浪潮顶端。这一波压力立马给到了 OpenAI。不少网友调侃，GPT-5 呢？由于 OpenAI 每次都能给我们超乎想象的 AI 体验惊喜，大家不由得对他们的实力有着更高期待。GPT-5 的发布时机或许还扑朔迷离，但我们离 GPT-4.5 的发布可能真的不远了。最新消息显示，OpenAI 的 GPT-4.5 Turbo 在 Bing 和 DuckDuck Go 等搜索引擎已经

3/13/2024 2:38:00 PM 机器之心

专为训练Llama 3，Meta 4.9万张H100集群细节公布

只想知道 Llama 3 何时能来？生成式大模型给人工智能领域带来了重大变革，人们在看到实现通用人工智能（AGI）希望的同时，训练、部署大模型的算力需求也越来越高。刚刚，Meta 宣布推出两个 24k GPU 集群（共 49152 个 H100），标志着 Meta 为人工智能的未来做出了一笔重大的投资。这是 Meta 雄心勃勃的基础设施路线图中的一步。Meta 会持续扩大基础设施建设，到 2024 年底将包括 350000 个 NVIDIA H100 GPU，其计算能力将相当于近 600000 个 H100。Met

3/13/2024 2:33:00 PM 机器之心

万物皆可《毁灭战士》，专家利用 GPT-4V 模型运行该游戏

英国约克大学研究员 Adrian de Wynter 近日发表研究论文《Will GPT-4 Run DOOM?》，探讨了如何让 GPT-4V 模型来玩《毁灭战士》游戏。de Wynter 为此设计了一个系统，使用 GPT-4V（GPT4 的多模态衍生版本，可以接收图像作为输入）捕捉游戏引擎的画面截图，并返回游戏状态的结构化描述。他设计了一个 Agent 模型，根据视觉输入信息，并对比此前历史记录作出决策，并将其反应转化为《毁灭战士》游戏可以理解的按键命令。简单地说，系统会截取游戏截图，并利用这些截图找出游戏中发生

3/13/2024 10:19:25 AM 故渊

这 2 个工作流网站，让 Stable Diffusion 新手一秒变大神！

大家好，这里是和你们一起探索 AI 的花生~很多小伙伴在学习完 Stable Diffusion WebUI 和 ComfyUI 的基础操作后，都在问我如何能实现更高级的应用，比如创意摄影、AI 换装、图像风格转换、AI 视频制作等。今天就为大家推荐 2 个资源网站，上面有很多 AI 大神分享的优质工作流，下载后导入到自己的工具中就能一键复刻同样的效果，实现 Stable Diffusion 新手快速生成酷炫效果图的梦想，一起来看看吧~ 相关推荐：一、Lightflow Lightflow 社区网址： Light

3/13/2024 8:42:49 AM 夏花生

阿尔特曼、老黄齐预测：AGI 五年内降临，代替 95% 工作！但马斯克断言 AGI 将被电力卡脖子

感谢IT之家网友 lemon_meta 的线索投递！【新智元导读】突然间，AGI 已经成为了一个新的「5 年内实现」的未来技术。从 Altman 到老黄，都在不同场合表示，达到人类智能水平的 AI 将很快到来。而技术路径和未来可能出现的能源短缺，可能是达到 AGI 过程中的最大变数。Claude 3、Sora、Gemini 1.5 Pro 的纷纷出现，以及或许今年内就会被放出的 GPT-5，让所有人都不约而同地隐隐感觉：我们似乎离 AGI 似乎越来越近了。OpenAI CEO Sam Altman 坚定地认为，AG

3/12/2024 11:16:15 PM 清源

机器人ChatGPT来了，80亿参数、前OpenAI人员经数年打造

机器之能报道编辑：吴昕严格地说，是“拾取与放置任务”版本的ChatGPT来了。除了自然语言交流，还能像Sora一样生成视频。有了机器人基础模型RFM-1，使用简单英语就能指导机器人完成拣选工作。机器人 AI 公司 Covariant CEO Peter Chen 坐在一个聊天机器人面前，界面和 ChatGPT 的很像。“给我看看你面前的运送箱，” 他输入一段文本。然后出现了一段视频，一个机械臂悬在一个装有各种物品的运输箱上——里面有一双袜子、一管薯条和一个苹果。聊天机器人可以和你讨论它看到的物品，也可以操纵它们。接

3/12/2024 6:47:00 PM 机器之能

真实的商战：文生图 AI 平台 Midjourney 禁止 Stability AI 员工使用其服务

感谢Midjourney 和 Stability AI 是当前文生图 AI 领域的其中两家头部企业，然而“不是冤家不聚头”，据 The Verge 北京时间今日凌晨的报道，Midjourney 宣称已禁止 Stability AI 的员工使用其服务，并指责后者员工在本月早些时候尝试抓取 Midjourney 数据时，导致系统出现故障。早在 3 月 2 日，Midjourney 就在其 Discord 频道公告，承认服务器出现故障的时间延长导致用户无法获得生成图像。随后在 3 月 6 日，Midjourney 在其电

3/12/2024 4:22:00 PM 清源

OpenAI 抨击马斯克指控：建立在不连贯、语无伦次的事实前提之上

感谢据彭博社报道，OpenAI 当地时间周一向美国加州旧金山法院提交了法庭文件，对此前埃隆・马斯克对其的指控进行猛烈抨击：该指控建立在“不连贯且语无伦次的”事实前提之上。马斯克上个月宣布起诉 OpenAI 公司及其 CEO 阿尔特曼、总裁格雷格・布罗克曼，声称 OpenAI 偏离了其“建立负责任的人工智能”这一最初使命，并成为其最大投资者微软事实上的子公司。需要注意的是，OpenAI 这次提交的文件是公司对马斯克起诉的首次法律回应。OpenAI 在文件中强调自身并未违反与马斯克的协议，因为“与马斯克之间根本不存在创

3/12/2024 3:19:39 PM 清源

被误解的「中文版Sora」背后，字节跳动有哪些技术？

2024 开年，OpenAI 就在生成式 AI 领域扔下了重磅炸弹：Sora。这几年，视频生成领域的技术迭代持续加速，很多科技公司也公布了相关技术进展和落地成果。在此之前，Pika、Runway 都曾推出过类似产品，但 Sora 放出的 Demo，显然以一己之力抬高了视频生成领域的标准。在今后的这场竞争中，哪家公司将率先打造出超越 Sora 的产品，仍是未知数。国内这边，目光聚集于一众科技大厂。此前有消息称，字节跳动在 Sora 发布之前就研发出了一款名为 Boximator 的视频生成模型。Boximator 提

3/12/2024 3:12:00 PM 机器之心

清华、浙大、复旦校友在列，2024苹果博士奖学金华人占一半

在今年评选出的 21 位苹果学者之中，华人博士生依然是主力军。刚刚，苹果机器学习研究中心（Apple Machine Learning Research）正式公布了 2024 年 AI（人工智能）、ML（机器学习）领域获得博士生奖学金的「苹果学者」名单。今年共有 21 位年轻学者获得了苹果学者计划的资助，华人占了一半。苹果博士奖学金旨在奖励和支持计算机科学与工程领域极具潜力的博士研究生开展研究，每年颁发一次。获奖者不仅可以获得奖学金支持，还能得到苹果实习机会和苹果研究员的学术指导。

3/12/2024 3:04:00 PM 机器之心

350亿参数、开放权重，Transformer作者创业后推出新大模型

开源大语言模型宇宙又来了一个强劲对手。Transformer 作者参与创立的 Cohere 公司推出的大模型 Command-R 在可扩展、RAG和工具使用三个方面具有显著的优势。今天，由 Transformer 作者之一 Aidan Gomez 参与创立的人工智能初创公司 Cohere 迎来了自家大模型的发布。Cohere 推出的模型名为「Command-R」，参数量为 35B，它是一个针对大规模生产工作负载的全新大语言模型研究版本。该模型属于「可扩展」模型类别，能够平衡高效率和高精度，使企业用户超越概念验证，

3/12/2024 2:25:00 PM 机器之心

Stability AI 推出 TripoSR！一秒生成高质量 3D 模型，免费使用

大家好，这里是和你们一起探索 AI 的花生~ 之前为大家系统推荐了 5 款 3D 模型生成神器，以及 Stability AI 推出的 3D 模型 Stable Zero123，他们都可以根据文本或图像生成较完整的 3D 模型。最近 Stability AI 又推出了一款新的开源 3D 生成模型 TripoSR，它不仅在生成速度上远超之前推荐的模型，而且质量上也有了极大的提升，今天为大家介绍一下它的用法。相关推荐：一、TripoSR 简介 Github 项目主页： TripoSR 试用 Demo： Tripo

3/12/2024 8:36:12 AM 夏花生

微软携手多家医疗机构推出 TRAIN：确保安全、可信赖地开发医疗 AI 应用

微软近日携手多家健康医疗机构，共同创建了“值得信赖和负责任的人工智能网络”（Trustworthy & Responsible AI Network，缩写为 TRAIN），旨在为医疗行业开发和使用 AI 应用，建立并实施严格的标准。AI 应用在医疗保健领域发挥着越来越关键的作用，微软表示 TRAIN 的目标是确保这些 AI 应用的质量、安全性和可信度。多家医疗机构参与了 TRAIN 项目，IT之家附上列表如下：AdventHealthAdvocate HealthBoston Children’s Hospital

3/12/2024 8:22:31 AM 故渊

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉