应用

跟骑手学习送外卖，这家具身智能公司的机器人已经上岗挣钱了

你点过无人机送的外卖吗？在深圳、上海等一线城市，让无人机给自己送个外卖已经不是什么新鲜事。但它送的方式可能和你想的不太一样。想象中的无人机送外卖 be like：而现实中的无人机送外卖 be like：也就是说，它不会把外卖直接送到你家阳台，而是和你家有一段距离的外卖柜。你需要下楼走一段距离才能拿到。于是，有些网友发出灵魂追问：「你猜我为什么点外卖？」所以，现在问题就变成了：从家到外卖柜这段距离怎么办？解决思路也很简单：让一个送货机器人帮你送完这段路。这是具身智能机器人公司推行科技（Infermove）最近放出来的

6/24/2024 3:09:00 PM 机器之心

营销效果大幅提升，AIGC视频创作就该这么用

经过一年多的发展，AIGC 已经从文字对话、图片生成逐步向视频生成迈进。回想四个月前，Sora 的诞生让视频生成赛道经历了一场洗牌，大力推动了 AIGC 在视频创作领域的应用范围和深度。在人人都在谈论大模型的时代，我们一方面惊讶于视频生成带来的视觉震撼，另一方面又面临着落地难问题。诚然，大模型从技术研发到应用实践还处于一个磨合期，仍需结合实际业务场景进行调优，但理想与现实的距离正在被逐步缩小。营销作为人工智能技术的重要落地场景，成为了很多企业及从业者想要突破的方向。掌握了恰当方法，营销视频的创作过程就会事半功倍。如

6/24/2024 3:03:00 PM 机器之心

美国多家汽车经销商将 AI 用于车辆初步检查：一分钟内可生成全面报告

当前 AI 几乎是“无处不在”，以汽车领域为例，有车载大模型语音助手，还有各种各样的智能辅助驾驶，不过 AI 的潜力还远不止于此。据 Carscoops 今日报道，美国多家经销商采用了 AI 系统用于车辆初步检查。▲ 图源 Carscoops报道称，相关技术已经在全美 300 家经销商展开部署，为它们显著提高了工作效率并缩短了工时。拉斯维加斯一家安装了自动化车辆检测系统的凯迪拉克经销商表示，整个扫描过程非常简单，只需不到一分钟。客户将车开过大型扫描仪，扫描仪便可以从各个角度（IT之家注：包括车底）拍摄多张照片。然后

6/24/2024 2:27:53 PM 清源

2012 年以来 AI 领域首个，科大讯飞获 2023 年度国家科学技术进步奖一等奖

据“合肥发布”消息，2023 年度国家科学技术奖励大会今日在京召开，科大讯飞作为第一完成单位的《多语种智能语音关键技术及产业化》项目，获得国家科学技术进步奖一等奖。这是 2012 年深度学习引发新一代人工智能浪潮以来，人工智能领域首个国家科学技术进步奖一等奖。据介绍，2023 年度国家科学技术奖共评选出 250 个项目。国家自然科学奖 49 项：一等奖 1 项，二等奖 48 项；国家技术发明奖 62 项：一等奖 8 项，二等奖 54 项；国家科技进步奖 139 项：特等奖 3 项，一等奖 16 项，二等奖 120

6/24/2024 2:16:33 PM 清源

华为音乐与科大讯飞达成全面深度合作：音乐内容发行、手机铃音 AI 创作等

感谢在华为开发者大会 2024（HDC 2024）期间，华为音乐与科大讯飞股份有限公司在东莞举行全面深度合作签约仪式。双方将基于 HarmonyOS 发展面向全场景时代的新生态，在已有的音乐内容发行、艺人合作、手机铃音 AI 创作等方面展开更加深入的合作。华为互动媒体军团 CEO、华为终端云服务互动媒体 BU 总裁吴昊表示：“华为音乐与科大讯飞将持续紧密合作，基于 Audio Vivid 音频编解码标准共同创作更多空间音频作品。”科大讯飞股份有限公司 AI 文娱业务群副总裁，讯飞音乐主理人郭嘉表示：“科大讯飞作为一

6/24/2024 1:05:27 PM 汪淼

消息称字节跳动与博通合作开发 AI 芯片：5nm 制程，台积电制造

感谢路透社报道，字节跳动正在与美国博通公司合作开发 AI 处理器，以确保有足够多的高端芯片。知情人士透露，这款 AI 处理器制程为 5nm，将由台积电制造。虽然设计工作进展顺利，但标志着设计阶段结束和制造开始的“流片”尚未开始。字节跳动和博通一直是业务合作伙伴，博通曾在声明中表示，字节跳动购买了其 Tomahawk 5nm 芯片以及其用于 AI 计算机集群的 Bailly 交换机。字节跳动与博通的合作将有助于大幅削减采购成本，并确保高端芯片的稳定供应。除抖音和 TikTok 外，字节跳动还运营一个类似 ChatGP

6/24/2024 12:47:20 PM 沛霖（实习）

为什么都放弃了LangChain？

或许从诞生那天起，LangChain 就注定是一个口碑两极分化的产品。看好 LangChain 的人欣赏它丰富的工具和组建和易于集成等特点，不看好 LangChain 的人，认为它注定失败 —— 在这个技术变化如此之快的年代，用 LangChain 来构建一切根本行不通。夸张点的还有：「在我的咨询工作中，我花了 70% 的精力来说服人们不要使用 langchain 或 llamaindex。这解决了他们 90% 的问题。」最近，一篇 LangChain 吐槽文再次成为热议焦点：作者 Fabian Both 是 AI

6/24/2024 11:39:00 AM 机器之心

LeCun学生、纽大助理教授Alfredo视频上新，跟他免费学本科AI课程

喜欢学习基础人工智能知识的小伙伴们又有新的优质资源了！纽约大学计算机科学助理教授、图灵奖得主Yann LeCun的学生Alfredo Canziani开新课了！近日，Alfredo Canziani 在社媒 X 上宣布自己的春季「人工智能本科课程」放出在线视频了。一些章节的视频已经可以在Youtube上观看。视频观看地址：，这门《人工智能》课程包含两大部分。第一部分为基于知识的AI，由Ernest David教授授课。各章节讲授的知识点包括：基于知识的AI引言，搜索和约束满足问题、逻辑推理和自动推理、以及概率和简单

6/24/2024 11:20:00 AM 机器之心

华为盘古大模型5.0技术解密：更多模态，复杂推理

现在，AI 大模型可以真正与物理世界结合了。该大模型体系分为 10 亿级参数的 Pangu E 端侧模型，百亿级参数的 Pangu P，千亿级的 Pangu U，以及万亿级的 Pangu S 版本，在全系列、多模态、强思维三个方面实现了升级。盘古 5.0 可以与物理世界结合，理解包括文本、图片、视频、雷达、红外、遥感等多种模态的信息。它已在高铁故障检测等工业领域、具身智能等技术探索领域落地，因而受到了人们的关注。随着鸿蒙 HarmonyOS NEXT Beta 版本的发布，小艺也升级成为智能体，面向全场景设备提供语

6/24/2024 11:11:00 AM 机器之心

阿里云通义灵码 AI 编程助手上线微软 Visual Studio 插件市场，个人专业版限时免费

通义灵码是阿里云出品的一款基于通义大模型的智能编码辅助工具，提供行级 / 函数级实时续写、自然语言生成代码、单元测试生成、代码优化、注释生成、代码解释、研发智能问答、异常报错排查等能力，支持 Java、Python、Go、C 等 200 多种编程语言。通义灵码 6 月 20 日宣布上线了微软 Visual Studio 插件市场，该工具此前已上线了 Visual Studio Code、JetBrains IDEs 等主流编程工具，全渠道下载量超 350 万。Visual Studio（VS）是微软推出的一款集

6/24/2024 10:58:24 AM 汪淼

《Python 机器学习》作者新作：从头开始构建大型语言模型，代码已开源

自 ChatGPT 发布以来，大型语言模型（LLM）已经成为推动人工智能发展的关键技术。近期，机器学习和 AI 研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 又写了一本新书 ——《Build a Large Language Model (From Scratch)》，旨在讲解从头开始构建大型语言模型的整个过程，包括如何创建、训练和调整大型语言模型。最近，Sebastian Raschka 在 GitHub 上开源了这本新书对应的代码库。项目地址： LLM 来说，指令微调能够有效

6/24/2024 10:53:00 AM 机器之心

StabilityAI获超1亿美元投资并任命新CEO；月之暗面称没有开发海外产品计划；GPT-5将在一年半后发布丨AI情报局

融资快报Stability AI 获超 1 亿美元投资并任命新的 CEO：The Information消息，Stability AI 已任命 Prem Akkaraju 为新任首席执行官。视觉特效公司维塔 Wētā FX 前首席执行官 Prem Akkaraju 是包括前 Facebook 总裁 Sean Parker 在内的投资者中的一员。报道称，这些投资者总共出资超过 1 亿美元，新的资金可能会缩减一些现有投资者的股份。

6/24/2024 10:51:00 AM 我在思考中

英伟达将在中东五国数据中心部署 AI 技术，首次在当地大规模推出产品

据路透社报道，卡塔尔电信集团 Ooredoo 首席执行官 Aziz Aluthman Fakhroo 当地时间 23 日在接受采访时表示，公司已经与英伟达签署协议，将在该公司于中东 5 个国家拥有的数据中心部署 AI 技术。此举意味着英伟达首次在中东地区大规模推出产品，Ooredoo 将成为该地区首家能够为其数据中心客户提供直接访问英伟达 AI 和图形处理技术权限的公司。此前，华盛顿曾限制向该地区出口美制尖端芯片。IT之家注：上文提到的 5 个中东国家包括卡塔尔、阿尔及利亚、突尼斯、阿曼、科威特。除此之外，Oore

6/24/2024 9:12:38 AM 清源

研究发现，OpenAI 的 GPT-4o 道德推理能力胜过人类专家

6/24/2024 8:27:01 AM 清源

聊天机器人胡说八道？牛津研究人员利用语义熵来识破 AI“幻觉”

近年来，人工智能蓬勃发展，聊天机器人等应用逐渐普及，人们可以通过简单的指令从这些聊天机器人（例如 ChatGPT）获取信息。然而，这些聊天机器人仍然容易出现“幻觉”问题，即提供错误的答案，有时甚至是危险的信息。图源 Pexels造成“幻觉”的原因之一是训练数据不准确、泛化能力不足以及数据采集过程中的副作用。不过，牛津大学的研究人员另辟蹊径，在最新出版的《自然》杂志上详细介绍了一种他们新开发的方法，用于检测大型语言模型 (LLMs) 的“捏造” (即任意生成的不正确信息) 问题。LLM 通过在训练数据中寻找特定模式来

6/24/2024 8:25:46 AM 远洋

没有授权也没关系？多家 AI 公司被曝绕过网络标准抓取新闻出版商网站内容

据路透社上周六报道，专注于“内容许可”领域的初创公司 TollBit 近日向新闻出版商发出警告称，多家人工智能公司正在规避出版商用来阻止抓取内容的常见网络标准，并将抓取的内容用于训练生成式 AI 系统。这一消息是在 AI 搜索初创公司 Perplexity 与媒体《福布斯》之间就同一网络标准公开争执的背景下发出的。当前，科技和媒体公司之间正在就生成式 AI 时代的内容价值展开更广泛的辩论。Tollbit 将自己定位为内容匮乏的 AI 公司与愿意与他们达成重大许可协议的出版商之间的“媒人”。IT之家注：《福布斯》曾指

6/24/2024 7:37:25 AM 清源

F1 计划与亚马逊联合推出人工智能“Statbot”数据机器人，提供个性化观赛体验

感谢据彭博社报道，在周日举行的西班牙大奖赛上，一级方程式赛车 F1 计划与亚马逊联合推出一款新的人工智能“Statbot”数据机器人。亚马逊与 F1 的技术合作负责人 Neil Ralph 表示，“Statbot”在巴塞罗那站比赛期间利用亚马逊 AWS 云计算部门的技术，搜索比赛档案并解析大量实时赛车数据，向现场直播主持人提供背景信息与趣闻。IT之家注意到，此前官方转播中已经添加了由 AWS 提供支持的 F1 Insights：利用 AI 人工智能，根据赛车性能和轮胎退化等实时细节，对进站时间或车手何时可能超越对手

6/24/2024 7:02:02 AM 泓澄（实习）

B 端设计指南：9000字深度聊聊AI如何结合B端产品

AI，这是一个在过去两年被反复提起的一个词，我们由最初的满怀期待到现在听到 AI 就焦虑，感觉自己很快会被淘汰。而时间的推移，你会发现很多人都在去讨论：“AI 能取代设计师吗？AI 能取代程序员吗？”最初我们都在期望 AI 帮我们解决洗衣做饭等问题的时候，没想到我们的饭碗没了。两年的时间过去，AI 在不断的颠覆迭代，对我们设计流程会造成哪些影响？对我们 B 端设计又会有哪些机会？今天我们就由浅入深的聊聊 AI。一、AI 产品的解析我们想要理解 AI 产品，首先必须得了解其对应的流程以及产品的类型. 目前 AI

6/24/2024 12:53:02 AM CE青年

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉