应用

谷歌AI播客刚火，Meta就开源了平替，效果一言难尽

随着谷歌和 Meta 相继推出基于大语言模型的 AI 播客功能，将极大地丰富人类用户与 AI 智能体互动的体验。上个月，谷歌宣布对旗下 AI 笔记应用 NotebookLM 进行一系列更新，允许用户生成 YouTube 视频和音频文件的摘要，甚至可以创建可共享的 AI 生成音频讨论。加上此前支持的谷歌文档、PDF、文本文件、谷歌幻灯片和网页，NotebookLM 的用例和覆盖范围进一步扩大。

10/28/2024 1:14:00 PM

机器之心

世界模型新突破！极佳科技提出DriveDreamer4D，首次利用世界模型增强4D驾驶场景重建效果

近日，极佳科技联合中国科学院自动化研究所、理想汽车、北京大学、慕尼黑工业大学等单位提出DriveDreamer4D，是首个利用世界模型增强 4D 驾驶场景重建效果的工作。 DriveDreamer4D 可以大幅提升多种自动驾驶 4D 重建算法的效果，在 user study 实验中获得了超过 80% 的偏好投票，为走向空间智能和 4D 世界模型迈出了坚实的一步。论文链接：：：。

10/28/2024 1:11:00 PM

机器之心

Perplexity AI 搜索引擎每周处理 1 亿次查询，消息称微软 / X / OpenAI 有意收购

综合 TechCrunch、The Information 报道，AI 搜索引擎 Perplexity 的首席执行官 Aravind Srinivas 透露，其产品目前每周的查询量已达到 1 亿次，推算下来每月约为 4 亿次，与 7 月的 2.5 亿次相比增长显著。当地时间 25 日，该公司披露称，随着公司快速扩展，Perplexity 正在逐步推出电商功能，计划让“Perplexity Pro”服务的订阅用户享受一键下单的便捷功能。同时，公司也在开发新的广告模式。

10/28/2024 11:17:16 AM

清源

CNCC 落幕：国产大模型已经进化到能在横店给我们点咖啡

今年到 CNCC 现场参会的朋友，想必都对 CNCC 2024 举办所在地——超过 6200 亩的横店圆明新园印象深刻！虽然园内建筑身临其境，并且薅了主办方一把羊毛，免门票游览了圆明新园与横店多个著名旅游景点，但园子实在是太大了。参会人数超过 1 万 2，园内车辆、美食供不应求，小编表示腿已经走断。

10/28/2024 10:29:00 AM

朱可轩

轻舟智航完成数亿元C+轮融资，加速从L2++到L4级自动驾驶的渐进式进化

10月28日，轻舟智航（QCraft）宣布完成数亿元人民币C 轮新融资。本次融资由逐鹿聚航基金投资，资金将用于加大全栈自动驾驶技术的研发投入，扎实推进中高阶NOA方案的大规模量产交付，以持续、高效的量产数据积累驱动技术迭代，稳步实现从L2 到L4级自动驾驶技术的渐进式进化，推动L4级自动驾驶时代的全面到来。轻舟智航联合创始人、CEO于骞表示：“感谢逐鹿聚航基金对轻舟智航的坚定支持与信任！

10/28/2024 10:17:00 AM

新闻助手

OpenAI 语音转写工具 Whisper 被曝存在重大缺陷：会凭空生成大段虚假内容

当地时间 27 日，据美联社报道，超过十位软件工程师、开发人员和学术研究人员称，OpenAI 的语音转写工具 Whisper 存在一个重大缺陷：有时会凭空生成大段甚至整句虚假内容。这些专家指出，这些生成的文本（AI在线注：业内通常称为“AI 幻觉”）可能涉及种族言论、暴力措辞，甚至杜撰的医疗建议。专家们认为，这一问题尤其令人担忧，因为 Whisper 已被广泛应用于全球多个行业，包括用于翻译和转录访谈内容、生成常见消费科技文本及制作视频字幕。

10/28/2024 8:47:58 AM

清源

因使用生成式 AI 制作恶意软件，日本一 25 岁男子首次被判有罪

据《读卖新闻》25 日报道，日本一名 25 岁林（Hayashi）姓男子因滥用生成式 AI 制造电脑病毒，被东京地方法院判处有期徒刑三年，缓期执行四年，标志着日本首次有因滥用生成式 AI 作出刑事定罪的案例。据判决书等资料显示，去年 3 月 31 日，该男子左右在川崎市的住所中利用电脑和智能手机，通过生成式 AI 获取的恶意程序设计图（源代码）制作了类似勒索软件的电脑病毒。此外，他还冒充他人骗取了手机通信卡等物品。

10/28/2024 7:50:42 AM

清源

AIGC喂饭教程！6步快速搞定万圣节创意海报！

大家好，这里是和你一起探索 AIGC 美学边界的戏呱皮 DC。大家可以叫我呱呱。前几天呱呱用 FLUX 模型出了一套 COS 动漫人物的万圣节创意海报，获得很多人的喜爱。

10/28/2024 1:17:18 AM

戏呱皮DC

抖音：严厉打击利用 AI 骗取老年人互动，下架违规视频、处置违规账号

抖音官方于 10 月 25 日发布《抖音严厉打击利用 AI 骗取老年人互动的治理公告》。抖音官方表示，鼓励创作优质内容，包括采用 AI 技术进行辅助创作，但所创作内容必须遵循平台规范。平台对利用生成式人工智能技术创作和发布违背科学常识、弄虚作假、造谣传谣的内容进行持续打击。

10/27/2024 7:36:17 PM

沛霖（实习）

OpenAI 公布新型 AI 文生图方案“sCM”，号称效率是传统扩散模型 50 倍

OpenAI 本周公布了一款名为 sCM（Continuous-Time Consistency Model）的新型 AI 文生图方案。与传统的扩散模型相比，sCM 仅需两个步骤即可生成高质量样本，号称能够将文生图效率提升约 50 倍，且生成的样本质量能与“业界较强的扩散模型”相比较，为 AI 文生图提供了新的方案。目前业界通常使用扩散模型生成图片及音视频，但传统扩散模型的取样过程通常缓慢，通常需要数十到数百个逐步降噪的过程才能生成高质量样本（例如小伙伴们使用 SD“炼丹”绘图就需要等待特别长的降噪时间），这使得相应模型效率低下，不适合商业化应用。

10/27/2024 3:18:03 PM

漾仔

丹麦首台 AI 超级计算机 Gefion 推出，由 1528 个英伟达 H100 GPU 驱动

丹麦推出了该国首台 AI 超级计算机，以丹麦神话中的女神 Gefion 命名，旨在推动量子计算、清洁能源、生物技术等领域取得突破，英伟达首席执行官黄仁勋与丹麦国王一同出席了揭幕仪式。 ▲ 图源英伟达Gefion 是一台由 1528 个英伟达 H100 Tensor Core GPU 驱动的英伟达 DGX SuperPOD 超级计算机，使用英伟达 Quantum-2 InfiniBand 网络进行互连。 AI在线获悉，Gefion AI 超级计算机位于哥本哈根，为产业界、初创企业和学术界服务。

10/27/2024 3:05:15 PM

沛霖（实习）

谷歌 DeepMind 开源 SynthID Text 工具，可辨别 AI 生成的文字

谷歌 DeepMind 于 10 月 23 日宣布正式开源旗下 SynthID Text 文本水印工具，供开发者和企业免费使用。谷歌在 2023 年 8 月推出了 SynthID 工具，该工具具备创建 AI 内容水印（声明该作品由 AI 打造）和识别 AI 生成内容的能力。它可以在不损害原始内容的前提下，将数字水印直接嵌入由 AI 生成的图像、声音、文本和视频中，同时也能扫描这些内容已有的数字水印，以辨识它们是否由 AI 生成，不过本次谷歌开源的仅为针对文本生成的 SynthID Text。

10/27/2024 3:00:06 PM

漾仔

Meta 推出 Llama 3.2 1B / 3B 模型量化版：功耗更低、可适用更多轻量移动设备

继今年 9 月开源 Llama 3.2 的 1B 与 3B 模型之后，Meta 于 10 月 24 日发布了这两个模型的量化版本，量化后的模型大小平均减少了 56%，RAM 使用量平均减少了 41%，模型速度提高了 2 至 4 倍，同时降低了功耗，使这些模型能够部署到更多移动设备上。 AI在线注：模型量化（Model Quantization）就是通过各种训练方式将浮点模型转为定点模型，可以压缩模型参数，降低模型的复杂性，以便于在更轻量的平台运行。 Meta 表示，他们采用了量化感知训练（Quantization-Aware Training，QAT）和后训练量化（SpinQuant）两种方法对模型进行量化，其中“量化感知训练”更重视模型的准确性，而“后训练量化”更强调模型的可移植性。

10/27/2024 1:53:56 PM

漾仔

深圳一家公司造出世界上最酷机器人，卖2-3万美元

网友：终于不是太奶步伐了。国内惊现「无头」机器人！造出这个机器人的，是一家名叫众擎机器人（EngineAI）的深圳公司。

10/27/2024 1:52:00 PM

机器之心

谷歌这款新概念键盘，治好了我多年的老病

谷歌终于把人机交互给玩明白了？很多整天对着电脑的同学们难免腰酸背疼，有时会发出这样的感叹：我对这键盘受够了！那么问题来了：应该换个机械键盘还是分体式键盘呢？

10/27/2024 1:50:00 PM

机器之心

Anthropic 为 Claude 推出 JavaScript 沙盒工具：可 AI 写代码、可上传自有代码运行

Anthropic 现已为 Claude AI 推出了一款 JavaScript 沙盒工具，允许用户利用 Claude 编写 JavaScript 代码、在沙盒环境中上传自己的代码并自动生成运行结果，相应功能目前已作为预览版本向所有用户开放。此外，Anthropic 还提到 Claude AI 新增的这套沙盒工具允许用户加载本地文件，帮助企业快速处理 / 分析客户数据，快速将相关内容进行可视化处理。 ▲ 图源 Claude AIAnthropic 表示，目前他们已进一步提升了 Claude 的代码编写能力，这意味着 Claude 不仅能提供逻辑严谨且经过推敲的答案，还能帮助程序员 / 商务人员调试代码或进行精确高效的运算。

10/27/2024 10:33:44 AM

漾仔

可令 AI 助理同时进行快 / 慢速思考，谷歌 DeepMind 公布具备两种思维模式的 Talker-Reasoner 框架

谷歌 DeepMind 上周公布了一个号称“具备两种思维模式”的 Talker-Reasoner 框架，旨在让 AI 助理能够同时进行快速和慢速思考，目前相关论文已发布于 ArXiv 上（点此访问）。据介绍，这款框架采用“双系统”设计，能够在与用户进行对话的同时并行多步骤推理任务（一边快速回答用户问题，一边高速思考），其中系统 1 Talker LLM 主要负责快速、直觉和合成的语言回应，用于与用户交谈。而系统 2 Reasoner LLM 则负责解决复杂问题，涉及从外界获取信息以增强知识，例如调用工具或从外部数据库检索信息，从而提升系统 1 回应内容的准确度及逻辑性。

10/27/2024 10:20:36 AM

漾仔

北京发布首份教育领域人工智能应用指南

《北京市教育领域人工智能应用指南》于 10 月 26 日发布，明确人工智能在 6 大重点教育领域 29 个典型场景的应用规范，指导学校和师生稳妥有序开展应用实践。两项教育领域人工智能重点任务启动建设，让新技术更“懂”教育。该指南也是由北京市教育行政主管部门委托研制并发布的首份教育领域人工智能应用指南。

10/27/2024 9:11:42 AM

远洋

资讯热榜

OpenAI 开源模型被 Meta 研究员“逆改”！只动0.3%参数，gpt-oss-20B 解锁无约束基座奥特曼：我承认GPT-5发布搞砸了首个面向肽分子设计的大模型平台：直接「读序列」出结合子，无需结构输入即可生成网易有道发布子曰教育大模型多款AI新品，定义教育AI应用能力L1-L5分级阿里千问踢馆子了！Qwen3新作秒杀ChatGPT，侧脸杀切换第一人称视角，表情包绝绝子，小编：再也不用美图秀秀去水印了小红书发布DynamicFace人脸生成技术，实现高质量图像视频人脸融合摩根士丹利：AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元 OpenAI加速推进GPT-6开发，奥尔特曼承诺打造"有记忆"的个性化AI助手

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能用户 Meta 微软 GPT 学习技术图像 Gemini 马斯克 AI创作智能体论文 Anthropic 英伟达代码训练算法 Stable Diffusion 芯片 AI新词 LLM 蛋白质腾讯开发者生成式 Claude 苹果 Agent AI for Science 神经网络 3D 机器学习研究生成 xAI 人形机器人 AI视频计算 Sora 百度 GPU AI设计华为工具大语言模型搜索具身智能 RAG 字节跳动大型语言模型场景深度学习预测伟达视觉 Transformer 视频生成 AGI 架构神器推荐亚马逊 Copilot DeepMind 特斯拉应用