应用

预测精度媲美实验！哥大团队开发可解释细胞「基础」模型，揭示213种人类细胞调控语法

编辑 | 萝卜皮转录调控涉及调控序列和蛋白质之间的复杂相互作用，指导所有生物过程。转录计算模型缺乏通用性，无法准确推断未知的细胞类型和条件。哥伦比亚大学的研究人员介绍了 GET（general expression transformer），这是一种可解释的基础模型，旨在揭示 213 种人类胎儿和成人细胞类型的调控语法。

1/21/2025 7:13:00 PM

ScienceAI

MiniMax 海螺语音 AI 产品上线：支持 17 种语言生成，最长可输入多达 10000 字符

MiniMax 昨日宣布，带来全新升级的 T2A-01 系列语音模型，并全球同步上线海螺语音产品。据介绍，依托于 T2A-01 系列语音模型，用户在海螺 AI 仅需输入文字即可生成自然、流畅的超拟人人声，最长可输入多达 10000 字符。

1/21/2025 6:16:30 PM

浩渺

原生融合多模态上的突破，让商汤大模型打破Scaling Laws撞墙「魔咒」

基础模型的革新，才是通向未来之路。下一代 AI 的发展，似乎遇到了难以逾越的瓶颈。去年 12 月，OpenAI 在 ChatGPT 两周年期间连续发布了 12 天，我们期待的新一代大模型 GPT-5 却从头到尾没有踪影。

1/21/2025 5:17:00 PM

机器之心

1 句话做中文海报，美图 WHEE“AI 海报”功能即将上线

美图 WHEE 昨晚宣布即将上线的「AI 海报」功能，用户只需要一句话就能生成各种海报，关键是支持中文字体。

1/21/2025 5:00:20 PM

浩渺

腾讯混元 3D 生成大模型 2.0 开源发布，同步上线“业界首个一站式 3D 内容 AI 创作平台”

腾讯今日官宣开源上线混元 3D 生成大模型 2.0。腾讯混元还同步上线混元 3D AI 创作引擎，号称是“业界首个一站式 3D 内容 AI 创作平台”。

1/21/2025 3:33:19 PM

汪淼

大模型帮你写小说，阶跃星辰推出 Step-2“高性价比版”及“文学大师版”

阶跃星辰昨日上线了 Step-2 系列语言模型的两款新品 —— 参数量小、性价比更高的 Step-2 mini，以及专门针对内容创作领域推出的模型 Step 文学大师版。

1/21/2025 3:14:48 PM

浩渺

生成更可控：智谱清影 AI 生视频工具获 2.0 更新，支持画面主体进行大幅度运动

北京智谱华章科技有限公司今日发文宣布，旗下清影 AI 生视频工具获 2.0 更新，并全量上线，宣称“生成更可控”，支持画面主体进行大幅度运动。

1/21/2025 11:31:22 AM

归泷（实习）

清北团队进军具身智能，银河通用、灵初智能、星海图齐发力

具身智能创业如火如荼，技术路线是否收敛、以及数据来源的选择，都是大家一直关心的问题。最近清华北大的团队密集发布了很多研究成果，我们或许可以从中分析出一些趋势。 23 年初成立的银河通用背后是前如布科技联创尹方鸣和姚腾洲、科学家是北大助理教授王鹤。

1/21/2025 11:00:00 AM

新闻助手

搅动推理 AI 模型风云：谷歌被曝 1 月 23 日发布增强版 Gemini 2.0 Flash Thinking

消息源 @sir04680280 于 1 月 19 日发布博文，报道称观看谷歌黑客马拉松直播时，发现谷歌升级版 Gemini AI 模型“Gemini 2.0 Flash Thinking Exp-0123”，暗示 1 月 23 日发布。

1/21/2025 10:43:31 AM

故渊

OpenAI ChatGPT Operator 探索自动化新高度：你的专属 AI 秘书，即将上岗

科技媒体 TestingCatalog 昨日（1 月 20 日）发布博文，报道称通过挖掘最新 macOS 版 ChatGPT 应用代码，OpenAI 公司即将推出名为“Operator”的全新 AI 功能，充当自主 AI 智能体，自动执行各种计算机任务。

1/21/2025 10:31:43 AM

故渊

AI 版“Cookie”：OpenAI ChatGPT 搜索测试整合记忆功能

科技媒体 testingcatalog 今天（1 月 21 日）发布博文，报道称 OpenAI 公司正探索为其搜索功能整合 Memory 记忆功能，从而赋予 ChatGPT 更个性化的搜索能力。

1/21/2025 10:18:05 AM

故渊

豆包App更新实时语音通话功能，中文对话断崖式领先，人机难辨！

1月20日，豆包APP更新实时语音通话功能，面向所有用户开放。该功能基于最新豆包实时语音大模型（Doubao Realtime Voice Model）。更新后，豆包中文场景的对话能力在语音真实感和“喜怒哀乐”的情绪表现上近乎达到“人机难辨”的AI交互效果，可以模仿不同声线，并且在“逻辑思考”和“情绪感知”上有明显提升。

1/21/2025 9:16:00 AM

新闻助手

我们决定用50个关键词，来总结2024这AI狂奔的一年

往期卡兹克好文：. 降维打击所有模型！ OpenAI正式发布o3往期AI圈重磅消息：OpenAI 的 12 天直播，终于来到了最终章。

1/21/2025 12:30:22 AM

数字生命卡兹克

人类全程没碰一个字，谷歌 Gemini 不到 4 小时写完 10 万字商业战略书籍

初创公司 DeepWriter 宣布：世界第一部完全由 AI 写作的 10 万字商业竞争书籍诞生了！全程没有人类参与工作，不到 4 小时，即可完成约 10 万单词的商业书籍创作。

1/20/2025 11:39:17 PM

清源

跨维科技发布 DexForce W1 具身机器人：34 个动力单元，可感知真实世界

其采用高度仿人结构，具备34个动力单元，可做到高度灵活与多场景通用；配备了跨维纯视觉空间智能传感器，可做到实时感知、精准控制。

1/20/2025 10:53:04 PM

清源

月之暗面发布 Kimi k1.5 多模态思考模型，实现 SOTA 级多模态推理能力

官方表示，在 short-CoT 模式下，Kimi k1.5 的数学、代码、视觉多模态和通用能力大幅超越了全球范围内短思考 SOTA 模型 GPT-4o 和 Claude 3.5 Sonnet 的水平，领先达到 550%。

1/20/2025 10:26:19 PM

清源

AI 分析了 14500 多场财报电话会议，发现大部分 CEO 患有抑郁症

研究显示，患有抑郁症的 CEO 往往面临更多职场挑战。具体而言，CEO 的心理健康问题与公司面临的风险相关，例如诉讼或股票回报波动。此外，有限的证据表明，患有抑郁症的 CEO 更可能获得更高的薪酬，且薪酬中基于绩效的部分比例更高。这些 CEO 多为年轻男性，女性比例较低。

1/20/2025 9:56:47 PM

远洋

DeepSeek-R1 模型发布，性能对标 OpenAI o1 正式版

幻方量化旗下 AI 公司深度求索（DeepSeek）今日正式发布 DeepSeek-R1 模型，并同步开源模型权重。据官方介绍，DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。

1/20/2025 9:37:38 PM

远洋

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 马斯克英伟达 Anthropic 图像 AI创作训练 LLM 论文代码算法 AI for Science 苹果 Agent 腾讯 Claude 芯片 Stable Diffusion 蛋白质具身智能 xAI 开发者生成式人形机器人神经网络机器学习 3D AI视频 RAG 大语言模型 Sora 研究百度生成 GPU 工具字节跳动华为 AGI 计算大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 亚马逊 AI模型特斯拉场景深度学习 Transformer 架构 MCP Copilot 编程视觉