小红书
小红书智创音频技术团队:SOTA对话生成模型FireRedTTS-2来了,轻松做出AI播客!
小红书智创音频技术团队近日发布新一代对话合成模型 FireRedTTS-2。 该模型聚焦现有方案的痛点:灵活性差、发音错误多、说话人切换不稳、韵律不自然等问题,通过升级离散语音编码器与文本语音合成模型全面优化合成效果。 在多项主客观测评中,FireRedTTS-2 均达到行业领先水平,为多说话人对话合成提供了更优解决方案。
9/14/2025 1:29:00 PM
机器之心
ACM MM 2025 | 小红书AIGC团队提出风格迁移加速新算法STD
基于一致性模型(Consistency Models, CMs)的轨迹蒸馏(Trajectory Distillation)为加速扩散模型提供了一个有效框架,通过减少推理步骤来提升效率。 然而,现有的一致性模型在风格化任务中会削弱风格相似性,并损害美学质量 —— 尤其是在处理从部分加噪输入开始去噪的图像到图像(image-to-image)或视频到视频(video-to-video)变换任务时问题尤为明显。 这一核心问题源于当前方法要求学生模型的概率流常微分方程(PF-ODE)轨迹在初始步骤与其不完美的教师模型对齐。
8/20/2025 7:49:28 AM
小红书发布DynamicFace人脸生成技术,实现高质量图像视频人脸融合
小红书AIGC团队近日正式发布了名为DynamicFace的可控人脸生成技术。 据官方介绍,这项技术专门针对图像和视频领域的人脸融合任务进行优化,能够实现高质量与高度一致性的人脸置换效果。 DynamicFace技术的推出标志着小红书在AI内容生成领域的重要技术突破。
8/19/2025 10:46:50 AM
AI在线
ICCV 2025 | 小红书AIGC团队提出图像和视频换脸新算法DynamicFace
本论文主要作者来自小红书 AIGC 团队(Dynamic-X-Lab),Dynamic‑X‑LAB 是一个专注于 AIGC 领域的研究团队,致力于推动姿态驱动的人像生成与视频动画技术。 他们以高质量、高可控性的生成模型为核心,围绕文生图(t2i)、图像生成(i2i)、图像转视频(i2v)和风格迁移加速等方向展开研究,并通过完整的开源方案分享给开发者与研究者社区。 论文标题:DynamicFace: High-Quality and Consistent Face Swapping for Image and Video using Composable 3D Facial Priors论文链接::,扩散模型在图像与视频合成领域展现出前所未有的生成能力,为人脸生成与编辑技术按下了加速键。
8/12/2025 11:27:00 AM
机器之心
刚刚,小红书开源了多模态大模型dots.vlm1,性能直追SOTA!
最近的AI圈只能说是神仙打架,太卷了。 OpenAI终于发了开源模型,Claude从Opus 4升级到4.1,谷歌推出生成游戏世界的Genie 3引发社区热议。 国产模型这边,就在前几天,HuggingFace上排在最前面的10个开源模型还都来自国内。
8/7/2025 4:24:19 PM
新智元
小红书提出首个社交大模型:八大社交任务平均提升14.02%
大模型也能“通人情”? 行业首个社交大模型全景解析:既能兼顾社交理解与平台规则,又能洞察理解用户。 小红书重磅推出RedOne——一款面向SNS(社交网络服务)领域的定制化LLM,旨在突破单一任务基线模型的性能瓶颈,并且构建全面覆盖SNS任务的基座模型。
8/1/2025 2:28:38 PM
时令
万字干货:小红书 hi lab 团队关于奖励模型的一些探索
奖励模型(Reward Models,RM)在确保大语言模型(LLMs)遵循人类偏好方面发挥着关键作用。 这类模型通过学习人类的偏好判断,为语言模型的训练提供重要的引导信号。 奖励模型很多科学问题都充满挑战,小红书 hi lab团队过去一段时间对下列几个问题和关键挑战进行了一些探索:奖励模型应该如何评估?
6/25/2025 9:53:59 AM
上海市委网信办指导小红书、B站、拼多多等平台清理违规 AI 产品及信息
上海市委网信办指导小红书、哔哩哔哩、拼多多等 15 家重点网站平台,集中清理“一键脱衣”、未经授权的人脸或人声克隆编辑、未备案等违规 AI 产品、商品及相关营销、炒作、推广、教程信息。小红书、哔哩哔哩主动发布专项行动治理公告,开通了有害 AI 内容的举报受理处置渠道;星野开展智能体全面排查清理。各重点网站和 AI 平台共拦截清理相关违法违规信息 82 万余条,处置违规账号 1400 余个,下线违规智能体 2700 余个。经整治,网络违规 AI 信息显著减少。
6/12/2025 9:58:10 AM
远洋
小红书重磅出击!全新开源大模型 “dots.llm1” 震撼登场,参数量达 1420 亿!
近日,小红书的 hi lab 团队正式推出了其首个开源文本大模型 ——dots.llm1。 这一新模型以其卓越的性能和庞大的参数量引起了业界的广泛关注。 dots.llm1是一款大规模的混合专家(MoE)语言模型,拥有惊人的1420亿个参数,其中激活参数达到140亿。
6/10/2025 6:00:56 PM
AI在线
小红书Hi Lab提出DeepEyes,探索O3「Thinking with Images」能力
OpenAI 的 o3 首次将图像直接注入推理过程,打破了传统文字思维链的边界,成为多模态推理新的里程碑。 但是如何赋予模型这一能力,目前不得而知。 因此,小红书联合西安交通大学,采用端到端强化学习,在完全不依赖监督微调(SFT)的前提下,激发了大模型“以图深思”的潜能,构建出多模态深度思考模型 DeepEyes,首次实现了与 o3 类似的用图像进行思考的能力,并已同步开源相关技术细节,让“用图像思考”不再是 OpenAI 专属。
6/10/2025 5:00:00 AM
小红书hi lab首次开源文本大模型,14个checkpoint覆盖Pretrain与Instruct阶段
01、简介小红书hi lab(Humane Intelligence Lab,人文智能实验室)团队首次开源文本大模型 dots.llm1。 dots.llm1是一个中等规模的Mixture of Experts (MoE)文本大模型,在较小激活量下取得了不错的效果。 该模型充分融合了团队在数据处理和模型训练效率方面的技术积累,并借鉴了社区关于 MoE 的最新开源成果。
6/10/2025 3:30:00 AM
小红书发布首个开源大模型dots.llm1:11.2 万亿非合成数据助力中文性能提升
小红书近日宣布开源其首个大规模模型 ——dots.llm1,该模型具有1420亿个参数,是一种专家混合模型(MoE)。 其设计的一个显著特点是,在推理过程中仅激活140亿参数,这种结构不仅保持了高性能,还大幅降低了训练和推理的成本。 dots.llm1使用了11.2万亿个非合成的高质量训练数据,这在当前开源大模型中显得非常罕见,表明小红书在语言处理方面的强大资源。
6/9/2025 10:00:56 AM
AI在线
AI不止是技术:小红书联手复旦培养“人文+AI”复合型人才
小红书与复旦大学哲学学院近日达成合作,正式启动“AI人文人才训练营”,致力于在AI后训练阶段引入哲学与人文思维,共同培养具备跨学科素养的“AI 人文”复合型人才。 该训练营由小红书 hi lab(人文智能实验室)与复旦哲学学院联合发起,邀请哲学教师与AI技术专家共同担任导师与评审。 学生将以跨学科小组形式参与项目共创,通过对社会议题、人际关系、艺术审美、生活哲思等主题的探讨,与算法工程师协同设计更具人文关怀的AI模型。
5/27/2025 6:00:50 PM
AI在线
Kimi与小红书联手,推出21天打卡挑战吸引用户
近日,人工智能公司 Kimi 宣布与社交电商平台小红书达成市场营销合作,双方共同推出了一项名为 “21天打卡挑战” 的活动,旨在鼓励用户深入体验 Kimi 的核心功能。 小红书作为一个以年轻用户为主的社交平台,这次合作为 Kimi 提供了提升品牌认知的良机。 然而,在行业竞争愈发激烈的背景下,Kimi 面临着越来越大的商业化压力。
5/13/2025 9:00:52 AM
AI在线
小红书整治AI技术滥用,聚焦用AI起号引流带货、售卖AI账号
小红书发布了关于整治AI技术滥用的治理公告,公告称,为维护清朗网络空间,营造积极健康、文明和谐的社区环境,小红书积极响应中央网信办、上海市委网信办关于“清朗·整治AI技术滥用”专项行动的要求,重点聚焦利用AI批量生产虚假内容涨粉、利用AI起号引流带货、售卖AI起号课程、售卖AI账号等违规行为开展专项整治工作,切实履行平台责任,深入清理违规问题。 针对“利用AI生成低俗猎奇视频”、“AI生成虚拟外国幼儿教育专家教授育儿内容”、“AI视频账号售卖教程”、“AI账号秘籍传授”、“引导规避平台AI标注”“转让、销售AI虚拟账号”等各类违规内容加强排查清理力度,共清理违规内容265条,对@IU干跨境等13个违规用户予以禁言处置。 同时严厉打击转让、售卖、出租网络账号行为,加强AI生成内容监测甄别。
5/12/2025 6:00:52 PM
AI在线
Kimi入驻小红书,AI大模型从“投流大战”转向内容深耕
近日,月之暗面旗下大模型产品 Kimi 宣布与小红书达成最新合作,在“小红书·Kimi智能助手”账号中上线对话入口,用户可通过跳转进入对话界面,并一键生成笔记。 然而,“硅基研究室”实测发现,该入口目前仅作为轻量化的访问渠道存在,与小红书平台其他入口尚未形成深入整合。 早在2024年,小红书就已参与Kimi母公司10亿美元A轮融资,双方曾联合推出“AI新手村”活动。
5/12/2025 3:00:52 PM
AI在线
GPT-4o的P图全家桶有多强?连Midjourney CEO都坐不住了
编辑 | 佳琪不会 PS 也能赢麻了! 这句话我们已经在各种各样的 AI 生图工具那里听了太多遍,不过,这次 GPT-4o 好像玩的是真的。 打开社交媒体,无论是 X 还是小红书,都被 GPT-4o 生成的图片刷了屏。
3/27/2025 6:54:00 PM
AI好好用
AI 助推 “水军” 新形态:48小时炮制4000多条有害信息
近年来,随着人工智能技术的发展,网络 “水军” 的形态正在发生巨变。 据解放日报报道,最新数据显示,借助 AI 技术,这些水军的活动成本低至每条信息仅需1厘钱,且一个人能够操控多达6000部手机,在短短48小时内便能发布超过4000条有害信息。 春节档期间,电影《蛟龙行动》因遭遇水军恶意打低分而陷入困境,最终被迫撤档。
3/17/2025 10:06:00 AM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
智能体
马斯克
AI新词
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
蛋白质
苹果
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
生成
人形机器人
AI视频
百度
计算
工具
Sora
GPU
大语言模型
华为
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
深度学习
AGI
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
DeepMind
亚马逊
特斯拉
编程
MCP