字节跳动
火山引擎明日发布全新豆包视频生成模型,支持无缝多镜头叙事
字节跳动火山引擎宣布6月11日发布全新豆包视频生成模型,支持多镜头叙事、多动作运镜及多种风格视频生成。#火山引擎# #视频生成#
6/10/2025 4:56:30 PM
汪淼
即梦图片3.0智能参考全量上线!一键生成影视级海报,AI设计进入“零门槛”时代!
字节跳动旗下AI创作平台即梦AI迎来重大更新,其核心产品即梦图片3.0的智能参考功能已于近日全量上线。 这一功能以强大的中文理解能力和影视级生成效果,彻底颠覆了传统设计流程,让普通用户也能轻松创作专业级海报、电商封面和短视频配图。 智能参考功能:一键解锁专业设计即梦图片3.0的智能参考功能允许用户上传参考图片,通过简单的文本提示(Prompt)生成符合特定风格的设计作品。
6/9/2025 3:00:56 PM
AI在线
字节跳动发布图像编辑模型 SeedEdit 3.0,处理更加丝滑高效
它能够处理并生成 4K 图像,在精细且自然地处理编辑区域的同时,还能高保真地维持其他信息。
6/6/2025 4:14:52 PM
界面快报 ·
字节发布图像Agent“小云雀AI” 打造一键爆款创作神器
字节跳动今日推出全新图像Agent“小云雀AI”,一款智能创作工具,引发行业关注。 其功能与Lovart相似,用户仅需一句指令,“小云雀AI”即可主动思考、智能执行,快速生成爆款视频与图片,真正实现“灵感即所得,创作零门槛”。 “小云雀AI”无需专业技能,创作如聊天般轻松,适合短视频创作者、营销团队及普通用户,极大降低内容创作门槛。
5/29/2025 3:00:54 PM
AI在线
字节推出全新 AI 剪辑应用 “剪小映”,轻松记录生活瞬间
最近,字节跳动公司发布了一款名为 “剪小映” 的新应用,其宣传口号 “捕捉美好,智创影片” 引发了广泛关注。 这款应用的推出,标志着字节在视频编辑领域的又一次创新,同时也是继 “即梦 AI” 之后的又一力作。 借助火山引擎的豆包大模型技术,“剪小映” 旨在为用户提供更加便捷、高效的视频创作体验。
5/29/2025 12:01:03 PM
AI在线
消息称字节跳动内部将禁用第三方 AI 开发软件,用自家 Trae 替代
字节跳动安全与风控部门发布邮件称,出于对防范数据泄露风险的考虑,自 6 月 30 日起,将在内部分批次禁用第三方 AI 开发软件,包括 AI 编程工具 Cursor、Windsurf 等,并将字节旗下的编程助手 Trae 作为替代方案。(第一财经)
5/28/2025 3:20:12 PM
汪淼
字节跳动开源 Deep Research 项目 DeerFlow:可生成图文报告、语音播客
字节跳动技术团队今日宣布,基于 LangStack 的全新 Deep Research 开源项目 ——DeerFlow 正式在 ByteDance 的 GitHub 官方组织上开源。
5/10/2025 8:26:49 PM
清源
字节跳动启动 “Top Seed” 计划,面向 2026 届博士生招募 AI 人才
字节跳动近日宣布正式启动2026届 “Top Seed” 大模型顶尖人才校招计划,计划招募约30位优秀博士生。 这一项目专注于前沿的人工智能领域,涵盖大语言模型、机器学习算法与系统、多模态生成与理解、语音处理等研究方向。 字节跳动希望通过此举,吸引那些在大模型研究领域具备极强潜力和热情的年轻才俊。
4/28/2025 12:00:40 PM
AI在线
字节跳动推出 QuaDMix:大型语言模型预训练数据质量与多样性的统一框架
近日,字节跳动宣布推出其全新的数据选择框架 QuaDMix,旨在提升大型语言模型(LLM)预训练的效率和泛化能力。 众所周知,模型的训练效果受基础数据集的质量和多样性影响很大。 然而,传统的数据筛选方法往往将质量和多样性视为两个独立的目标,先进行质量过滤,再进行领域平衡。
4/28/2025 10:01:33 AM
AI在线
字节跳动启动 Top Seed 大模型顶尖人才计划 2026 届校招,计划招募 30 位顶尖博士
字节跳动正式启动2026届Top Seed校招,计划招募30位顶尖博士,研究方向涵盖大语言模型、多模态生成等前沿领域。不限专业背景,更看重研究潜力与热情。#字节跳动校招# #大模型人才#
4/27/2025 5:56:06 PM
远洋
字节跳动推出Vidi多模态模型,引领超长视频理解与编辑新潮流
字节跳动宣布推出全新多模态模型Vidi,专注于视频理解与编辑,首版核心能力为精准的时间检索功能。 据AIbase了解,Vidi能够处理视觉、音频和文本输入,支持长达一小时的超长视频分析,在时间检索任务上性能超越GPT-4o与Gemini等主流模型。 这一突破性技术已在AI社区引发热烈讨论,相关细节通过字节跳动官方渠道与GitHub公开。
4/23/2025 5:00:42 PM
AI在线
字节跳动发布高效预训练长度缩放技术,突破长序列训练瓶颈
字节跳动宣布推出高效预训练长度缩放技术(Efficient Pretraining Length Scaling),通过创新的Parallel Hidden Decoding Transformer(PHD-Transformer)框架,显著提升大语言模型(LLM)在长序列预训练中的效率与性能。 据AIbase了解,该技术在保持推理效率的同时,支持高达2048K(2M)的上下文长度训练,解决了传统框架在数据异构性与计算平衡上的瓶颈。 相关研究已在arXiv公开,引发了AI研究社区的广泛关注。
4/23/2025 3:00:42 PM
AI在线
扣子空间Coze Space正式开启内测 支持 MCP 扩展集成
字节跳动技术团队宣布,其全新 AI 协同办公平台“扣子空间”(Coze Space)正式开启内测。 “扣子空间”旨在成为用户与 AI Agent 协同办公的最佳场所,提供从回答问题到解决问题的全方位服务,帮助用户更高效地完成工作。 “扣子空间”具有多项创新特点,能够自动分析用户需求并拆解为多个子任务,自主调用工具(如浏览器、代码编辑器等)执行任务,并输出完整的结果报告,如网页、PPT、飞书文档等。
4/19/2025 6:00:41 PM
AI在线
字节 Seed 开源 UI-TARS-1.5:基于视觉-语言模型构建的多模态智能体
UI-TARS-1.5 昨日正式发布并开源。这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。
4/18/2025 7:48:14 AM
清源
字节跳动发布豆包 1.5 深度思考模型,同时升级文生图模型
字节跳动发布豆包1.5深度思考模型,采用MoE架构,总参数200B,激活参数20B,推理成本低于业界50%。新模型在数学、编程、科学推理及创意写作等任务中表现突出,还能结合视觉理解技术提供更多功能。#AI大模型##字节跳动#
4/17/2025 10:50:40 AM
远洋
字节跳动开源Liquid多模态模型,革新视觉与语言统一生成
人工智能领域迎来一项重大突破。 AIbase从社交媒体获悉,字节跳动于近日宣布开源其全新多模态生成模型Liquid,该模型以创新的统一编码方式和单一大语言模型(LLM)架构,实现了视觉理解与生成任务的无缝整合。 这一发布不仅展示了字节在多模态AI上的技术雄心,也为全球开发者提供了强大的开源工具。
4/16/2025 6:01:15 PM
AI在线
字节Seedream 3.0 文生图模型技术报告发布:多项性能大幅升级
字节跳动Seed团队正式发布了Seedream3.0文生图模型的技术报告。 这一模型在性能上实现了重大提升,是一个原生高分辨率、支持中英双语的图像生成基础模型,在分辨率、生图结构准确性等多方面取得突破,与上一版本相比优势显著。 Seedream3.0在不同维度上的表现。
4/16/2025 3:01:05 PM
AI在线
Mogao=Seedream 3.0?霸榜数天,神秘文生图模型曝光(附技术报告)
霸榜数天的神秘文生图模型 Mogao,什么来头? 这两天,不少业内人已在询问「这个魔法般模型」的出处。 有人对模型效果颇为认可,好奇如何体验。
4/16/2025 2:18:00 PM
机器之心
资讯热榜
智谱AI全新企业级超级助手Agent CoCo正式上线
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
首月 1 美元,ChatGPT Team 会员美区 / 英区 / 欧洲区 / 澳洲区迎优惠
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
ChatGPT 语音功能升级,实时翻译对话更自然流畅
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊