Large
Former DeepSeek executive secretly starts new AI Agent project, already backed by top VC
According to the news from Tiger嗅, a core executive of the domestic large model company DeepSeek has quietly left and started a new business half a year ago, and plans to launch its first Agent product around Christmas in 2025.Sources close to the matter told Tiger嗅 that the executive once held the role of "CTO" at DeepSeek. However, some insiders pointed out that DeepSeek's internal structure does not clearly set up a "CTO" position. In name, this position may not exist, but there is indeed an executive who takes on technical coordination and R&D decision-making responsibilities similar to those of a CTO.Reliable sources also revealed that this startup project has already received financing support from a leading VC, with the specific amount undisclosed.
6/16/2025 9:48:51 AM
AI在线
The Next Generation Open Source 3D Model Step1X-3D Debuts, AI Industry Trend Draws Attention
Recently, the technology sector welcomed a brand-new open-source 3D large model called "Step1X-3D." The release of this model marks another significant advancement in AI technology, particularly in 3D modeling and reasoning capabilities. Not only is this model open-source, but it also provides developers with various practical features, greatly promoting innovation and research possibilities.At the same time, Xiaomi is continuously expanding its presence in the AI field. It has recently applied for the "MiMo" trademark, which is intended to be used for inference large models.
5/15/2025 10:01:53 AM
AI在线
腾讯推出 Hunyuan-Large 大模型:389B 总参数,业界已开源基于 Transformer 的最大 MoE 模型
腾讯今日宣布推出 Hunyuan-Large 大模型,官方表示这是目前业界已经开源的基于 Transformer 的最大 MoE 模型,拥有 3890 亿总参数(389B)和 520 亿激活参数(52B)。 腾讯今日在 Hugging Face 开源了 Hunyuan-A52B-Pretrain 、 Hunyuan-A52B-Instruct 和 Hunyuan-A52B-Instruct-FP8。 并发布了技术报告和训练推理操作手册,详细介绍了模型能力和训练与推理的操作。
11/5/2024 4:13:12 PM
沛霖(实习)
开源文生图 AI 重磅选手上新:Stable Diffusion 3.5 最强全家桶登场、消费级硬件上“开箱即用”
Stability AI 公司昨日(10 月 22 日)发布博文,宣布推出 Stable Diffusion 3.5,这标志着开源 AI 文生图模型的重大进步。Stable Diffusion 3.5 共有 Medium(10 月 29 日发布)、Large 和 Large Turbo 三种规模版本,旨在满足科学研究人员、爱好者、初创公司和企业的不同需求,AI在线附上相关介绍如下:Stable Diffusion 3.5 Large:共有 80 亿个参数,具有卓越的质量和快速响应,是 Stable Diffusion 家族中最强大的模型,非常适合 100 万像素分辨率的专业应用场景。Stable Diffusion 3.5 Large Turbo:是 Large 的精简版,在出色地遵循提示词上,仅需 4 个步骤内生成高质量图像,且生成速度明显快于 Large。
10/23/2024 9:05:11 AM
故渊
OpenAI 升级 Whisper 语音转录 AI 模型,不牺牲质量速度快 8 倍
OpenAI 在 10 月 1 日举办的 DevDay 活动日中,宣布推出了 Whisper large-v3-turbo 语音转录模型,共有 8.09 亿参数,在质量几乎没有下降的情况下,速度比 large-v3 快 8 倍。Whisper large-v3-turbo 语音转录模型是 large-v3 的优化版本,并且只有 4 层解码器层(Decoder Layers),作为对比 large-v3 共有 32 层。Whisper large-v3-turbo 语音转录模型共有 8.09 亿参数,比 7.69 亿
10/3/2024 11:44:37 AM
故渊
1230 亿参数,Mistral 发布 Large 2 旗舰 AI 模型:支持 80 多种编程语言,增强代码生成、数学和推理能力
AI 竞赛日益激烈,Meta 公司昨日推出开源 Llama 3.1 模型之后,法国人工智能初创公司 Mistral 也加入了竞争行列,推出了新一代旗舰模型 Mistral Large 2。模型简介该模型共有 1230 亿个参数,在代码生成、数学和推理方面比其前身功能更强大,并提供更强大的多语言支持和高级函数调用功能。Mistral Large 2 拥有 128k 的上下文窗口,支持包括中文在内的数十种语言以及 80 多种编码语言。该模型在 MMLU 上的准确度达到了 84.0%,并在代码生成、推理和多语言支持方面有
7/25/2024 6:53:16 AM
故渊
对标 GPT 4.0,李开复旗下 AI 公司零一万物发布千亿参数闭源模型 Yi-Large
零一万物创始人兼 CEO 李开复今日发布了千亿参数闭源模型 Yi-Large,他表示 Yi-Large 的多数指标可对标甚至是超越 GPT 4.0。该模型在斯坦福大学最新的 AlpacaEval 2.0 评估中,全球大模型胜率(Win Rate)排第一、文本长度误差的胜率(LC Win Rate)排第二。同时零一万物将早先发布的 Yi-34B、Yi-9B / 6B 中小尺寸开源模型版本升级为 Yi-1.5 系列,每个版本达到同尺寸中 SOTA (State of the art model,即在当前研究中表现最好的
5/13/2024 5:44:22 PM
沛霖(实习)
Mistral AI新模型对标GPT-4,不开源且与微软合作,网友:忘了初心
「欧洲版 OpenAI」的「最强开源大模型」,被微软收编了。生成式 AI 领域,又有重量级产品出现。周一晚间,Mistral AI 正式发布了「旗舰级」大模型 Mistral Large。与此前的一系列模型不同,这次 Mistral AI 发布的版本性能更强,体量更大,直接对标 OpenAI 的 GPT-4。而新模型的出现,也伴随着公司大方向的一次转型。随着 Mistral Large 上线,Mistral AI 推出了名为 Le Chat 的聊天助手(对标 ChatGPT),任何人都可以试试效果。试用链接:,Mi
2/27/2024 3:08:00 PM
机器之心
- 1
资讯热榜
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
Microsoft Releases 700 Real AI Cases to Explore New Intelligent Work Models
苹果将 ChatGPT 和其他 AI 模型引入 Xcode
Grok接管推特算法!小号也能爆红,新人起号迎来黄金时代?
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
Meta
学习
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
英伟达
代码
Anthropic
芯片
开发者
生成式
蛋白质
腾讯
神经网络
训练
3D
研究
生成
智能体
苹果
计算
机器学习
Sora
Claude
AI设计
AI for Science
GPU
AI视频
人形机器人
搜索
华为
百度
场景
大语言模型
xAI
预测
伟达
深度学习
LLM
字节跳动
Transformer
Agent
模态
具身智能
神器推荐
工具
文本
视觉
LLaMA
算力
Copilot
驾驶
大型语言模型
API
RAG
应用
架构