应用
腾讯发布Hunyuan-TurboS:首款超大型混合Transformer-Mamba MoE模型震撼登场
今日,腾讯在X平台上正式宣布推出其最新AI模型Hunyuan-TurboS,这款被誉为“首款超大型Hybrid-Transformer-Mamba MoE模型”的产品迅速引发全球科技圈的热议。 根据X用户披露的信息,Hunyuan-TurboS通过融合Mamba的高效长序列处理能力和Transformer的强大上下文理解能力,成功克服了传统纯Transformer模型在长文本训练和推理上的瓶颈,展现出令人瞩目的性能突破。 据介绍,传统Transformer模型因O(N²)复杂度和KV-Cache问题,在处理长文本时往往面临效率低下和高成本的挑战。
3/11/2025 8:56:00 AM
AI在线
DeepSeek R2 或于3月17日发布,将撼动Claude Sonnet 3.7的地位
根据X平台上的最新消息,DeepSeek下一代AI模型DeepSeek R2或将于3月17日正式发布。 这一消息迅速引发业界关注,许多人认为这一新模型可能会对现有AI巨头,如Anthropic的Claude Sonnet3.7,构成强有力的挑战。 据X用户 tanvitabs 今日凌晨发布的帖子透露,DeepSeek R2宣称在多个关键领域实现突破,包括更出色的编程能力、多语言推理能力,以及以更低的成本提供更高的准确性。
3/11/2025 8:51:00 AM
AI在线
OpenAI 发布 CoT 思维链研究成果,监控阻止大模型恶意行为
结果显示,CoT 监控器在检测系统性“奖励黑客”行为时表现卓越,召回率高达 95%,远超仅监控行为的 60%。
3/11/2025 8:26:34 AM
问舟
全网爆火的Manus到底能做什么?超多演示案例来了!
关注科技 AI 圈的同学,在 3 月 6 号这天都被 Manus 刷屏了,那么他是个啥呢? 和 DeepSeek 和 Open AI 有什么区别呢? Manus 官网上是这样说的“Manus 是一个通用的人工智能代理,它连接思想和行动:它不仅会思考,还会提供结果。
3/11/2025 12:54:46 AM
益达
如何用Cursor+Claude两个神器,两步完成APP开发?
最近在 X 上看到了一些人在用 Claude 3.7 Sonnet 生成 App 原型图的尝试,受到启发,发现这么生成不同界面的原型图再让 Cursor 基于原型图开发 App 会是很好的尝试。 尤其是,你也可以不两步直接生成,而是在过程中更可视化地思考你要生成的原型,这对于非专业的产品经理来说,会是好得多的方式。 我今天做了些尝试后,效果让我感到惊艳。
3/11/2025 12:45:03 AM
果汁
鸿海富士康推出旗下首款 AI 推理大模型 FoxBrain ,基于 Meta Llama 3.1 打造
鸿海富士康宣布旗下首个AI推理大模型FoxBrain,基于Meta Llama 3.1打造,涵盖数据分析、数学、推理和代码生成等功能,未来将开源。与英伟达合作,利用120块H100 GPU训练一个月,优化繁体中文处理。 #富士康 #AI #FoxBrain
3/10/2025 8:45:17 PM
漾仔
广东:支持企业整合人工智能与机器人产业链、创新链资源
广东省人民政府办公厅印发广东省推动人工智能与机器人产业创新发展若干政策措施。其中提到,支持关键核心技术攻关。支持企业、高校、科研院所等各类创新主体开展联合攻关,围绕人工智能与机器人产业链上下游组建产业创新联盟,加快构建全过程创新链。组织实施省重点领域研发计划“新一代人工智能”“智能机器人”等旗舰项目、重大专项,在人工智能与机器人领域部署一批攻关任务。对国家科技重大专项符合省级配套条件的人工智能与机器人领域重点项目,省财政按规定给予配套奖励,单个项目省级配套金额超 1 亿元(含)的,按“一事一议”方式研究给予支持。创建人工智能与机器人领域制造业创新中心,对符合条件的国家级、省级制造业创新中心,省财政按规定分别给予最高 5000 万元、1000 万元的资金支持。
3/10/2025 7:53:29 PM
远洋
小米相关人员:“CyberOne 人形机器人即将量产”消息不实
据科创板日报今日报道,近期有消息称,小米机器人CyberOne正分阶段落地亦庄产线,并计划于3-4月公示量产进展,4-5月开放参观,下半年做PR宣发。对此,小米相关人员回应称,前述消息不属实。
3/10/2025 7:28:08 PM
清源
“专为我开了一个新课题”,顶尖博士为什么偏爱去字节实习?
在字节跳动,有这样一群实习生,他们的另一重身份,都是来自顶尖高校的技术博士。 实习第 100 天,团队为了清华博士云飞专门开了一个全新课题。 北大博士瑞晨曾经不得已搁置的想法,也在这里实现了大规模验证。
3/10/2025 6:46:00 PM
机器之心
上海科技馆馆长倪闽景:AI 可能会“消灭差生”并真正实现因材施教,要把干净的手机还给孩子
“原来是一个老师面对这么多学生,只能均衡教育,考一样的考卷,学一样的内容,但有了人工智能,我们每一个孩子真的可以学得不一样了,它可以提高我们孩子的自主性。”
3/10/2025 6:02:20 PM
清源
大模型效率狂飙:字节COMET技术开源,提速1.7倍
字节跳动旗下豆包大模型团队近日宣布,成功攻克混合专家模型(MoE)架构的关键瓶颈,并开源一项名为COMET的重大优化技术。 该技术显著提升了大模型的训练效率,实现了高达1.7倍的效率提升,并有效降低了40%的训练成本。 图源备注:图片由AI生成,图片授权服务商Midjourney据介绍,COMET技术已在字节跳动的万卡集群训练中得到实际应用,累计节省了数百万GPU小时的训练算力。
3/10/2025 5:59:00 PM
AI在线
中国信通院:正式启动多模态智能体技术规范编制工作
据人民财讯报道,为进一步加速智能体赋能产业应用,推动多模态智能体高质量发展,中国信通院正式启动多模态智能体技术规范编制工作。为充分完善技术规范内容,增进产业交流,中国信通院人工智能研究所将于 3 月 13 日召开多模态智能体技术沙龙暨技术规范研讨会,邀请业内专家围绕多模态智能体技术的发展动态、应用落地等展开研讨,并介绍多模态智能体技术规范框架。
3/10/2025 5:56:50 PM
远洋
00后用DeepSeek直播1天卖出3.3亿元
近日,在浙江杭州,随着 AI 工具 DeepSeek 的走红,越来越多的创业者开始借助其强大的功能来实现盈利。 日前,关于一位00后主播在使用 DeepSeek 进行直播时,仅一天就成功销售了价值3.3亿元的商品,引起了广泛关注。 据报道,在 DeepSeek 的帮助下,许多商家和个人都尝试了新的销售方式。
3/10/2025 5:56:00 PM
AI在线
LeCun 最新访谈对 DeepSeek 一顿猛夸,还谈了 AI 发展需理解物理世界
他表示,DeepSeek 是一项很出色的成果,它的开源不只是成果创造者受益,全世界都能从中受益。
3/10/2025 5:43:30 PM
清源
ServiceNow 即将以 30 亿美元收购 AI 公司 Moveworks
近日,有报道称,美国软件公司 ServiceNow 正在与人工智能助手提供商 Moveworks 进行收购谈判,这笔交易可能会成为 ServiceNow 有史以来最大的一笔收购,交易金额接近 30 亿美元。 消息源指出,虽然双方的讨论已进入高级阶段,但仍存在延迟或谈判破裂的可能性。 Moveworks 成立于 2016 年,专注于开发 AI 驱动的员工助理工具,其客户包括联合利华、GitHub 和博通等知名企业。
3/10/2025 5:43:00 PM
AI在线
字节跳动豆包大模型团队开源MoE架构优化技术,训练成本节省40%
字节跳动豆包大模型团队官宣开源一项针对 MoE(混合专家模型)架构的关键优化技术,可将大模型训练效率提升 1.7 倍,成本节省 40%。据悉,该技术叫做 COMET,已实际应用于字节的万卡集群训练,累计帮助节省了数百万 GPU 小时训练算力。
3/10/2025 5:42:41 PM
远洋
智元发布家务机器人基座大模型 GO-1,成功率大幅提升
3月10日,智元机器人正式推出其首个通用具身基座大模型 ——Genie Operator-1(简称 GO-1)。 这一消息引起了广泛关注,特别是其在家庭服务机器人的潜力方面,似乎为未来的家务管理带来了新的希望。 根据智元机器人的官方介绍,GO-1大模型通过学习大量人类视频,展示了其在执行多项家务任务上的出色表现,如递送水杯、制作餐点和迎接客人等。
3/10/2025 4:59:00 PM
AI在线
Rokid Glasses AR+AI 眼镜升级:搭载多款 AI 大模型,支持手动配置
截至目前,除通义千问外,Rokid Glasses 也集成了 DeepSeek、豆包、智谱清言、纳米搜索等多个大模型。Rokid Glasses 将这些大模型分类管理,分为基础模型、视觉模型、搜索模型等。
3/10/2025 4:55:57 PM
汪淼
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
视觉
预测