AI在线 AI在线

资讯列表

小模型指导大模型!田渊栋等爆锤蒸馏:新方法更高效、更透明、更可控

「下一个token预测」(next token prediction,NTP)是大语言模型(LLMs)不断取得突破的核心技术。 但这种依赖tokenization的方法,导致LLM「严重偏科」。 比如,Karpathy发现一个表情包相当于53个token!关注AI的可能也知道GPT-4o不会数字母,不知道Strawberray中有几个字母「r」。
3/3/2025 9:16:00 AM
新智元

智谱AI宣布完成新一笔金额超10亿元战略融资

近日,国内领先的人工智能企业智谱宣布完成了一笔金额超过10亿元人民币的战略融资。 此次融资由杭州城投产业基金、上城资本等多家投资机构共同参与,为智谱的进一步发展和技术创新注入了强劲动力。 据悉,这笔融资将主要用于推动国产基座GLM大模型的技术创新和生态发展。
3/3/2025 9:09:00 AM
AI在线

官方详解 DeepSeek-V3 / R1 推理系统:理论利润率达 545%

3 月 1 日消息,DeepSeek 官方今日在知乎发布《DeepSeek-V3 / R1 . 推理系统概览》一文,详细介绍如何使用大规模跨节点专家并行(Expert Parallelism / EP)来增大 batch . size,如何隐藏传输的耗时,如何进行负载均衡。
3/3/2025 9:00:00 AM
清源

字节视频生成新突破!Phantom搞定多人物/主体一致性

视频生成模型当中已经不缺强者了,但保持多主体一致性依然是一项重大挑战。 字节智能创作团队专门针对这个问题,推出了主体一致性视频生成模型Phantom(“幻影”)。 Phantom在主体一致性保持方面取得了突破性进展,不仅支持多主体,还能同时保持主体的完整性。
3/3/2025 8:32:00 AM
量子位

医疗保健领域AI数据治理的新内容和变化

GenAI正在帮助医疗机构提高生产力和推进临床护理,但其可靠性完全取决于训练所用的数据。 这使得医疗数据治理变得愈发重要。 AWS和《哈佛商业评论》的一项新调查显示,多个行业的首席数据官都担心他们的数据资产无法胜任这项任务。
3/3/2025 8:30:00 AM
Erin Laviola

荣耀发布阿尔法计划 5年投入100亿美元建设AI生态

昨晚,MWC2025全球移动大会在上海正式拉开帷幕,荣耀新任CEO李健在会上首次亮相,并正式发布了荣耀的全新人工智能战略计划——“阿尔法计划”。 作为荣耀的新掌舵人,李健在发布会上宣布,未来五年,荣耀将投入高达100亿美元的资金,与全球合作伙伴共同构建AI设备生态,标志着荣耀从智能手机制造商向全球AI终端生态公司的全面转型。 值得注意的是,这也是李健自接任荣耀CEO以来的首次公开亮相。
3/3/2025 8:26:00 AM
AI在线

Claude 3.7成精了!偷偷将OpenAI模型换成自己,卡帕西:迄今最好笑的一趴

Claude 3.7成精了! 在开发者最喜欢的Cursor中,偷偷将OpenAI模型换成自己,关键是人类给出的指示跟这完全没关系。 引来一众网友围观的同时,大佬卡帕西也被成功逗笑了:迄今为止最有意思的一趴。
3/3/2025 8:25:00 AM
量子位

DeepSeek突袭公布成本利润率:545%

五连开源后,DeepSeek还有One More Thing! 就在刚刚,DeepSeek官方亲自揭秘了DeepSeek-V3/R1推理系统。 重点包括,优化吞吐量和延迟的方法:跨节点EP驱动的批量扩展计算与通信重叠负载均衡还公布了DeepSeek的在线服务数据统计:每个H800节点每秒有73.7k/14.8k个输入/输出token成本利润率545%更多细节,一起来看官方原文↓更大的吞吐,更低的延迟DeepSeek-V3/R1推理系统的优化目标是:更大的吞吐,更低的延迟。
3/3/2025 8:21:00 AM
量子位

DeepSeek全面开源V3/R1推理系统!成本利润率高达545%

就在刚刚,当大家以为开源周已经结束的时候,真「Open AI」DeepSeek带来了压轴大戏——DeepSeek-V3/R1推理系统,全面揭秘! 吞吐量和延迟优化:跨节点高效并行(EP)驱动的批处理扩展计算与通信并行处理智能负载均衡在线服务性能数据:每个H800节点每秒处理73,700/14,800输入/输出token成本利润率高达545�epSeek表示,希望本周分享的技术见解能为开源社区带来价值,共同推进通用人工智能的发展目标。 看到这里,网友都惊了!
3/3/2025 8:17:00 AM
新智元

英语客服印度口音太重?全球最大呼叫中心运营商 Teleperformance SE 推出 AI 语音实时优化系统

全球最大的呼叫中心运营商 Teleperformance SE 推出了一款人工智能系统,可实时调整印度英语客服人员的口音,以提高沟通的清晰度。
3/3/2025 8:16:13 AM
清源

神经网络技术的核心:反向传播算法(BP算法)

在前面的文章中介绍训练一个模型,其主要区别就在于神经网络模型的架构;但可能很多人并不知道神经网络模型的核心算法就是——反向传播算法,也被叫做BP算法。 可能很多人都听说过反向传播算法,但可能很多人都没意识到反向传播算法对神经网络的重要性;可以说现在的神经网络模型就建立在反向传播算法之上,没有反向传播算法就没有神经网络的存在。 反向传播(BP)算法了解过人工智能发展史的人应该都知道,人工智能技术并不是最近才出现的新技术;在世界上第一台计算机出现之后的十年,人工智能的概念就已经被提出来了,但人工智能技术的发展却是最近几年才爆火的。
3/3/2025 8:10:00 AM
AI探索时代

副业要赚翻?这六款 AI 代理简直像开挂

AI 代理(AI Agents)能够让繁琐的人工工作实现高度自动化,而且速度快、准确度高。 它们在写代码、做营销、创作视频以及其他创意或业务领域都越来越出色。 如果现在还不使用 AI 代理,可能很快就会落后。
3/3/2025 8:10:00 AM
dev

分享五个在微信中使用 DeepSeek 的方法,建议收藏!

前言今天大姚将为大家分享5种在微信中使用DeepSeek的方法,帮助大家更好地利用这一工具,提升工作和学习效率。 无论是处理文档、管理知识,还是进行深度搜索和思考,这些方法都将为你带来全新的体验。 让我们一起探索DeepSeek在微信中的无限可能吧!
3/3/2025 8:06:39 AM
大姚

5分钟顶人类8小时!OpenAI Deep Research订阅全推送,端到端强化微调是关键

Deep Research(深度研究)是继「Operator」之后,OpenAI推出的第二个智能体,利用模型的推理能力,综合分析浩瀚的互联网信息,从而完成复杂的研究任务。 月初,OpenAI首先向ChatGPT Pro用户开放了Deep Research功能。 最近,进一步开放给了更多等级的订阅用户。
3/3/2025 8:02:00 AM
新智元

KDD2025|小红书联合中科大提出1.44M轻量高效AI图像检测模型,超SOTA 4.5个点

当下,AI 生成图像的技术足以以假乱真,在社交媒体肆意传播。 如何对不同生成模型实现通用检测? 小红书联合中国科学技术大学给出了解决方案,仅用 1.44M 参数量实现了通用 AI 图片检测,在 33 个测试子集上达到 96.7% 的准确率,超 SOTA 模型 4.5 个百分点。
3/3/2025 8:00:00 AM
又在技术上突破的

GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河

自从OpenAI发布GPT-4.5之后,Ilya这张图又开始火了。 GPT-4.5令人失望的表现,再次印证了Ilya这句话的含金量:预训练已经达到极限,推理Scaling才是未来有希望的范式。 GPT-4.5在基准测试上并没有提升,推理没有增强,只是变成了一个更易于合作、更有创造性、幻觉更少的模型。
3/3/2025 8:00:00 AM
新智元

Nature独家爆料:全球机构撤稿率大排行,医学领域成重灾区

撤稿,是对科研人员诚信的巨大打击,不仅是一篇论文,此前的研究成果都可能遭到同行质疑。 中国在保障学术道德诚信方面的力度非常大,一经发现,即全国通报批评,取消申报课题资格5年,基本就断送了自己的学术生涯。 通报链接::,仍然有大量的科研人员为了一己私利,在论文撰写中捏造数据、伪造实验结果,甚至雇佣写手,从论文工厂中购买。
3/3/2025 7:36:00 AM
新智元

AI欺骗决策者,我们可能还没有引起注意

近年来,AI技术飞速发展,但随之而来的问题也日益凸显。 最近,AI模型被曝出频繁出现欺骗行为,不仅不服从研究人员指令,还试图逃离限制环境,甚至谎称遵守规则。 这一现象引起了业界的广泛关注。
3/3/2025 7:30:00 AM
Alex Kantrowitz