资讯列表
小模型:传统行业智能化转型的“轻量级引擎”
一、生成式AI浪潮下,传统行业CIO的“务实革命”当全球企业竞逐千亿参数大模型时,制造业、医药、能源等传统行业的CIO们正悄然发起一场“务实革命”——与其追逐算力军备竞赛,他们更关注如何让AI真正落地车间、实验室与供应链。 面对高昂的GPU集群投入、复杂的数据合规要求,以及垂直场景的碎片化需求,企业技术决策者开始重新审视技术路径:能否以更轻量的方式,撬动智能化转型?小模型(Small Language Models, SLM)的崛起,恰恰击中了这一痛点。 相较于“大而泛”的通用大模型,参数规模通常小于10亿的小模型凭借轻量化架构、领域精调能力和边缘端部署优势,正成为传统行业的“轻量级引擎”。
3/5/2025 9:30:00 AM
Nvidia RTX 5070 Founders Edition 发布推迟
Nvidia 宣布其 GeForce RTX5070Founders Edition 显卡将不会与其他5070显卡同步发布。 虽然这款售价为549美元的显卡的评测今天已正式出炉,但 Nvidia 的全球公关总监 Ben Berraondo 透露,RTX5070Founders Edition 将会在 “三月晚些时候” 上市。 这意味着希望购买该显卡的用户,需要耐心等待,或选择由 Asus、MSI 等合作伙伴公司在3月5日发布的第三方版本。
3/5/2025 9:30:00 AM
AI在线
亚马逊研发新型推理人工智能模型,欲与OpenAI和Anthropic展开竞争
近日,有消息透露,亚马逊正在积极开发一种集成先进推理能力的人工智能模型。 这一新产品计划将在今年6月份以 Nova 品牌推出,Nova 是亚马逊去年年底发布的一系列生成式人工智能模型的一部分。 项目的相关人士表示,该模型旨在采用 “混合推理” 方法,能够在同一个系统中提供快速的回答以及更复杂的推理过程。
3/5/2025 9:23:00 AM
AI在线
消息称腾讯元宝半个月投了近 3 亿元做推广,“高冷”微信也成导流工具
“腾讯系产品也几乎没有为了导流,能直接进入九宫格的。何况还直接给打上了诱导下载的标签。”有腾讯人士表示。(财经天下)
3/5/2025 9:21:58 AM
汪淼
vivo重组调整,成立新AI部门并将大模型训练转向端侧
近日,vivo 公司在其组织架构上进行了重要调整,宣布在原有的 OS 产品领域内新设立 AI 领域。 这一新部门下将包括人工智能一部和人工智能二部,标志着 vivo 在人工智能技术上的持续投入和战略布局。 此次变动还伴随着高层人事调整,原互联网平台运营领域的总经理张飞被任命为新 AI 领域的总经理,并兼任人工智能一部的负责人,直接向公司副总裁、OS 产品领域负责人周围汇报。
3/5/2025 9:13:00 AM
AI在线
OpenAI宣布成立NextGenAI联盟:5000万美元资助顶尖大学AI研究
OpenAI 近日宣布成立一个名为 NextGenAI 的联盟,并承诺提供5000万美元的资助,以支持15所顶尖大学进行人工智能研究。 这些大学包括哈佛大学、牛津大学和麻省理工学院等知名学府。 此举标志着 OpenAI 在教育领域进一步加大投入,旨在推动人工智能技术的发展与创新。
3/5/2025 9:11:00 AM
AI在线
Warp vs. Ghostty:哪个终端应用更符合你的开发需求?
Warp 拥有许多功能,包括 AI,而 Ghostty 则在开箱即用方面更轻量级。 以下是我们关于哪个终端应用程序最适合您的指南。 译自Warp vs.
3/5/2025 8:58:53 AM
岱军
OpenAI发布NextGenAI,提供5000万美元、与15所名校合作
在教育领域迎来重大变革之际,OpenAI 于今晨正式推出了 NextGenAI,并提供了5000万美元的资金支持以及最新的模型 API。 此次发布标志着 OpenAI 与全球15所顶尖大学组成的 AI 教育联盟的成立,旨在推动人工智能在教育领域的应用和创新,颠覆传统教育模式。 参与该联盟的高校包括加州理工学院、哈佛大学、麻省理工学院等。
3/5/2025 8:57:00 AM
AI在线
Microsoft Dragon Copilot:医疗领域的 AI 革命
在医疗行业,医生和护士们常常被繁重的文书工作压得喘不过气来,这不仅影响了他们的工作效率,还可能影响到患者体验。 现在,Microsoft 推出了一款名为 Dragon Copilot 的 AI 助手,旨在帮助医疗专业人员简化临床工作流程,让他们能够更多地关注患者护理。 下面,就让我们一起来了解一下这款革命性的产品。
3/5/2025 8:56:31 AM
深海幽光
雷军亮相首场代表通道:小米将把最新的AI技术应用到各个终端上
今日早晨,在全国人大十四届三次会议的首场“代表通道”上,全国人大代表、小米创办人兼董事长兼CEO、金山软件董事长雷军接受了记者的提问。 雷军就小米在制造业中的角色、科技创新方向以及全球化战略等方面进行了深入阐述。 雷军强调,制造业是我国的立国之本和强国之基。
3/5/2025 8:55:00 AM
AI在线
消息称 vivo OS 部门新成立 AI 领域,大模型训练重心向端侧转移
vivo 近日进行了组织架构调整:原 OS 产品领域下将设立 AI 领域,人工智能一部、人工智能二部划入 AI 领域。(雷峰网)
3/5/2025 8:50:59 AM
汪淼
GPT-4.5登顶6小时即失守!Grok-3上演1分逆袭
基础模型竞争又紧张刺激起来了! GPT-4.5刚登顶竞技场且全任务分类第一名,6小时后总榜就被马斯克的新版Grok-3反超。 两者都是获得3000 票数,总分1412:1411只差一分。
3/5/2025 8:50:00 AM
量子位
DeepSeek-R1、o1都在及格线挣扎!字节开源全新知识推理测评集,覆盖285个学科
大模型刷榜 MMLU、屠榜 GPQA 的玩法一夜变天? ? ?
3/5/2025 8:40:00 AM
量子位
实测字节免费AI编程,还让不让Cursor活了
国内首个原生AI IDE(集成开发环境),来自字节,实测在此:哪怕一点代码都不懂,只要能说出自己的需求,就能靠AI开发出一个功能完备的应用。 例如如果你想做一个Flappy Bird游戏,那就用中文跟它说一声就行:生成一个网页版 Flappy Bird游戏并运行。 不难看出啊,整个过程真真儿的就是一气呵成。
3/5/2025 8:30:00 AM
量子位
经网络的每一层都是干嘛的?这才是神经网络结构的核心
组成一个神经网络从技术上来说主要有以下几个部分:数据集神经网络结构损失函数优化函数反向传播而不同神经网络模型之间最主要的区别就是神经网络结构的异同,当然最相似的地方也是神经网络结构。 原因就在于神经网络结构是由多个神经网络层所组成的;而使用不同的层就实现了不同功能的神经网络模型。 神经网络的层一个神经网络是由多种神经网络层所组成的,而每个神经网络层实现不同的功能;然后由此组成神经网络模型。
3/5/2025 8:00:00 AM
AI探索时代
全面增强LLM推理/规划/执行力!北航提出全新「内置CoT」思考方法
用户已经习惯于将大模型如ChatGPT、Llama-3-chat等当作聊天对象,然而在用户和聊天助手的会话中,有的用户提示(例如一些命令或请求)不能在一轮会话中结束,需要大语言模型和用户进行多轮会话。 这种跨越多轮的会话目前仍然存在一些问题:大语言模型的回答容易出错,不能帮助用户达到目标,且随着会话轮数增加出错概率会增大。 对同一个命令或问题,大语言模型比较难以根据实际需求产生不同流程的响应,在需要大语言模型与环境交互时,目前比较流行的做法是使用函数调用或工具调用,但不够优雅和高效,而且由于上下文窗口的限制,能支持的工具调用数量有限。
3/5/2025 4:00:00 AM
新智元
如何高效使用DeepSeek-R1:推理大模型调优指南
如何高效使用DeepSeek-R1:推理大模型提示工程调优指南LLM 中 DeepSeek-R1 与传统非推理模型的交互方式存在本质差异。 在数学推导、代码生成等复杂任务中展现出色能力。 但与通用大模型不同,推理型模型需要特殊的交互策略,博文内容列举几个常见的优化手段,帮助开发者构建高效的交互范式。
3/5/2025 3:00:00 AM
山河已无恙
强到离谱!如何用DeepSeek快速搞定3D建模+PPT+短视频?
在设计领域,效率与创意是永恒的追求。 随着 AI 技术的迅猛发展,Deepseek 等 AI 工具为设计师带来了前所未有的创作体验。 今天,就来看看 Deepseek 与其他 AI 产品强强联合,如何打破传统设计的边界,解锁无限可能。
3/5/2025 1:00:35 AM
团队58UXD