AI在线 AI在线

理论

小时级部署交付,分钟级AI应用构建,这款火山引擎AI一体机如何做到的?

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)当前,DeepSeek的推出为企业智能化转型带来新的想象空间。 然而,想要短期内快速用好DeepSeek来服务企业自身的业务场景,绝非易事。 最为明显的一个现象是:没有进行整体的应用规划而直接本地部署DeepSeek,一旦接入实际的业务场景和数据,往往会导致效果不达预期,甚至适得其反。
3/7/2025 11:47:56 AM
云昭

如何在本地部署 DeepSeek 并提供接口用于开发AI对话应用?

最近,DeepSeek 异常火爆,堪称国产 AI 之光,并且它还是免费开源的。 只需打开 DeepSeek 对话界面,就能免费与其对话,让它解决你的问题,关键是它的回答质量非常高。 当然,本篇文章并不是介绍如何使用 DeepSeek 进行对话的,因为这太简单了,连我 5 岁的儿子都会用。
3/7/2025 10:36:21 AM
东方小月

感知物理世界:具身智能正在改写AI进化

当AI突破虚拟边界获得物理世界的"身体",一场颠覆性变革正在发生。 这两年,具身智能作为人工智能(AI)领域的一股新兴力量,正加速重构科技竞争格局。 今年的政府工作报告明确指出,要"培育壮大新兴产业、未来产业",其中强调将具身智能纳入到未来产业培育体系。
3/7/2025 10:24:43 AM
Yu

沉寂很久的Mistral AI推出号称世界最强OCR

欧洲AI明星公司Mistral AI 今日发布 Mistral OCR,一款号称“世界最佳文档理解 API”的全新产品。 Mistral OCR 是一款光学字符识别(OCR)API,但它远不止于简单的文字识别。 与其他模型不同,Mistral OCR 能够全面理解文档的每一个元素,包括媒体、文本、表格、公式等,并展现出前所未有的准确性和认知能力。
3/7/2025 10:23:03 AM
AI寒武纪

不写一行代码!使用Trae十分钟开发一个AI对话页面

近日,中国首个AI原生集成开发环境(AI IDE)Trae 国内版正式上线,作为一个爱凑热闹的程序员肯定是要去尝尝咸淡的(主要是它不收我钱)。 于是我就有一个想法,看它能不能让我不写一行代码快速帮我开发一个网页。 既然你是AIIDE,那你就帮我做一个AI对话页面吧。
3/7/2025 10:18:27 AM
东方小月

另一个来自中国本土"DeepSeek"时刻?全球首个通用人工智能代理发布

I 圈又炸了锅! 另一个来自中国本土"DeepSeek"时刻今天,Manus AI 悄悄憋了一年的大招终于揭开了神秘面纱——通用AI Agent「Manus」正式发布早期预览版!  这可不是市面上那些只能跟你聊天的“智能聊天机器人”的升级版,而是一个 真正意义上的自主智能体,它最大的亮点在于:打通了从想法到执行的完整链路!
3/7/2025 10:12:16 AM
AI寒武纪

FP8 训练新范式:减少 40% 显存占用,训练速度提高 1.4 倍

近期DeepSeek V3 引爆国内外的社交媒体,他们在训练中成功应用了 FP8 精度,显著降低了 GPU 内存使用和计算开销。 这表明,FP8 量化技术在优化大型模型训练方面正发挥着越来越重要的作用。 近期,来自伯克利,英伟达,MIT 和清华的研究者们提出了显存高效的 FP8 训练方法:COAT(Compressing Optimizer states and Activation for Memory-Efficient FP8 Training),致力于通过 FP8 量化来压缩优化器状态和激活值,从而提高内存利用率和训练速度。
3/7/2025 10:02:10 AM
机器之心

爆火的 Manus,到底啥来头?对 AI 影响有多大?

AI 圈最近又出了个超级大新闻! 有一款叫 Manus 的产品,就像一颗炸弹,瞬间在全球引发了关注热潮。 今天咱就来唠唠,这 Manus 到底是何方神圣,又会给 AI 领域带来哪些变化。
3/7/2025 9:59:44 AM
章为忠

诸葛亮 + 水浒传 - 三国演义 = ?一文搞懂什么是向量嵌入

一起来开个脑洞,如果诸葛亮穿越到《水浒传》的世界,他会成为谁? 武松、宋江、还是吴用? 这看似是一道文学题,但我们可以用数学方法来求解:诸葛亮 水浒传 - 三国演义 = ?
3/7/2025 9:00:00 AM
小喵学AI

风格迁移重大突破!西湖大学等提出StyleStudio攻克「过拟合」难题 | CVPR 2025

近年来,随着扩散模型的发展,风格迁移技术在文本引导的图像生成任务中取得了显著突破。 然而,尽管现有方法可以实现优秀的风格化效果,但其对文本信息的精准控制仍存在明显不足,大多数方法在融合风格图像与文本描述时,往往会让生成结果过度依赖参考风格图像,导致对文本内容的响应能力下降。 「风格主导的失衡问题」使得用户在输入文本提示时难以精准控制图像的颜色、结构或其他细节属性,还可能引入不稳定因素,例如棋盘格效应,进一步限制了其实用性。
3/7/2025 8:50:00 AM
新智元

智源BGE-VL拍照提问即可精准搜,1/70数据击穿多模态检索天花板!

BGE系列模型自发布以来广受社区好评。 近日,智源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩充了原有生态体系。 BGE-VL在图文检索、组合图像检索等主要多模态检索任务中均取得了最佳效果。
3/7/2025 8:40:00 AM
新智元

阿里千问QwQ-32B推理模型开源,比肩671B满血DeepSeek-R1!笔记本就能跑

凌晨,阿里重磅开源全球最顶尖AI模型——通义千问QwQ-32B推理模型。 它仅用320亿参数,便与目前公认的开源最强6710亿参数的满血版DeepSeek-R1(370亿被激活)相媲美。 甚至,QwQ-32B在多项基准测试中全面超越o1-mini。
3/7/2025 8:30:00 AM
新智元

模型训练前置处理之数据预处理

在神经网络技术中,有几个比较重要的环节,其中就有神经网络模型的设计;但在此之前还有一个很重要的功能就是数据集的整理;一个高质量的数据集高性能神经网络模型的基础。 但怎么才能打造一个合格的数据集,以及怎么打造一个合格的数据集? 而这就是神经网络模型的数据处理部分。
3/7/2025 8:00:00 AM
AI探索时代

如何理解模型的蒸馏和量化

在LLM领域内,经常会听到两个名词:蒸馏和量化。 这代表了LLM两种不同的技术,它们之间有什么区别呢? 本次我们就来详细聊一下。
3/7/2025 8:00:00 AM

重磅开源!基于 Spring Boot 的企业级 DeepSeek 知识库与智能对话方案

本项目基于 Spring Boot 3.4 构建,旨在打造一款高效、智能的企业级知识库与智能对话平台,充分集成 DeepSeek 大语言模型,以支持企业级私有化部署和智能客服应用。 项目目标该方案通过整合 DeepSeek 强大的自然语言处理能力,实现高效、精准的对话交互,同时支持企业知识库的管理,助力企业构建智能化的客户支持与内部知识共享体系。 技术架构后端基于 Spring Boot 3.4 开发,提供 RESTful API 以处理业务逻辑,并与 DeepSeek 模型进行高效交互。
3/7/2025 7:57:56 AM
路条编程

AI如何彻底改变创新

AI时代已经到来,正在重写创新的规则。 创新一直是人类进步的支柱,它变革产业、革新企业、改善生活。 我们所讨论的不仅仅是渐进式的改进。
3/7/2025 7:00:00 AM
David Henkin

超越算法:为什么数据治理是制药业AI未来的关键

制药行业正站在AI驱动的革命浪尖。 到2030年,AI驱动的药物发现市场规模预计将达到91亿美元,年复合增长率高达29.7%。 AI有望以前所未有的规模加速临床试验、优化供应链并实现患者治疗的个性化。
3/7/2025 7:00:00 AM
Tina Chakrabarty

揭秘黑客窃取数据的内幕

一旦黑客突破了组织的防御,在网络内部移动和访问信息就相对容易,可能会持续数天甚至数月而未被发现。 这对于存储有宝贵的敏感和个人身份信息的银行和金融服务机构来说,是一个重大隐患。 网络安全的目标是最小化风险和入侵的影响。
3/7/2025 12:00:05 AM