AI在线 AI在线

理论

基于MiniO存储的RAGFlow+Dify图片处理方案

上篇文章中介绍了如何基于 RAGFlow 知识库,通过 Dify 的 HTTP 请求获取映射 Code 节点替换,将占位符解析为最终的 img 标签,来稳定的实现问答中图片正常显示问题。 Dify RAGFLow:基于占位符的图片问答升级方案(最佳实践)其中的"占位符"和"实际图片访问 URL"映射关系的存储使用了阿里云的 OSS 存储服务。 初期选择阿里云 OSS 作为存储,主要是方便大家快速验证和迭代 RAG 应用的核心逻辑,避免过早陷入基础设施的维护细节。
4/25/2025 1:30:00 AM
韦东东

智能体的五大商业用例

AI的下一代已经到来,它具有自主性。 智能体与聊天机器人由相同的AI系统提供支持,但可以独立行动、协作以实现更大的目标,并接管整个业务流程,这项技术相对较新,但所有主要参与者都已经加入。 去年10月,微软宣布包括标准银行、路透社、Virgin Money和苏黎世保险在内的10万家组织正在使用Copilot .
4/25/2025 1:10:00 AM
Maria

DeepSeek在数据领域的30个应用场景

在这个数据AI的时代,DeepSeek作为新一代AI模型正在改变我们处理、分析和理解数据的方式。  本文为您揭秘DeepSeek在数据领域的30个颠覆性应用场景,带大家一窥AI如何重塑数据价值链。 一、数据获取与处理篇1.
4/25/2025 12:50:00 AM
大数据AI智能圈

揭秘大模型的魔法:训练你的tokenizer

大家好,我是写代码的中年人。 在这个人人谈论“Token量”、“百万上下文”、“按Token计费”的AI时代,“Tokenizer(分词器)”这个词频频出现在开发者和研究者的视野中。 它是连接自然语言与神经网络之间的一座桥梁,是大模型运行逻辑中至关重要的一环。
4/25/2025 12:20:00 AM
写代码的中年人

Windsurf全面降价!编程赛道的价格战要来了;被OpenAI收购尚未证实

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)刚刚得到消息,AI编码助手初创公司 Windsurf周一宣布“全面”降价,称随着与竞争对手 Cursor 的竞争加剧,用户可以“大幅节省成本”。 Windsurf 表示,它将放弃其复杂的“流程操作积分”系统,该系统会向开发者收取其 AI 在后台执行的操作的费用。 此外,该公司还将team plans的价格从每位用户每月 35 美元降至 30 美元,同时其企业计划的价格也将“大幅降低”。
4/24/2025 6:40:17 PM
云昭

谷歌“Wi-Fi密码”式的最瘦大模型

Gemma 3 的“低门槛 AI”计划露面了,谷歌这次直接把 Gemma 3 做成了“跑得动的”AI。 —Gemma-3-27b-it-qat-q4_0-gguf 听上去像个 Wi-Fi 密码,其实却是谷歌迄今为止最精简的大模型是的,不再只属于高端服务器和土豪显卡,普通玩家的游戏卡,甚至手机,都能一试身手。 这波操作的核心是三个字:量化训练(Quantization-Aware Training, QAT)。
4/24/2025 2:13:00 PM
文摘菌

大模型向量去重的N种解决方案!

简单来说,“向量”Vector 是大模型(LLM)在搜索时使用的一种“技术手段”,通过向量比对,大模型能找出问题的相关答案,并且进行智能回答。 向量简介Vector 是向量或矢量的意思,向量是数学里的概念,而矢量是物理里的概念,但二者描述的是同一件事。 “定义:向量是用于表示具有大小和方向的量。
4/24/2025 11:09:13 AM
磊哥

刚刚,OpenAI最强图像生成API上线,一张图1毛5!

昨夜,OpenAI发布全新图像生成模型gpt-image-1,API向所有开发者开放。 这一次,他们直接把每张图的成本打到几美分。 图片对于低、中、高质量的方形图像,生成大约花费0.02美元、0.07美元、0.19美元。
4/24/2025 10:31:54 AM

LLM 推理引擎之争:Ollama or vLLM ?

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的模型推理框架。 在人工智能领域,模型的推理能力是衡量其性能的核心指标之一,直接影响其在复杂任务中的表现。 随着自然语言处理(NLP)和大规模语言模型(LLM)技术的迅猛发展,众多创新模型不断涌现,为开发者提供了多样化的选择。
4/24/2025 10:26:40 AM
Luga Lee

SLAM3R:北大陈宝权团队等只用单目长视频就能实时重建高质量的三维稠密点云

北京大学陈宝权团队和香港大学等高校及业界机构联合推出实时三维重建系统 SLAM3R,首次实现从长视频(单目 RGB 序列)中实时且高质量地重建场景的稠密点云。 SLAM3R 使用消费级显卡(如 4090D)即可达到 20 FPS 的性能,重建点云的准确度和完整度达到当前最先进水平,同时兼顾了运行效率和重建质量。 该研究成果被 CVPR 2025 接收为 Highlight 论文,并在第四届中国三维视觉大会(China3DV 2025)上被评选为年度最佳论文,合作者为董思言博士(共同一作)、王书哲博士、尹英达博士、杨言超助理教授和樊庆楠博士,第一作者为北京大学本科生刘宇政。
4/24/2025 9:44:05 AM
机器之心

刚刚,OpenAI图像生成模型API发布,Token计价,一张图花掉1.4元

上个月,OpenAI 在 ChatGPT 中引入了图像生成功能,广受欢迎:仅在第一周,全球就有超过 1.3 亿用户创建了超过 7 亿张图片。 就在刚刚,OpenAI 又宣布了一个好消息:他们正式在 API 中推出驱动 ChatGPT 多模态体验的原生模型 ——gpt-image-1,让开发者和企业能够轻松将高质量、专业级的图像生成功能直接集成到自己的工具和平台中。 这也意味着,从今天开始,全世界的开发人员都可以使用 ChatGPT 强大的图像生成功能了。
4/24/2025 9:38:56 AM
机器之心

扩散模型还原被遮挡物体,几张稀疏照片也能"脑补"完整重建交互式3D场景|CVPR'25

你是否设想过,仅凭几张随手拍摄的照片,就能重建出一个完整、细节丰富且可自由交互的3D场景? 在传统方法中,这几乎是不可能完成的任务,稀少的拍摄视角往往导致模型无法还原被遮挡的区域,生成的场景要么残缺不全,要么细节模糊。 更令人困扰的是,传统的重建算法无法解耦场景中的独立物体,重建结果无法交互,严重限制了在具身智能、元宇宙和影视游戏等领域的应用前景。
4/24/2025 9:38:00 AM

可媲美GPT-4o的开源图像生成框架来了!腾讯联手InstantX解决角色一致性难题

GPT-4o带火的漫画风角色生成,现在有了开源版啦! 腾讯混元携手InstantX团队合作打破次元壁,开源定制化角色生成插件——InstantCharacter。 以往针对角色驱动的图像生成方法,都存在一定的缺陷。
4/24/2025 9:35:00 AM

告别“AI失忆症”!新型SD-LoRA算法实现终身学习|ICLR 2025

彻底摆脱传统方法对旧数据存储的依赖! 哈佛团队联手香港城大、西安交大最新发布的SD-LoRA技术,通过固定已学习任务的方向参数,仅调整幅度权重,完全避免了历史数据的存储需求。 能够在减少50%以上参数存储的同时保持最高准确率,并且在不增加推理开销的前提下显著缓解了灾难性遗忘问题。
4/24/2025 9:30:00 AM
量子位

挤爆字节服务器的Agent到底啥水平?一手实测来了

“字节版Manus”有多能打? 量子位实测在此。 △扣子智能体生成的活动介绍网页我们用光了一天的对话额度,考验了扣子空间(Coze Space)的信息整理、任务执行、工具调用等多项技能。
4/24/2025 9:27:00 AM
量子位

大模型数据味蕾论

AI大模型就像一位厨师,预训练数据就是这位厨师的味蕾。  没有经过训练的味蕾,再好的食材也无法变成美味佳肴。 没有优质的预训练数据,再强大的计算资源也打造不出卓越大模型。
4/24/2025 9:26:13 AM
大数据AI智能圈

ICLR 2025 Oral | 训练LLM,不只是多喂数据,PDS框架给出最优控制理论选择

本文第一作者顾煜贤()为清华大学计算机系四年级直博生,师从黄民烈教授,研究方向为语言模型的高效训练与推理方法。 他曾在 ACL,EMNLP,ICLR 等会议和期刊上发表近 20 篇论文,多次进行口头报告,Google Scholar 引用数 2600 ,曾获 2025 年苹果学者奖学金。 本篇论文为他在微软亚洲研究院实习期间所完成。
4/24/2025 9:25:00 AM
机器之心

特斯拉 Optimus 人形机器人试生产线亮相,马斯克称年底数千台将入驻工厂

4 月 24 日消息,在特斯拉 2025 年第一季度更新报告中,公司首次向外界展示了 Optimus 人形机器人试生产线。 特斯拉表示,Optimus 的生产时间表保持不变,公司正朝着尽快生产出能够完成有用工作的首批人形机器人的目标迈进。 据IT之家了解,特斯拉的 Optimus 试生产线位于弗里蒙特工厂,这里是特斯拉众多项目的起点。
4/24/2025 9:21:15 AM
远洋