AI在线 AI在线

资讯列表

智源BGE-VL拍照提问即可精准搜,1/70数据击穿多模态检索天花板!

BGE系列模型自发布以来广受社区好评。 近日,智源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩充了原有生态体系。 BGE-VL在图文检索、组合图像检索等主要多模态检索任务中均取得了最佳效果。
3/7/2025 8:40:00 AM
新智元

阿里千问QwQ-32B推理模型开源,比肩671B满血DeepSeek-R1!笔记本就能跑

凌晨,阿里重磅开源全球最顶尖AI模型——通义千问QwQ-32B推理模型。 它仅用320亿参数,便与目前公认的开源最强6710亿参数的满血版DeepSeek-R1(370亿被激活)相媲美。 甚至,QwQ-32B在多项基准测试中全面超越o1-mini。
3/7/2025 8:30:00 AM
新智元

模型训练前置处理之数据预处理

在神经网络技术中,有几个比较重要的环节,其中就有神经网络模型的设计;但在此之前还有一个很重要的功能就是数据集的整理;一个高质量的数据集高性能神经网络模型的基础。 但怎么才能打造一个合格的数据集,以及怎么打造一个合格的数据集? 而这就是神经网络模型的数据处理部分。
3/7/2025 8:00:00 AM
AI探索时代

如何理解模型的蒸馏和量化

在LLM领域内,经常会听到两个名词:蒸馏和量化。 这代表了LLM两种不同的技术,它们之间有什么区别呢? 本次我们就来详细聊一下。
3/7/2025 8:00:00 AM

重磅开源!基于 Spring Boot 的企业级 DeepSeek 知识库与智能对话方案

本项目基于 Spring Boot 3.4 构建,旨在打造一款高效、智能的企业级知识库与智能对话平台,充分集成 DeepSeek 大语言模型,以支持企业级私有化部署和智能客服应用。 项目目标该方案通过整合 DeepSeek 强大的自然语言处理能力,实现高效、精准的对话交互,同时支持企业知识库的管理,助力企业构建智能化的客户支持与内部知识共享体系。 技术架构后端基于 Spring Boot 3.4 开发,提供 RESTful API 以处理业务逻辑,并与 DeepSeek 模型进行高效交互。
3/7/2025 7:57:56 AM
路条编程

唯有惊叹!一手体验首款通用Agent产品Manus

一个新团队突然发了一个首款通用型的项目:Manus。 演示在此,我人直接看麻了。 看完我的第一感觉,人类又要一败涂地了。
3/7/2025 7:43:25 AM
数字生命卡兹克

AI如何彻底改变创新

AI时代已经到来,正在重写创新的规则。 创新一直是人类进步的支柱,它变革产业、革新企业、改善生活。 我们所讨论的不仅仅是渐进式的改进。
3/7/2025 7:00:00 AM
David Henkin

超越算法:为什么数据治理是制药业AI未来的关键

制药行业正站在AI驱动的革命浪尖。 到2030年,AI驱动的药物发现市场规模预计将达到91亿美元,年复合增长率高达29.7%。 AI有望以前所未有的规模加速临床试验、优化供应链并实现患者治疗的个性化。
3/7/2025 7:00:00 AM
Tina Chakrabarty

设计师摸鱼神器!大厂如何用AI做完一年的动态开屏海报?

前言:. 说起节气海报,做运营设计的设计师都不陌生,在 AI 人工智能席卷设计界的今天,以什么形式和方法去打造 58 的节气海报,能让设计节气海报这件事,变得更加高效并且有 AI 能力的加持呢? UXD 从很早就在思考和探索。
3/7/2025 6:43:33 AM
团队58UXD

手把手教学!Deepseek Janus 生图模型安装流程+核心功能解析

一、Janus 模型介绍. Janus 是深度求索(DeepSeek)公司开源的多模态大模型,主打 AI 图像生成与 AI 图像识别,支持文生图、图生文等多模态交互,属于其 AGI 技术布局中的关键产品之一。 (简而言之:一个能画图、能识图、开源可定制的 AI 模型).
3/7/2025 1:56:33 AM
果汁

10个章节帮你快速入门DeepSeek

一、DeepSeek 是什么? DeepSeek 是一款基于人工智能的通用型助手工具,能够通过自然语言交互提供信息检索、数据分析、创意生成等服务。 其核心特点包括:知识广度与深度:覆盖从日常生活到学术研究的多个领域,知识储备相当于大学毕业生水平,部分领域可达研究生水平。
3/7/2025 12:01:26 AM
果汁

揭秘黑客窃取数据的内幕

一旦黑客突破了组织的防御,在网络内部移动和访问信息就相对容易,可能会持续数天甚至数月而未被发现。 这对于存储有宝贵的敏感和个人身份信息的银行和金融服务机构来说,是一个重大隐患。 网络安全的目标是最小化风险和入侵的影响。
3/7/2025 12:00:05 AM

腾讯元宝:语音播报的暂停和续播能力会很快上线

腾讯元宝宣布即将上线语音播报的暂停和续播能力,同时新增分享长图时折叠思考过程功能。#腾讯元宝# #AIGC#
3/6/2025 9:32:27 PM
归泷(实习)

DeepSeek的MLA,任意大模型都能轻松迁移了

复旦 NLP 实验室博士后纪焘是这篇文章的第一作者,研究方向为大模型高效推理、多模态大模型,近期代表工作为首个NoPE外推HeadScale、注意力分块外推LongHeads、多视觉专家大模型MouSi,发表ACL、ICLR、EMNLP等顶会顶刊论文 20 余篇。 DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一。 多头潜在注意力网络(Multi-head Latent Attention, MLA)是其经济推理架构的核心之一,通过对键值缓存进行低秩压缩,显著降低推理成本 [1]。
3/6/2025 9:15:00 PM
机器之心

强化学习成帮凶,对抗攻击LLM有了新方法

事物都有多面性,正如水,既能载舟,亦能覆舟,还能煮粥。 强化学习也是如此。 它既能帮助 AlphaGo 击败顶级围棋棋手,还能帮助 DeepSeek-R1 获得强大的推理能力,但它也可能被恶意使用,成为攻击 AI 模型的得力武器。
3/6/2025 9:11:00 PM
机器之心

从自我进化视角出发,全面解析LLM的推理能力技术演进路径

论文标题:A Survey on LLM Complex Reasoning through the Lens of Self-Evolution论文链接::. 引言在人工智能领域,大型语言模型的复杂推理研究正成为学术界和工业界关注的焦点。 随着 OpenAI 的 O1 以及后续 DeepSeek R1 等突破性成果的发布,这一领域的研究热度持续升温,引发了广泛的学术讨论和实践探索。
3/6/2025 9:08:00 PM
机器之心

当开源创新遇上推理革命:SGLang如何炼就DeepSeek最强开源推理引擎?

2025 年开年,DeepSeek R1 和 V3 重磅发布,其超强的语言建模与推理能力,引爆了全球 AI 社区。 与此同时,一个隐藏在超大规模模型身后的技术命题浮出水面:如何让千亿参数超大规模 AI 模型真正达到商业级推理速度? 这一问题的答案,隐藏在推理引擎 SGLang 的代码仓库中。
3/6/2025 9:04:00 PM
机器之心

Anthropic 首席产品官迈克・克里格:三年内软件工程师将仅负责审查 AI 生成代码

他认为,随着AI在编码领域的应用日益深化,软件开发人员的工作重心将转向AI无法处理的抽象问题,并学会如何高效管理和监督这些智能系统。
3/6/2025 8:53:12 PM
清源