开源

RAG（五）BGE-M3，最流行的开源text embedding模型

项目地址： embedding？ Text Embedding 是一种将文本数据映射到高维向量空间的技术，这些向量能够捕捉文本的语义信息。通过将文本嵌入到向量空间中，我们可以利用向量之间的距离或相似性来衡量文本之间的语义相关性。

3/21/2025 7:00:00 AM Glodma

HuggingFace、a16z向白宫谏言，激辩OpenAI：开源才是美国最大的AI竞争优势，垄断不是！

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）近日OpenAI提交有关禁止使用中国模型的提案引起了大家的注意。不过这也只是提议，包括美国在内的很多企业和大佬对此表示并不赞同——在华盛顿的政策环境中，越来越多地呼吁对人工智能进行最低限度的监管，而Hugging Face则向特朗普政府提出了截然不同的观点：开源和协作的人工智能开发可能是美国最强大的竞争优势。目前，Hugging Face已经在自家平台上拥有超过 150 万个公共模型，它已向白宫人工智能行动计划提交了建议，认为开源模型的最新突破表明，它们可以以极低的成本达到甚至超越封闭商业系统的能力。

3/20/2025 1:07:11 PM 言征

快了60倍！一秒生“手办”！腾讯开源的混元3DTurbo系列，5G显存搞定！模型加速的“万能”大招——Flash VDM！

出品 | 51CTO技术栈（微信号：blog51cto）腾讯开源日第二天！在Hunyuan3D-2.0基础上打造的5款模型终于全部现身！昨天介绍了，多视图版本模型Hunyuan3D-2-mv，以及轻量级 mini 模型Hunyuan3D-2-mini。

3/19/2025 2:24:32 PM

全球首个工业界多模态推理模型开源！38B硬刚DeepSeek-R1，训练秘籍全公开

刚刚，昆仑万维正式开源了全球首个工业界多模态推理模型Skywork R1V（以下简称「R1V」）！ R1V高效地将DeepSeek-R1这种强大的文本推理能力无缝scaling到了视觉模态，实现了多模态领域的领先表现，并以开源方式推动了技术进步。由此，多模态推理的新时代即将开启。

3/19/2025 9:20:00 AM 新智元

AI 狂飙倒计时！李开复预言：2025年，开源大模型将掀起商业巨浪！

AI的战鼓已经擂响，冲锋号即将吹响!科技圈大佬李开复近日发出重磅预言:2025年，绝非平平无奇，而是AI应用迎来井喷式爆发的元年，更是大模型商业化战场上的“生死大考”!机遇与挑战并存，一场关乎AI未来格局的变革风暴，正在酝酿之中。李开复的这番豪言壮语，并非空穴来风，而是基于他对行业趋势的深刻洞察。他以DeepSeek的横空出世为例，激动地表示，这不仅仅是中国AI力量的一次惊艳亮相，更在全球范围内奏响了开源的最强音!DeepSeek的出现，仿佛一盏指路明灯，让人们清晰地看到，开源，必将成为大模型领域的终极答案!图源备注：图片由AI生成，图片授权服务商Midjourney未来的AI世界，将不再是技术参数的冰冷比拼，而是谁能更好地拥抱开源，将开源模型转化为驱动商业增长的引擎。

3/18/2025 3:35:00 PM AI在线

Manus带火的MCP，让Claude一句话自动化3D建模，网友：真·AI+应用

一句话提示，Claude自动化打开Blender将2D图片转为3D建模。整个过程行云流水。而且还能只用一次提示词，再基于这个场景搭建可以互动的网页。

3/17/2025 8:55:00 AM 量子位

港大90后开源，OpenAI 2万刀博士级AI智能体平替！自主研究媲美顶会论文

在AI技术迭代的坐标系中，OpenAI构建的五级演进模型（对话系统→组织协调者）为行业发展提供了战略指引。其中，处于第三至四阶段的自主研究智能体（Autonomous Research Agent）正成为技术突破的焦点。就在最近，来自香港大学HKUDS的3位研究团者开源了一种全新的AI-Researcher系统，正是这一关键领域的重要探索。

3/17/2025 8:40:00 AM 新智元

11B模型拿下开源视频生成新SOTA！仅用224张GPU训练，训练成本省10倍

224张GPU，训出开源视频生成新SOTA！ Open-Sora 2.0正式发布。 11B参数规模，性能可直追HunyuanVideo和Step-Video（30B）。

3/13/2025 12:39:22 PM 量子位

DeepSeek 开源 EPLB，世界上从来没有什么腾空出世！

deepseek开源DualPipe的同一天，还开源了EPLB。今天来简单聊聊EPLB，包懂。 EPLB是干嘛的？

3/13/2025 10:31:20 AM 架构师之路

Open-Sora 2.0全面开源，20万复刻百万级大片！11B媲美闭源巨头，224张GPU创奇迹

今天，视频生成领域迎来开源革命！ Open-Sora 2.0——全新开源的SOTA（State-of-the-Art）视频生成模型正式发布，仅用20万美元（224张GPU）成功训练出商业级11B参数视频生成大模型，性能直追HunyuanVideo和30B参数的Step-Video。权威评测VBench及用户偏好测试均证实其卓越表现，在多项关键指标上媲美动辄数百万美元训练成本的闭源模型。

3/13/2025 10:26:45 AM 新智元

百万美金炼出「调参秘籍」！阶跃星辰开源LLM最优超参工具

近日，阶跃星辰研究团队通过大规模实证探索，耗费了近 100 万 NVIDIA H800 GPU 小时（约百万美元），从头训练了 3,700 个不同规模，共计训了 100 万亿个 token，揭示了 LLM 超参数优化的全新的普适性缩放规律，为更好地提升 LLM 性能，提供了开箱即用的工具。该研究也是第一个全面研究模型最优超参随着 Model Shape、Dense/MoE、预训练数据分布的变化，是否稳定不变的工作。研究中凸显出 Step Law 的鲁棒性，大大增加了该工具的实用性和普适性。

3/13/2025 9:20:20 AM 机器之心

Manus逼OpenAI开源智能体框架，网友：已从行业领导者变为跟随者

OpenAI又开源了，这次是一套智能体开发框架。联网搜索、文件搜索、计算机使用（Computer Use），统统打包，GitHub 8小时上千星。图片奥特曼认为其中的API是有史以来（并没有限定在OpenAI范围内）设计最完善、最实用的之一。

3/12/2025 11:34:35 AM

DeepSeek 开源的 DualPipe，居然是梁文峰写的，你感性？

继DeepGEMM之后，deepseek开源了第四弹DualPipe。今天来简单聊聊DualPipe，包懂。 DualPipe是干嘛的？

3/12/2025 10:36:32 AM 架构师之路

微软开源多模态AI基础模型！无需额外微调轻松拿捏网页、机器人

微软研究院官宣开源多模态AI——Magma模型。首个能在所处环境中理解多模态输入并将其与实际情况相联系的基础模型。该模型近期已被计算机视觉顶会CVPR接收，只要给定一个目标描述，Magma就能制定计划、执行行动，无论是在数字界面中还是物理世界里，都能展现出灵活而高效的交互能力。

3/11/2025 9:35:00 AM 量子位

Manus被破解了？曝出系统提示词和背后大模型，CTO也回复了

最近几天，一个叫「Manus」的通用 AI Agent 产品刷屏网络。它能完成复杂的文件处理、数据分析、代码编写等多种任务。刚上线不久，大家纷纷在线求购邀请码，都想亲自上手一试这个突然火起来的智能体。

3/11/2025 8:42:04 AM 机器之心

「古董」GPU也能跑DeepSeek同款GRPO！显存只需1/10，上下文爆涨10倍

开源微调神器Unsloth带着黑科技又来了：上次更新把GRPO需要的内存见到了7GB，这次只需要5GB的VRAM，就能训练自己的推理模型Qwen2.5（1.5B），比上次要少2GB。这次彻底把推理模型训练显存打下来了！这次把GRPO训练推理模型的上下文变长10倍，同时需要的显存少了90%。

3/10/2025 1:11:26 PM 新智元

Ollama的配置修改与接口调用

一、修改环境变量1.1 配置远程访问在我们本地部署好ollama之后，仅支持本机访问，我们可以通过修改环境变量让其他人可以远程访问。在wins电脑上增加环境变量：复制1.2 配置本地模型路径1.2.1 本地模型默认路径wins本地模型默认路径：C:\Users\%username%\.ollama\models。这里 %username% 是当前登录的用户名。

3/10/2025 9:00:00 AM Python伊甸园

Ollama的介绍与测试

一、Ollama介绍Ollama是一个开源工具，专为在本地机器上便捷部署和运行大型语言模型（LLM）而设计。它提供了一个简洁高效的界面，让用户能够轻松地创建、执行和管理这些复杂的模型。此外，Ollama还配备了一个丰富的预构建模型库，使得这些模型能够无缝集成到各种应用程序之中，大大提升了开发效率和用户体验。

3/10/2025 8:30:00 AM Python伊甸园

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型 AI新词机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 英伟达马斯克 Anthropic 图像 AI创作训练 LLM 论文代码 AI for Science 苹果算法腾讯 Agent Claude 芯片 Stable Diffusion 具身智能 xAI 蛋白质开发者人形机器人生成式神经网络机器学习 AI视频 3D RAG 大语言模型字节跳动 Sora 百度研究 GPU 生成工具华为 AGI 计算大型语言模型 AI设计生成式AI 搜索视频生成亚马逊 AI模型 DeepMind 特斯拉场景深度学习 Transformer 架构 Copilot MCP 编程视觉