开源
RAG(五)BGE-M3,最流行的开源text embedding模型
项目地址: embedding? Text Embedding 是一种将文本数据映射到高维向量空间的技术,这些向量能够捕捉文本的语义信息。 通过将文本嵌入到向量空间中,我们可以利用向量之间的距离或相似性来衡量文本之间的语义相关性。
HuggingFace、a16z向白宫谏言,激辩OpenAI:开源才是美国最大的AI竞争优势,垄断不是!
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)近日OpenAI提交有关禁止使用中国模型的提案引起了大家的注意。 不过这也只是提议,包括美国在内的很多企业和大佬对此表示并不赞同——在华盛顿的政策环境中,越来越多地呼吁对人工智能进行最低限度的监管,而Hugging Face则向特朗普政府提出了截然不同的观点:开源和协作的人工智能开发可能是美国最强大的竞争优势。 目前,Hugging Face已经在自家平台上拥有超过 150 万个公共模型,它已向白宫人工智能行动计划提交了建议,认为开源模型的最新突破表明,它们可以以极低的成本达到甚至超越封闭商业系统的能力。
快了60倍!一秒生“手办”!腾讯开源的混元3DTurbo系列,5G显存搞定!模型加速的“万能”大招——Flash VDM!
出品 | 51CTO技术栈(微信号:blog51cto)腾讯开源日第二天! 在Hunyuan3D-2.0基础上打造的5款模型终于全部现身! 昨天介绍了,多视图版本模型Hunyuan3D-2-mv,以及轻量级 mini 模型Hunyuan3D-2-mini。
全球首个工业界多模态推理模型开源!38B硬刚DeepSeek-R1,训练秘籍全公开
刚刚,昆仑万维正式开源了全球首个工业界多模态推理模型Skywork R1V(以下简称「R1V」)! R1V高效地将DeepSeek-R1这种强大的文本推理能力无缝scaling到了视觉模态,实现了多模态领域的领先表现,并以开源方式推动了技术进步。 由此,多模态推理的新时代即将开启。
AI 狂飙倒计时!李开复预言:2025年,开源大模型将掀起商业巨浪!
AI的战鼓已经擂响,冲锋号即将吹响!科技圈大佬李开复近日发出重磅预言:2025年,绝非平平无奇,而是AI应用迎来井喷式爆发的元年,更是大模型商业化战场上的“生死大考”!机遇与挑战并存,一场关乎AI未来格局的变革风暴,正在酝酿之中。 李开复的这番豪言壮语,并非空穴来风,而是基于他对行业趋势的深刻洞察。 他以DeepSeek的横空出世为例,激动地表示,这不仅仅是中国AI力量的一次惊艳亮相,更在全球范围内奏响了开源的最强音!DeepSeek的出现,仿佛一盏指路明灯,让人们清晰地看到,开源,必将成为大模型领域的终极答案!图源备注:图片由AI生成,图片授权服务商Midjourney未来的AI世界,将不再是技术参数的冰冷比拼,而是谁能更好地拥抱开源,将开源模型转化为驱动商业增长的引擎。
Manus带火的MCP,让Claude一句话自动化3D建模,网友:真·AI+应用
一句话提示,Claude自动化打开Blender将2D图片转为3D建模。 整个过程行云流水。 而且还能只用一次提示词,再基于这个场景搭建可以互动的网页。
港大90后开源,OpenAI 2万刀博士级AI智能体平替!自主研究媲美顶会论文
在AI技术迭代的坐标系中,OpenAI构建的五级演进模型(对话系统→组织协调者)为行业发展提供了战略指引。 其中,处于第三至四阶段的自主研究智能体(Autonomous Research Agent)正成为技术突破的焦点。 就在最近,来自香港大学HKUDS的3位研究团者开源了一种全新的AI-Researcher系统,正是这一关键领域的重要探索。
11B模型拿下开源视频生成新SOTA!仅用224张GPU训练,训练成本省10倍
224张GPU,训出开源视频生成新SOTA! Open-Sora 2.0正式发布。 11B参数规模,性能可直追HunyuanVideo和Step-Video(30B)。
DeepSeek 开源 EPLB,世界上从来没有什么腾空出世!
deepseek开源DualPipe的同一天,还开源了EPLB。 今天来简单聊聊EPLB,包懂。 EPLB是干嘛的?
Open-Sora 2.0全面开源,20万复刻百万级大片!11B媲美闭源巨头,224张GPU创奇迹
今天,视频生成领域迎来开源革命! Open-Sora 2.0——全新开源的SOTA(State-of-the-Art)视频生成模型正式发布,仅用20万美元(224张GPU)成功训练出商业级11B参数视频生成大模型,性能直追HunyuanVideo和30B参数的Step-Video。 权威评测VBench及用户偏好测试均证实其卓越表现,在多项关键指标上媲美动辄数百万美元训练成本的闭源模型。
百万美金炼出「调参秘籍」!阶跃星辰开源LLM最优超参工具
近日,阶跃星辰研究团队通过大规模实证探索,耗费了近 100 万 NVIDIA H800 GPU 小时(约百万美元),从头训练了 3,700 个不同规模,共计训了 100 万亿个 token,揭示了 LLM 超参数优化的全新的普适性缩放规律,为更好地提升 LLM 性能,提供了开箱即用的工具。 该研究也是第一个全面研究模型最优超参随着 Model Shape、Dense/MoE、预训练数据分布的变化,是否稳定不变的工作。 研究中凸显出 Step Law 的鲁棒性,大大增加了该工具的实用性和普适性。
Manus逼OpenAI开源智能体框架,网友:已从行业领导者变为跟随者
OpenAI又开源了,这次是一套智能体开发框架。 联网搜索、文件搜索、计算机使用(Computer Use),统统打包,GitHub 8小时上千星。 图片奥特曼认为其中的API是有史以来(并没有限定在OpenAI范围内)设计最完善、最实用的之一。
DeepSeek 开源的 DualPipe,居然是梁文峰写的,你感性?
继DeepGEMM之后,deepseek开源了第四弹DualPipe。 今天来简单聊聊DualPipe,包懂。 DualPipe是干嘛的?
微软开源多模态AI基础模型!无需额外微调轻松拿捏网页、机器人
微软研究院官宣开源多模态AI——Magma模型。 首个能在所处环境中理解多模态输入并将其与实际情况相联系的基础模型。 该模型近期已被计算机视觉顶会CVPR接收,只要给定一个目标描述,Magma就能制定计划、执行行动,无论是在数字界面中还是物理世界里,都能展现出灵活而高效的交互能力。
Manus被破解了?曝出系统提示词和背后大模型,CTO也回复了
最近几天,一个叫「Manus」的通用 AI Agent 产品刷屏网络。 它能完成复杂的文件处理、数据分析、代码编写等多种任务。 刚上线不久,大家纷纷在线求购邀请码,都想亲自上手一试这个突然火起来的智能体。
「古董」GPU也能跑DeepSeek同款GRPO!显存只需1/10,上下文爆涨10倍
开源微调神器Unsloth带着黑科技又来了:上次更新把GRPO需要的内存见到了7GB,这次只需要5GB的VRAM,就能训练自己的推理模型Qwen2.5(1.5B),比上次要少2GB。 这次彻底把推理模型训练显存打下来了! 这次把GRPO训练推理模型的上下文变长10倍,同时需要的显存少了90%。
Ollama的配置修改与接口调用
一、修改环境变量1.1 配置远程访问在我们本地部署好ollama之后,仅支持本机访问,我们可以通过修改环境变量让其他人可以远程访问。 在wins电脑上增加环境变量:复制1.2 配置本地模型路径1.2.1 本地模型默认路径wins本地模型默认路径:C:\Users\%username%\.ollama\models。 这里 %username% 是当前登录的用户名。
Ollama的介绍与测试
一、Ollama介绍Ollama是一个开源工具,专为在本地机器上便捷部署和运行大型语言模型(LLM)而设计。 它提供了一个简洁高效的界面,让用户能够轻松地创建、执行和管理这些复杂的模型。 此外,Ollama还配备了一个丰富的预构建模型库,使得这些模型能够无缝集成到各种应用程序之中,大大提升了开发效率和用户体验。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
大型语言模型
AI设计
生成式AI
搜索
视频生成
亚马逊
AI模型
DeepMind
特斯拉
场景
深度学习
Transformer
架构
Copilot
MCP
编程
视觉