AI在线 AI在线

理论

深夜突袭!DeepSeek V3 偷偷更新变强

DeepSeek 刚刚悄然发布了 DeepSeek-V3-0324 模型。 这次更新远超预期,不仅性能大幅提升,而且新增了多项实用功能,让开发者和企业用户都为之惊叹。 回顾之前的 DeepSeek R1 版本,尽管能力出色,但仍存在几个明显短板:缺乏函数调用能力、不支持规范化的 JSON 输出。
3/26/2025 9:12:59 AM
PIG AI

DeepSeek 为什么这么牛?幻方三大核心技术解密!

梁文峰说,我们缺的从来都不是钱,而是高端芯片。 幻方官网显示,2022年,公司员工“一只平凡的小猪”一个人就向捐助了1.38亿。 你说,这是钱的事吗?
3/26/2025 9:00:00 AM
架构师之路

手把手教你实现 Ollama+FastGPT+DeepSeek 打造个人专属 AI 知识库!

本文从零实现,基于Ollama、FastGPT、Deepseek在本地环境中打造属于自己的专业知识库,与大家分享~一、本地部署OllamaOllama是一个开源的本地大语言模型运行框架,专为在本地机器上便捷部署和运行大语言模型(LLM)而设计,无需依赖云端服务。 它提供简单易用的界面和优化的推理引擎,帮助我们轻松加载、管理和运行各种AI模型。 1.
3/26/2025 8:50:00 AM
小喵学AI

新人工智能模型使用百万小时数据分析睡眠

随着生活节奏加快、工作压力增大,越来越多的人受到失眠困扰。 世界卫生组织统计全球有约27%的人口存在睡眠障碍,涉及21.6亿人;而在我国18岁以上人群中有5.1亿人口存在不同程度睡眠障碍,占比高达48.5%。 睡眠科学家长期以来一直试图解开我们夜间睡眠的奥秘,通过筛选脑电波、心跳和呼吸模式来了解我们所经历的各个阶段。
3/26/2025 8:20:00 AM
佚名

更新版DeepSeek-V3官方报告出炉!模型参数685B!数学、代码性能击败GPT-4.5

出品 | 51CTO技术栈(微信号:blog51cto)刚刚,DeepSeek放出了更新模型的官方报告,并发推文:🚀 DeepSeek-V3-0324 现已推出! 🔹推理能力大幅提升🔹更强的前端开发技能🔹更智能的工具使用能力✅对于非复杂推理任务,我们建议使用 V3 — 只需关闭“DeepThink”🔌 API 使用保持不变📜模型现在根据 MIT 许可证发布,就像 DeepSeek-R1 一样! 报告细节已经可以在HF上进行查看:💫模型参数:685B✨更新版V3的几项改进:1.推理能力基准测试表现显著提升: 2.前端 Web 开发- 提高代码的可执行性 - 生成更美观的网页和游戏前端 3.中文写作能力 风格和内容质量提升 - 符合 R1 写作风格 - 中长篇写作质量更优 4.功能增强 - 多轮交互改写能力提升 - 翻译质量和书信写作优化 5.中文搜索能力- 报告分析请求的输出更加详细 6.函数调用改进- 函数调用准确率提升,修复了 V3 版本中的相关问题 在推文下,海外网友纷纷在评论区“催更”DeepSeek-R2!相信不久的将来,DeepSeek就会给我们想要的惊喜吧!
3/26/2025 7:14:33 AM

AI驱动再制造革命:三大场景解锁效率与利润跃升

AI比以往任何时候都更加普及,它在各行业的再制造领域蕴含着巨大的潜力,尚待发掘。 各行业企业正在加速推进再制造,以此缓解供应链短缺、通过产品的实惠价格开拓新客户,并为零部件提供高利润替代品,然而,那些希望建立或优化其再制造业务的企业面临着独特的挑战,如大量SKU的定价以及准确的核心预测——即预测可用于再制造的回收产品(核心)的数量、时间和质量。 这时,AI就派上了用场。
3/26/2025 7:00:00 AM
Inga Maurer

Prompt Engineering 常见陷阱及规避方法

Prompt Engineering(提示工程)(停止过度提示:为什么简短的 AI 提示比长prompt更胜一筹)已成为与 AI 交互的关键技能。 它关乎如何巧妙地构造问题或指令,让 AI 系统准确理解并给出理想回应。 然而,这条探索之路布满了陷阱,稍有不慎就会影响 AI 输出的质量和效果。
3/26/2025 5:00:00 AM
大模型之路

MCP协议让AI不再“与世隔绝”

什么是MCP? MCP(Model Context Protocol,模型上下文协议)是由 Anthropic 公司于 2024 年 11 月 26 日 推出的一项技术协议。 其主要目的是解决 AI 助手与外部数据源隔离的问题,使 AI 能够连接并访问外部资源。
3/26/2025 3:01:00 AM
飘渺Jam

图解「模型上下文协议(MCP)」:从与传统 API 的比较入手

最近,关于模型上下文协议(MCP)的讨论非常热烈。 你一定听说过它。 今天,让我们一起来了解一下模型上下文协议(MCP)。
3/26/2025 3:00:00 AM
追求卓越的

AI玩具迎来爆发式增长,IoT行业如何抓住机遇?

最近这两年,AI技术的迅猛发展,对整个社会产生了深远影响。 各行各业都在经历AI所带来的变革。 很多的产品,正在加速融入AI元素。
3/26/2025 12:25:00 AM
小枣君

关于人工智能技术学习与应用心得

最近一年多来开始转行做人工智能,从刚开始一点都不懂的小白到现在对人工智能有了初步的认识;中间过程可以说是相当不容易。 因此,经过这段时间的应用和学习,也慢慢有了一点心得体会,因此在此记录一下。 人工智能心得体会关于什么是人工智能,什么是机器学习,什么是神经网络,什么是大模型,以及各种模型架构在这里就不说了;在前面的文章中已经不止一次的讲述过以上内容。
3/26/2025 12:00:00 AM
DFires

传神语联发布深度思考大模型-T1:根原创铸基,任度双脑开启AI深度思考新高度

2025年3月24日,传神语联A纪元系列线上发布活动的第一天,传神语联重磅发布任度双脑深度思考大模型-T1(以下简称任度大模型-T1),为大模型领域贡献了又一创新性成果。 那么,你或许会好奇,在大模型层出不穷的今天,传神语联为什么还执着于推出大模型? 底气来自哪里?
3/25/2025 5:59:13 PM

阿里震撼发布,32B的Qwen2.5,开发者福音!实测:AI可以帮抓小偷了!阿里撞车DS再次坐实“AI汪峰”;网友:美国模型完了

编辑 | 伊风阿里今天发了Qwen2.5-VL的32B版本,达到同等规模的SOTA模型,堪称开发者福音! 千问接连两三次的模型发布时间都不太凑巧。 今日与DeepSeek V3的更新撞车,而上次发的QwQ-32B以轻量推理模型击败了DeepSeek R1,但风头完全被Manus抢走了!
3/25/2025 1:31:45 PM
伊风

AMD跑DeepSeek性能超H200!128并发Token间延迟不超50ms,吞吐量达H200五倍

DeepSeek-R1掀起新一轮购卡潮的同时,AMD的含金量也上升了。 在AMD的MI300X上跑FP8满血R1,性能全面超越了英伟达H200——相同延迟下吞吐量最高可达H200的5倍,相同并发下则比H200高出75%。 这个结果,一方面归功于SGLang框架,另一方面则是得益于AMD新优化的AI内核库AITER。
3/25/2025 12:59:01 PM
量子位

阿里深夜开源Qwen2.5-VL新版本,视觉推理通杀,32B比72B更聪明

就在 DeepSeek V3「小版本更新」后的几个小时,阿里通义千问团队也开源了新模型。 择日不如撞日,Qwen2.5-VL-32B-Instruct 就这么来了。 相比此前的 Qwen2.5-VL 系列模型,32B 模型有如下改进:回复更符合人类主观偏好:调整了输出风格,使回答更加详细、格式更规范,并更符合人类偏好。
3/25/2025 12:11:08 PM
机器之心

为矛盾的理论提供统一解释,牛津大学等揭秘非晶硅结构

编辑丨coisini非晶硅(α-Si)是研究最广泛的无序网络固体之一,其结构已经被研究了几十年。 两种主要理论分别基于连续随机网络模型和「类晶体」模型,后者被定义为在保持整体非晶网络的同时,表现出类似于晶体状态的局部结构有序性。 然而,这种局部有序性的程度一直不明确。
3/25/2025 12:02:00 PM
ScienceAI

分子对接速度提升10,000倍,深度图学习加速RNA虚拟筛选,助力药物靶标发现

编辑 | 萝卜皮RNA 是尚未开发的药物靶标的巨大宝库。 基于结构的虚拟筛选 (VS) 利用结合位点信息识别候选分子,传统上采用分子对接模拟。 然而,对接很难在大型化合物库和 RNA 靶标中扩展。
3/25/2025 12:01:00 PM
ScienceAI

DeepSeek-V3在Mac Studio上以每秒20个token的速度运行,这对OpenAI来说是一场噩梦

DeepSeek悄然发布了一款新的大型语言模型,已在AI行业掀起波澜——不仅因为其能力出众,更因其部署方式独特。 这款名为DeepSeek-V3-0324的641GB模型出现在AI仓库Hugging Face上,几乎没有进行任何宣传,延续了该公司一贯低调却影响深远的产品发布风格。 此次发布尤为引人注目的是该模型的MIT许可证——允许其免费用于商业用途——以及早期报告显示,它可以直接在消费级硬件上运行,特别是配置了M3 Ultra芯片的Apple Mac Studio。
3/25/2025 11:42:41 AM
Michael Nuñez