理论
深夜突袭!DeepSeek V3 偷偷更新变强
DeepSeek 刚刚悄然发布了 DeepSeek-V3-0324 模型。 这次更新远超预期,不仅性能大幅提升,而且新增了多项实用功能,让开发者和企业用户都为之惊叹。 回顾之前的 DeepSeek R1 版本,尽管能力出色,但仍存在几个明显短板:缺乏函数调用能力、不支持规范化的 JSON 输出。
3/26/2025 9:12:59 AM
PIG AI
DeepSeek 为什么这么牛?幻方三大核心技术解密!
梁文峰说,我们缺的从来都不是钱,而是高端芯片。 幻方官网显示,2022年,公司员工“一只平凡的小猪”一个人就向捐助了1.38亿。 你说,这是钱的事吗?
3/26/2025 9:00:00 AM
架构师之路
手把手教你实现 Ollama+FastGPT+DeepSeek 打造个人专属 AI 知识库!
本文从零实现,基于Ollama、FastGPT、Deepseek在本地环境中打造属于自己的专业知识库,与大家分享~一、本地部署OllamaOllama是一个开源的本地大语言模型运行框架,专为在本地机器上便捷部署和运行大语言模型(LLM)而设计,无需依赖云端服务。 它提供简单易用的界面和优化的推理引擎,帮助我们轻松加载、管理和运行各种AI模型。 1.
3/26/2025 8:50:00 AM
小喵学AI
新人工智能模型使用百万小时数据分析睡眠
随着生活节奏加快、工作压力增大,越来越多的人受到失眠困扰。 世界卫生组织统计全球有约27%的人口存在睡眠障碍,涉及21.6亿人;而在我国18岁以上人群中有5.1亿人口存在不同程度睡眠障碍,占比高达48.5%。 睡眠科学家长期以来一直试图解开我们夜间睡眠的奥秘,通过筛选脑电波、心跳和呼吸模式来了解我们所经历的各个阶段。
3/26/2025 8:20:00 AM
佚名
更新版DeepSeek-V3官方报告出炉!模型参数685B!数学、代码性能击败GPT-4.5
出品 | 51CTO技术栈(微信号:blog51cto)刚刚,DeepSeek放出了更新模型的官方报告,并发推文:🚀 DeepSeek-V3-0324 现已推出! 🔹推理能力大幅提升🔹更强的前端开发技能🔹更智能的工具使用能力✅对于非复杂推理任务,我们建议使用 V3 — 只需关闭“DeepThink”🔌 API 使用保持不变📜模型现在根据 MIT 许可证发布,就像 DeepSeek-R1 一样! 报告细节已经可以在HF上进行查看:💫模型参数:685B✨更新版V3的几项改进:1.推理能力基准测试表现显著提升: 2.前端 Web 开发- 提高代码的可执行性 - 生成更美观的网页和游戏前端 3.中文写作能力 风格和内容质量提升 - 符合 R1 写作风格 - 中长篇写作质量更优 4.功能增强 - 多轮交互改写能力提升 - 翻译质量和书信写作优化 5.中文搜索能力- 报告分析请求的输出更加详细 6.函数调用改进- 函数调用准确率提升,修复了 V3 版本中的相关问题 在推文下,海外网友纷纷在评论区“催更”DeepSeek-R2!相信不久的将来,DeepSeek就会给我们想要的惊喜吧!
3/26/2025 7:14:33 AM
AI驱动再制造革命:三大场景解锁效率与利润跃升
AI比以往任何时候都更加普及,它在各行业的再制造领域蕴含着巨大的潜力,尚待发掘。 各行业企业正在加速推进再制造,以此缓解供应链短缺、通过产品的实惠价格开拓新客户,并为零部件提供高利润替代品,然而,那些希望建立或优化其再制造业务的企业面临着独特的挑战,如大量SKU的定价以及准确的核心预测——即预测可用于再制造的回收产品(核心)的数量、时间和质量。 这时,AI就派上了用场。
3/26/2025 7:00:00 AM
Inga Maurer
Prompt Engineering 常见陷阱及规避方法
Prompt Engineering(提示工程)(停止过度提示:为什么简短的 AI 提示比长prompt更胜一筹)已成为与 AI 交互的关键技能。 它关乎如何巧妙地构造问题或指令,让 AI 系统准确理解并给出理想回应。 然而,这条探索之路布满了陷阱,稍有不慎就会影响 AI 输出的质量和效果。
3/26/2025 5:00:00 AM
大模型之路
MCP协议让AI不再“与世隔绝”
什么是MCP? MCP(Model Context Protocol,模型上下文协议)是由 Anthropic 公司于 2024 年 11 月 26 日 推出的一项技术协议。 其主要目的是解决 AI 助手与外部数据源隔离的问题,使 AI 能够连接并访问外部资源。
3/26/2025 3:01:00 AM
飘渺Jam
图解「模型上下文协议(MCP)」:从与传统 API 的比较入手
最近,关于模型上下文协议(MCP)的讨论非常热烈。 你一定听说过它。 今天,让我们一起来了解一下模型上下文协议(MCP)。
3/26/2025 3:00:00 AM
追求卓越的
AI玩具迎来爆发式增长,IoT行业如何抓住机遇?
最近这两年,AI技术的迅猛发展,对整个社会产生了深远影响。 各行各业都在经历AI所带来的变革。 很多的产品,正在加速融入AI元素。
3/26/2025 12:25:00 AM
小枣君
关于人工智能技术学习与应用心得
最近一年多来开始转行做人工智能,从刚开始一点都不懂的小白到现在对人工智能有了初步的认识;中间过程可以说是相当不容易。 因此,经过这段时间的应用和学习,也慢慢有了一点心得体会,因此在此记录一下。 人工智能心得体会关于什么是人工智能,什么是机器学习,什么是神经网络,什么是大模型,以及各种模型架构在这里就不说了;在前面的文章中已经不止一次的讲述过以上内容。
3/26/2025 12:00:00 AM
DFires
传神语联发布深度思考大模型-T1:根原创铸基,任度双脑开启AI深度思考新高度
2025年3月24日,传神语联A纪元系列线上发布活动的第一天,传神语联重磅发布任度双脑深度思考大模型-T1(以下简称任度大模型-T1),为大模型领域贡献了又一创新性成果。 那么,你或许会好奇,在大模型层出不穷的今天,传神语联为什么还执着于推出大模型? 底气来自哪里?
3/25/2025 5:59:13 PM
阿里震撼发布,32B的Qwen2.5,开发者福音!实测:AI可以帮抓小偷了!阿里撞车DS再次坐实“AI汪峰”;网友:美国模型完了
编辑 | 伊风阿里今天发了Qwen2.5-VL的32B版本,达到同等规模的SOTA模型,堪称开发者福音! 千问接连两三次的模型发布时间都不太凑巧。 今日与DeepSeek V3的更新撞车,而上次发的QwQ-32B以轻量推理模型击败了DeepSeek R1,但风头完全被Manus抢走了!
3/25/2025 1:31:45 PM
伊风
AMD跑DeepSeek性能超H200!128并发Token间延迟不超50ms,吞吐量达H200五倍
DeepSeek-R1掀起新一轮购卡潮的同时,AMD的含金量也上升了。 在AMD的MI300X上跑FP8满血R1,性能全面超越了英伟达H200——相同延迟下吞吐量最高可达H200的5倍,相同并发下则比H200高出75%。 这个结果,一方面归功于SGLang框架,另一方面则是得益于AMD新优化的AI内核库AITER。
3/25/2025 12:59:01 PM
量子位
阿里深夜开源Qwen2.5-VL新版本,视觉推理通杀,32B比72B更聪明
就在 DeepSeek V3「小版本更新」后的几个小时,阿里通义千问团队也开源了新模型。 择日不如撞日,Qwen2.5-VL-32B-Instruct 就这么来了。 相比此前的 Qwen2.5-VL 系列模型,32B 模型有如下改进:回复更符合人类主观偏好:调整了输出风格,使回答更加详细、格式更规范,并更符合人类偏好。
3/25/2025 12:11:08 PM
机器之心
为矛盾的理论提供统一解释,牛津大学等揭秘非晶硅结构
编辑丨coisini非晶硅(α-Si)是研究最广泛的无序网络固体之一,其结构已经被研究了几十年。 两种主要理论分别基于连续随机网络模型和「类晶体」模型,后者被定义为在保持整体非晶网络的同时,表现出类似于晶体状态的局部结构有序性。 然而,这种局部有序性的程度一直不明确。
3/25/2025 12:02:00 PM
ScienceAI
分子对接速度提升10,000倍,深度图学习加速RNA虚拟筛选,助力药物靶标发现
编辑 | 萝卜皮RNA 是尚未开发的药物靶标的巨大宝库。 基于结构的虚拟筛选 (VS) 利用结合位点信息识别候选分子,传统上采用分子对接模拟。 然而,对接很难在大型化合物库和 RNA 靶标中扩展。
3/25/2025 12:01:00 PM
ScienceAI
DeepSeek-V3在Mac Studio上以每秒20个token的速度运行,这对OpenAI来说是一场噩梦
DeepSeek悄然发布了一款新的大型语言模型,已在AI行业掀起波澜——不仅因为其能力出众,更因其部署方式独特。 这款名为DeepSeek-V3-0324的641GB模型出现在AI仓库Hugging Face上,几乎没有进行任何宣传,延续了该公司一贯低调却影响深远的产品发布风格。 此次发布尤为引人注目的是该模型的MIT许可证——允许其免费用于商业用途——以及早期报告显示,它可以直接在消费级硬件上运行,特别是配置了M3 Ultra芯片的Apple Mac Studio。
3/25/2025 11:42:41 AM
Michael Nuñez
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
AI新词
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
华为
大语言模型
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
编程
DeepMind
亚马逊
特斯拉
AI模型