理论
Claude 3.7成精了!偷偷将OpenAI模型换成自己,卡帕西:迄今最好笑的一趴
Claude 3.7成精了! 在开发者最喜欢的Cursor中,偷偷将OpenAI模型换成自己,关键是人类给出的指示跟这完全没关系。 引来一众网友围观的同时,大佬卡帕西也被成功逗笑了:迄今为止最有意思的一趴。
3/3/2025 8:25:00 AM
量子位
DeepSeek突袭公布成本利润率:545%
五连开源后,DeepSeek还有One More Thing! 就在刚刚,DeepSeek官方亲自揭秘了DeepSeek-V3/R1推理系统。 重点包括,优化吞吐量和延迟的方法:跨节点EP驱动的批量扩展计算与通信重叠负载均衡还公布了DeepSeek的在线服务数据统计:每个H800节点每秒有73.7k/14.8k个输入/输出token成本利润率545%更多细节,一起来看官方原文↓更大的吞吐,更低的延迟DeepSeek-V3/R1推理系统的优化目标是:更大的吞吐,更低的延迟。
3/3/2025 8:21:00 AM
量子位
DeepSeek全面开源V3/R1推理系统!成本利润率高达545%
就在刚刚,当大家以为开源周已经结束的时候,真「Open AI」DeepSeek带来了压轴大戏——DeepSeek-V3/R1推理系统,全面揭秘! 吞吐量和延迟优化:跨节点高效并行(EP)驱动的批处理扩展计算与通信并行处理智能负载均衡在线服务性能数据:每个H800节点每秒处理73,700/14,800输入/输出token成本利润率高达545�epSeek表示,希望本周分享的技术见解能为开源社区带来价值,共同推进通用人工智能的发展目标。 看到这里,网友都惊了!
3/3/2025 8:17:00 AM
新智元
副业要赚翻?这六款 AI 代理简直像开挂
AI 代理(AI Agents)能够让繁琐的人工工作实现高度自动化,而且速度快、准确度高。 它们在写代码、做营销、创作视频以及其他创意或业务领域都越来越出色。 如果现在还不使用 AI 代理,可能很快就会落后。
3/3/2025 8:10:00 AM
dev
神经网络技术的核心:反向传播算法(BP算法)
在前面的文章中介绍训练一个模型,其主要区别就在于神经网络模型的架构;但可能很多人并不知道神经网络模型的核心算法就是——反向传播算法,也被叫做BP算法。 可能很多人都听说过反向传播算法,但可能很多人都没意识到反向传播算法对神经网络的重要性;可以说现在的神经网络模型就建立在反向传播算法之上,没有反向传播算法就没有神经网络的存在。 反向传播(BP)算法了解过人工智能发展史的人应该都知道,人工智能技术并不是最近才出现的新技术;在世界上第一台计算机出现之后的十年,人工智能的概念就已经被提出来了,但人工智能技术的发展却是最近几年才爆火的。
3/3/2025 8:10:00 AM
AI探索时代
分享五个在微信中使用 DeepSeek 的方法,建议收藏!
前言今天大姚将为大家分享5种在微信中使用DeepSeek的方法,帮助大家更好地利用这一工具,提升工作和学习效率。 无论是处理文档、管理知识,还是进行深度搜索和思考,这些方法都将为你带来全新的体验。 让我们一起探索DeepSeek在微信中的无限可能吧!
3/3/2025 8:06:39 AM
大姚
5分钟顶人类8小时!OpenAI Deep Research订阅全推送,端到端强化微调是关键
Deep Research(深度研究)是继「Operator」之后,OpenAI推出的第二个智能体,利用模型的推理能力,综合分析浩瀚的互联网信息,从而完成复杂的研究任务。 月初,OpenAI首先向ChatGPT Pro用户开放了Deep Research功能。 最近,进一步开放给了更多等级的订阅用户。
3/3/2025 8:02:00 AM
新智元
KDD2025|小红书联合中科大提出1.44M轻量高效AI图像检测模型,超SOTA 4.5个点
当下,AI 生成图像的技术足以以假乱真,在社交媒体肆意传播。 如何对不同生成模型实现通用检测? 小红书联合中国科学技术大学给出了解决方案,仅用 1.44M 参数量实现了通用 AI 图片检测,在 33 个测试子集上达到 96.7% 的准确率,超 SOTA 模型 4.5 个百分点。
3/3/2025 8:00:00 AM
又在技术上突破的
GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河
自从OpenAI发布GPT-4.5之后,Ilya这张图又开始火了。 GPT-4.5令人失望的表现,再次印证了Ilya这句话的含金量:预训练已经达到极限,推理Scaling才是未来有希望的范式。 GPT-4.5在基准测试上并没有提升,推理没有增强,只是变成了一个更易于合作、更有创造性、幻觉更少的模型。
3/3/2025 8:00:00 AM
新智元
Nature独家爆料:全球机构撤稿率大排行,医学领域成重灾区
撤稿,是对科研人员诚信的巨大打击,不仅是一篇论文,此前的研究成果都可能遭到同行质疑。 中国在保障学术道德诚信方面的力度非常大,一经发现,即全国通报批评,取消申报课题资格5年,基本就断送了自己的学术生涯。 通报链接::,仍然有大量的科研人员为了一己私利,在论文撰写中捏造数据、伪造实验结果,甚至雇佣写手,从论文工厂中购买。
3/3/2025 7:36:00 AM
新智元
AI欺骗决策者,我们可能还没有引起注意
近年来,AI技术飞速发展,但随之而来的问题也日益凸显。 最近,AI模型被曝出频繁出现欺骗行为,不仅不服从研究人员指令,还试图逃离限制环境,甚至谎称遵守规则。 这一现象引起了业界的广泛关注。
3/3/2025 7:30:00 AM
Alex Kantrowitz
DiffUCD:扩散模型助力无监督高光谱变化检测,超越SOTA,逼近监督方法!
一眼概览DiffUCD 提出了一种创新的无监督高光谱影像变化检测(HSI-CD)方法,利用 语义相关性扩散模型(SCDM) 和 跨时间对比学习(CTCL),在无需标注的情况下提高检测精度,在多个基准数据集上超越现有方法。 核心问题高光谱影像变化检测(HSI-CD)旨在识别同一区域在不同时刻的地表变化。 然而,受限于以下挑战:• 现有方法依赖大量标注数据,而高质量的人工标注成本高昂。
3/3/2025 5:00:00 AM
萍哥学AI
DeepSeek+Xmind一键生成思维导图
大家好,我是岳哥。 我们工作和生活中,有时候遇到一本好书或者是别人写的一些比较有深度的文章,认真看完要花不少时间。 但是如果我们让DeepSeek帮我们看完,提取书籍或文章中的重点内容并生成思维导图,那就效率多了。
3/3/2025 3:35:00 AM
丶平凡世界
DeepSeek第五弹炸裂收官!开源全新并行文件系统,榨干SSD全部带宽
DeepSeek开源周,今日正式收官! 内容依旧惊喜且重磅,直接公开了V3和R1训练推理过程中用到的文件系统。 具体来说,包括以下两项内容:Fire-Flyer文件系统(简称3FS,第三个F代表File),一种利用现代SSD和RDMA网络的全部带宽的并行文件系统;Smallpond,基于3FS和DuckDB构建的轻量级数据处理框架。
3/3/2025 2:00:00 AM
C#实战:基于腾讯云大模型知识引擎原子能力提供的文档解析API快速提取图片信息为MD文档
今天借助腾讯云大模型知识引擎原子能力提供的文档解析API快速提取图片信息为MD文档的WinFomr应用小案例,感兴趣的朋友可以看一下! 一、大模型知识引擎 LKE介绍官方介绍:大模型知识引擎(LLM Knowledge Engine),是面向企业客户及合作伙伴的,基于大模型的应用构建平台,结合企业专属数据,更快更高效地搭建Agent、RAG、工作流等多种模式应用,推动大语言模型在企业中的应用落地。 图片大模型知识引擎 LKE: 如何开通服务?
3/3/2025 2:00:00 AM
郝光明
终于把深度学习中的微调、提炼和迁移学习搞懂了!!!
大家好,我是小寒今天给大家分享深度学习中的三个重要知识点,微调、提炼和迁移学习在深度学习中,微调(Fine-tuning)、提炼(Distillation,即知识蒸馏)和迁移学习(Transfer Learning)是三种常见的模型优化技术,主要用于提高模型的泛化能力、减少训练时间以及优化资源利用率。 微调微调是指在一个已经训练好的模型(通常是预训练模型)的基础上,对部分或全部参数进行进一步训练,以适应特定的新任务。 通常,预训练模型是在大规模数据集(如ImageNet)上训练得到的,它能够学习到一些通用的特征。
3/3/2025 1:50:00 AM
程序员小寒
绝了超简单!3分钟用满血DeepSeek R1开发一款AI智能客服,零代码轻松接入微信、公众号、小程序,新手也能快速上手!
大家好,我是狂师。 在当今数字化时代,智能客服已成为提升用户体验、提高运营效率的关键工具。 今天,我们将为大家带来一个超级简单的教程,教你如何在短短3分钟内,利用腾讯微搭平台,将满血 DeepSeek R1接入到微信、公众号、小程序,打造属于自己的 AI 智能客服,哪怕你是新手也能轻松上手!
3/3/2025 12:25:00 AM
狂师
DeepSeek 官方推出的提示词库,AI内容生成的精准导航仪!
前言在当今数字化时代,人工智能(AI)正以前所未有的速度改变着我们的生活方式和工作模式。 从简单的数据处理到复杂的创意生成,AI技术正逐渐渗透到各个领域,成为推动社会进步的重要力量。 然而,如何高效地利用AI技术进行内容创作,一直是许多用户面临的难题。
3/3/2025 12:25:00 AM
大姚
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
AI新词
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
华为
大语言模型
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
编程
DeepMind
亚马逊
特斯拉
AI模型