理论
大模型系列:DeepSeek大模型与应用场景介绍
今天给大家聊聊DeepSeek 究竟有哪些强大的模型? 这些模型又适用于哪些具体的场景呢? 希望对大家了解 DeepSeek 大模型提供一些参考。
3/6/2025 7:28:31 AM
郝光明
为什么 Qwen 能自我改进推理,Llama 却不行?斯坦福找到了原理
给到额外的计算资源和「思考」时间,为什么有的模型能好好利用,把性能提升一大截,而有的模型就不行? 当遇到困难问题时,人类会花时间深入思考以找到解决方案。 在 AI 领域,最近的一些大语言模型在通过强化学习进行自我改进训练时,也已经开始表现出类似的推理行为。
3/6/2025 6:00:00 AM
机器之心
全球首次!2B复现DeepSeek-R1「啊哈时刻」,UCLA等用纯RL实现多模态推理
就在刚刚,我们在未经监督微调的2B模型上,见证了基于DeepSeek-R1-Zero方法的视觉推理「啊哈时刻」! 这一成就,再次让AI社区轰动。 博客地址::,能成功扩展到多模态推理领域吗?
3/6/2025 1:00:00 AM
新智元
C#与人工智能的奇妙融合:探索AI在.NET生态中的无限可能!
在当今数字化时代,人工智能(AI)已经成为推动各行业发展的重要力量。 C#作为一种广泛应用的编程语言,在.NET生态中也逐渐与AI技术实现了深度融合,为开发者带来了无限的可能性。 本文将介绍C#在人工智能领域的应用,讲解使用ML.NET进行机器学习模型训练与部署的方法,以及如何利用神经网络加速库提升效率,并通过图像识别、自然语言处理等实际案例,激发读者对C#与AI结合的探索热情。
3/6/2025 12:38:08 AM
cocan
我用 Claude Sonnet 和 DeepSeek R1 开发一个同样的工具,看谁更厉害!
先给 DeepSeek 泼一盆冷水,DeepSeek 在编程能力上和 Claude Sonnet 还是差了一大截的。 下面有使用 Sonnet 3.5 和 DeepSeek R1 配合 Trae 实现一个推文生成图片卡片小插件的过程,功能虽小,但还是能看出差距的。 这两天 Trae 不是推出了国内版吗 (), 搭载豆包和 DeepSeek 大模型,因为之前 Trae 国际版是支持 Claude Sonnet 的,最开始是 3.5,后来 Claude 升级了 3.7,隔了一天 Trae 就跟进了,而且也是完全免费的。
3/6/2025 12:22:00 AM
风筝
MegaSynth:用70万合成数据突破3D场景重建瓶颈,PSNR提升1.8dB!
一眼概览MegaSynth 提出了一种基于非语义合成数据的大规模 3D 场景重建方法,生成 70 万个合成场景数据集,训练大型重建模型(LRMs),相比使用真实数据训练的模型,PSNR 提升 1.2~1.8 dB,显著增强 3D 场景重建的广覆盖能力。 核心问题当前 3D 场景重建方法受限于:数据规模受限:现有真实数据集 DL3DV 仅 10K 场景,远小于物体级数据集(如 Objaverse 80 万个实例)。 数据分布不理想:现有数据集多为人工采集,难以确保场景多样性,摄像机运动范围受限,且可能包含噪声和不精确标注。
3/6/2025 12:15:00 AM
萍哥学AI
DeepSeek+Drawio一键生成20多种图表,90%都不知道的技巧(附保姆级教程)
大家好,我是岳哥。 DeepSeek目前还不支持直接画图,但是我们借助一些第三方工具,还是可以达到生成图表的效果。 今天继续给大家分享工作中的流程图,甘特图,统计图,如何通过DeepSeek来生成。
3/6/2025 12:08:00 AM
、平凡世界
现在的AI Agent还是这么差!
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)背景是这样的。 前几天,我发现我的XX激光雷达出了问题。 本来我靠它来为电影摄像机增加自动对焦和自动跟踪功能,如果没有这项功能,我会很难拍摄到我需要的画面。
3/5/2025 6:45:26 PM
言征
4400万打水漂?马斯克阻止OpenAI营利化惨遭驳回!将秋季开庭判决;法官:收购提议太双标了!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)马斯克4告OpenAI的连续剧,又有新进展了! 前情回顾下,马斯克与OpenAI对簿公堂是因为:他曾向非营利组织OpenAI捐赠超过4400万美元,而OpenAI的营利化转型,显然违反了当时的合同。 这都不是4400万打了水漂那么简单!
3/5/2025 6:38:28 PM
伊风
为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理
虽然 Qwen「天生」就会检查自己的答案并修正错误。 但找到原理之后,我们也能让 Llama 学会自我改进。 给到额外的计算资源和「思考」时间,为什么有的模型能好好利用,把性能提升一大截,而有的模型就不行?
3/5/2025 2:54:00 PM
机器之心
神经网络技术栈介绍:PyTorch,Transformer,NLP,CV,Embedding
学习了一段时间神经网络技术之后发现对很多东西理解还不够深刻,所以今天就来梳理一下神经网络的技术栈,深入了解一下不同的工具在神经网络中所处的位置,以及其扮演的角色。 先说一句废话,神经网络仅仅只是神经网络,它不涉及具体的任务,只是一个神经网络模型;神经网络要解决实际问题就需要和不同的任务领域相结合。 神经网络技术栈要了解或者说要学习神经网络,首先要从两个方面去入手——技术原理和应用场景。
3/5/2025 2:00:00 PM
AI探索时代
无缝集成知识图谱,开源Python框架BioChatter降低LLM生物医学使用门槛
编辑丨coisini大型语言模型(LLMs)已经改变了人们的工作方式,从支持内容创作、编程到改进搜索引擎等。 然而,LLMs 在透明度、可重复性和定制化方面的不足仍然是一个挑战,限制了它们在生物医学研究中的广泛应用。 对生物医学研究人员来说,针对特定研究问题优化 LLMs 可能是一项艰巨的任务,因为这需要编程技能和机器学习专业知识。
3/5/2025 12:58:00 PM
ScienceAI
谷歌旗下带来细胞器动力学的「全息解码器」,启动亚像素级细胞器分析
编辑丨&细胞器经历不断的形态变化和动态相互作用,这是细胞稳态、应激反应和疾病进展的基础。 尽管细胞器的形态与运动十分重要,但由于其复杂的结构,高速的运动模式与目前现有分析技术的局限性,量化细胞器形态仍具有挑战性。 美国旧金山 Calico Life Sciences 的团队推出了一个名为 Nellie 的模型,这是一种自动化且无偏倚的管道,用于分割、跟踪和提取不同细胞内结构的特征。
3/5/2025 12:57:00 PM
ScienceAI
ByteQC:通往大规模实用化量子化学计算的曙光
编辑 | ScienceAI真实化学体系包含大量的微观粒子,其精确的严格计算需要指数高的复杂度,对这些体系的模拟一直是材料、制药和催化等领域的难点和前沿。 为了解决这一问题,近日字节跳动 ByteDance Research 团队开发并开源了 ByteQC ——基于 GPU 加速的大规模量子化学计算工具集。 该工具集使用强大的 GPU 算力,大幅度加速了常见的量子化学算法,同时结合领域内前沿的量子嵌入方法实现了量子化学「黄金标准」精度下的大规模量子化学体系的模拟。
3/5/2025 12:56:00 PM
ScienceAI
OpenAI开价385万年薪扩增机器人团队!招募基础模型人才,北大校友是创始成员
年薪最高53万美元,OpenAI机器人团队,叒叒叒招人了! 最新消息,OpenAI正在招募机器人底层技术模型开发人员,年薪29.5-53万美元(约合人民币214-385万)。 将这一消息广而告之的,是重启后的OpenAI机器人团队创始成员、卡内基梅隆大学华人博士林星宇。
3/5/2025 11:26:33 AM
量子位
OpenAI计划将Sora整合到ChatGPT中
3月4日消息,2024年初,OpenAI宣布将Sora作为其首款人工智能文本转视频生成器。 ChatGPT的母公司在2024年12月发布了稳定版本。 现在,OpenAI透露,他们计划将Sora的视频生成器功能集成到ChatGPT中。
3/5/2025 11:23:44 AM
Yu
AI幻觉扰乱法庭,美国律师被重罚
继上月曝出律师团队使用AI编造的“虚假判例”提交法庭引发风波后,美国法律界再曝同类丑闻——印第安纳州南区联邦治安法官马克·丁斯莫尔上周裁定,律师拉斐尔·拉米雷斯因在多份法律文书中引用AI生成的虚构案例,需缴纳1.5万美元罚款。 这一系列事件暴露AI技术滥用对司法严谨性的冲击,也为法律从业者敲响“责任警钟”。 律师称“没想到AI居然会造假”案件缘起于一场劳资纠纷:工会组织“中中部运营工程师健康与福利基金”指控HoosierVac公司拒绝配合财务审计,拉米雷斯作为该公司代理律师,在2023年10月提交的辩护状中引用了一则法官无法检索到的判例。
3/5/2025 11:09:20 AM
佚名
一文读懂:DeepSearch 前生今世
众所周知,在当今信息爆炸的时代,如何从海量数据中高效、精准地提取有价值的内容,成为人工智能领域的重要课题。 DeepSearch 作为一种创新的迭代搜索系统,以其独特的循环推理机制和强大的信息挖掘能力,逐渐崭露头角,成为解决复杂查询与研究需求的利器。 本文将带大家深入探索 DeepSearch 的前世今生——从其概念的萌芽、技术原理的演进,到如今在智能搜索与知识生成领域的广泛应用。
3/5/2025 11:03:36 AM
架构驿站
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
Sora
3D
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind