AI在线 AI在线

理论

大模型系列:DeepSeek大模型与应用场景介绍

今天给大家聊聊DeepSeek 究竟有哪些强大的模型? 这些模型又适用于哪些具体的场景呢? 希望对大家了解 DeepSeek 大模型提供一些参考。
3/6/2025 7:28:31 AM
郝光明

为什么 Qwen 能自我改进推理,Llama 却不行?斯坦福找到了原理

给到额外的计算资源和「思考」时间,为什么有的模型能好好利用,把性能提升一大截,而有的模型就不行? 当遇到困难问题时,人类会花时间深入思考以找到解决方案。 在 AI 领域,最近的一些大语言模型在通过强化学习进行自我改进训练时,也已经开始表现出类似的推理行为。
3/6/2025 6:00:00 AM
机器之心

全球首次!2B复现DeepSeek-R1「啊哈时刻」,UCLA等用纯RL实现多模态推理

就在刚刚,我们在未经监督微调的2B模型上,见证了基于DeepSeek-R1-Zero方法的视觉推理「啊哈时刻」! 这一成就,再次让AI社区轰动。 博客地址::,能成功扩展到多模态推理领域吗?
3/6/2025 1:00:00 AM
新智元

C#与人工智能的奇妙融合:探索AI在.NET生态中的无限可能!

在当今数字化时代,人工智能(AI)已经成为推动各行业发展的重要力量。 C#作为一种广泛应用的编程语言,在.NET生态中也逐渐与AI技术实现了深度融合,为开发者带来了无限的可能性。 本文将介绍C#在人工智能领域的应用,讲解使用ML.NET进行机器学习模型训练与部署的方法,以及如何利用神经网络加速库提升效率,并通过图像识别、自然语言处理等实际案例,激发读者对C#与AI结合的探索热情。
3/6/2025 12:38:08 AM
cocan

我用 Claude Sonnet 和 DeepSeek R1 开发一个同样的工具,看谁更厉害!

先给 DeepSeek 泼一盆冷水,DeepSeek 在编程能力上和 Claude Sonnet 还是差了一大截的。 下面有使用 Sonnet 3.5 和 DeepSeek R1 配合 Trae 实现一个推文生成图片卡片小插件的过程,功能虽小,但还是能看出差距的。 这两天 Trae 不是推出了国内版吗 (), 搭载豆包和 DeepSeek 大模型,因为之前 Trae 国际版是支持 Claude Sonnet 的,最开始是 3.5,后来 Claude 升级了 3.7,隔了一天 Trae 就跟进了,而且也是完全免费的。
3/6/2025 12:22:00 AM
风筝

MegaSynth:用70万合成数据突破3D场景重建瓶颈,PSNR提升1.8dB!

一眼概览MegaSynth 提出了一种基于非语义合成数据的大规模 3D 场景重建方法,生成 70 万个合成场景数据集,训练大型重建模型(LRMs),相比使用真实数据训练的模型,PSNR 提升 1.2~1.8 dB,显著增强 3D 场景重建的广覆盖能力。 核心问题当前 3D 场景重建方法受限于:数据规模受限:现有真实数据集 DL3DV 仅 10K 场景,远小于物体级数据集(如 Objaverse 80 万个实例)。 数据分布不理想:现有数据集多为人工采集,难以确保场景多样性,摄像机运动范围受限,且可能包含噪声和不精确标注。
3/6/2025 12:15:00 AM
萍哥学AI

DeepSeek+Drawio一键生成20多种图表,90%都不知道的技巧(附保姆级教程)

大家好,我是岳哥。 DeepSeek目前还不支持直接画图,但是我们借助一些第三方工具,还是可以达到生成图表的效果。 今天继续给大家分享工作中的流程图,甘特图,统计图,如何通过DeepSeek来生成。
3/6/2025 12:08:00 AM
、平凡世界

现在的AI Agent还是这么差!

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)背景是这样的。 前几天,我发现我的XX激光雷达出了问题。 本来我靠它来为电影摄像机增加自动对焦和自动跟踪功能,如果没有这项功能,我会很难拍摄到我需要的画面。
3/5/2025 6:45:26 PM
言征

4400万打水漂?马斯克阻止OpenAI营利化惨遭驳回!将秋季开庭判决;法官:收购提议太双标了!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)马斯克4告OpenAI的连续剧,又有新进展了! 前情回顾下,马斯克与OpenAI对簿公堂是因为:他曾向非营利组织OpenAI捐赠超过4400万美元,而OpenAI的营利化转型,显然违反了当时的合同。 这都不是4400万打了水漂那么简单!
3/5/2025 6:38:28 PM
伊风

为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理

虽然 Qwen「天生」就会检查自己的答案并修正错误。 但找到原理之后,我们也能让 Llama 学会自我改进。 给到额外的计算资源和「思考」时间,为什么有的模型能好好利用,把性能提升一大截,而有的模型就不行?
3/5/2025 2:54:00 PM
机器之心

神经网络技术栈介绍:PyTorch,Transformer,NLP,CV,Embedding

学习了一段时间神经网络技术之后发现对很多东西理解还不够深刻,所以今天就来梳理一下神经网络的技术栈,深入了解一下不同的工具在神经网络中所处的位置,以及其扮演的角色。 先说一句废话,神经网络仅仅只是神经网络,它不涉及具体的任务,只是一个神经网络模型;神经网络要解决实际问题就需要和不同的任务领域相结合。 神经网络技术栈要了解或者说要学习神经网络,首先要从两个方面去入手——技术原理和应用场景。
3/5/2025 2:00:00 PM
AI探索时代

无缝集成知识图谱,开源Python框架BioChatter降低LLM生物医学使用门槛

编辑丨coisini大型语言模型(LLMs)已经改变了人们的工作方式,从支持内容创作、编程到改进搜索引擎等。 然而,LLMs 在透明度、可重复性和定制化方面的不足仍然是一个挑战,限制了它们在生物医学研究中的广泛应用。 对生物医学研究人员来说,针对特定研究问题优化 LLMs 可能是一项艰巨的任务,因为这需要编程技能和机器学习专业知识。
3/5/2025 12:58:00 PM
ScienceAI

谷歌旗下带来细胞器动力学的「全息解码器」,启动亚像素级细胞器分析

编辑丨&细胞器经历不断的形态变化和动态相互作用,这是细胞稳态、应激反应和疾病进展的基础。 尽管细胞器的形态与运动十分重要,但由于其复杂的结构,高速的运动模式与目前现有分析技术的局限性,量化细胞器形态仍具有挑战性。 美国旧金山 Calico Life Sciences 的团队推出了一个名为 Nellie 的模型,这是一种自动化且无偏倚的管道,用于分割、跟踪和提取不同细胞内结构的特征。
3/5/2025 12:57:00 PM
ScienceAI

ByteQC:通往大规模实用化量子化学计算的曙光

编辑 | ScienceAI真实化学体系包含大量的微观粒子,其精确的严格计算需要指数高的复杂度,对这些体系的模拟一直是材料、制药和催化等领域的难点和前沿。 为了解决这一问题,近日字节跳动 ByteDance Research 团队开发并开源了 ByteQC ——基于 GPU 加速的大规模量子化学计算工具集。 该工具集使用强大的 GPU 算力,大幅度加速了常见的量子化学算法,同时结合领域内前沿的量子嵌入方法实现了量子化学「黄金标准」精度下的大规模量子化学体系的模拟。
3/5/2025 12:56:00 PM
ScienceAI

OpenAI开价385万年薪扩增机器人团队!招募基础模型人才,北大校友是创始成员

年薪最高53万美元,OpenAI机器人团队,叒叒叒招人了! 最新消息,OpenAI正在招募机器人底层技术模型开发人员,年薪29.5-53万美元(约合人民币214-385万)。 将这一消息广而告之的,是重启后的OpenAI机器人团队创始成员、卡内基梅隆大学华人博士林星宇。
3/5/2025 11:26:33 AM
量子位

OpenAI计划将Sora整合到ChatGPT中

3月4日消息,2024年初,OpenAI宣布将Sora作为其首款人工智能文本转视频生成器。 ChatGPT的母公司在2024年12月发布了稳定版本。 现在,OpenAI透露,他们计划将Sora的视频生成器功能集成到ChatGPT中。
3/5/2025 11:23:44 AM
Yu

AI幻觉扰乱法庭,美国律师被重罚

继上月曝出律师团队使用AI编造的“虚假判例”提交法庭引发风波后,美国法律界再曝同类丑闻——印第安纳州南区联邦治安法官马克·丁斯莫尔上周裁定,律师拉斐尔·拉米雷斯因在多份法律文书中引用AI生成的虚构案例,需缴纳1.5万美元罚款。 这一系列事件暴露AI技术滥用对司法严谨性的冲击,也为法律从业者敲响“责任警钟”。 律师称“没想到AI居然会造假”案件缘起于一场劳资纠纷:工会组织“中中部运营工程师健康与福利基金”指控HoosierVac公司拒绝配合财务审计,拉米雷斯作为该公司代理律师,在2023年10月提交的辩护状中引用了一则法官无法检索到的判例。
3/5/2025 11:09:20 AM
佚名

一文读懂:DeepSearch 前生今世

众所周知,在当今信息爆炸的时代,如何从海量数据中高效、精准地提取有价值的内容,成为人工智能领域的重要课题。 DeepSearch 作为一种创新的迭代搜索系统,以其独特的循环推理机制和强大的信息挖掘能力,逐渐崭露头角,成为解决复杂查询与研究需求的利器。 本文将带大家深入探索 DeepSearch 的前世今生——从其概念的萌芽、技术原理的演进,到如今在智能搜索与知识生成领域的广泛应用。
3/5/2025 11:03:36 AM
架构驿站