AI在线 AI在线

理论

民营企业家座谈会:科技大佬分享AI与新能源最新动态

最近,民营企业家座谈会成为关注的焦点,科技大佬们如雷军、王传福、王兴兴等分享了AI、新能源、半导体芯片等领域的最新动态和发展战略。
2/19/2025 2:02:10 PM
dream

Spring Boot + DeepSeek:解锁 AI 开发新姿势

在当今数字化时代,人工智能(AI)技术正以前所未有的速度改变着我们的生活和工作方式。 作为开发者,我们一直在寻找更高效、更智能的方式来构建应用程序。 今天,我们要为大家介绍一个强大的组合:Spring Boot DeepSeek,这将为你的应用注入智能新动力,开启 AI 开发的新篇章。
2/19/2025 12:00:00 PM
Java技术营地

2025年网络安全投资的六大关键考量:应对新威胁的智慧决策

尽管在2021年至2022年间,网络安全预算有所增长,但近几年的增长势头已明显放缓。 这意味着,网络安全领导者在采购决策时,必须更加审慎地考虑如何改善当前的安全和合规状况,以确保每一分投入都能带来实实在在的效益。 那么,如何在2025年优化企业的网络安全预算,以有效应对不断演变的威胁呢?领导层需要深入了解当前的网络安全格局,并明确哪些举措能够帮助他们恰当地缓解风险。
2/19/2025 11:29:11 AM
Rita Gurevich

Llama都在用的RoPE有了视频版,复旦上海AI Lab等提出长视频理解/检索绝佳拍档

Llama都在用的RoPE(旋转位置嵌入)被扩展到视频领域,长视频理解和检索更强了。 复旦大学、上海AI实验室等提出VideoRoPE,并确定了将RoPE有效应用于视频所需的四个关键特性。 在长视频检索、视频理解和视频幻觉等各种下游任务中,VideoRoPE始终优于先前的RoPE变体。
2/19/2025 11:28:00 AM

DeepSeek-V3深入解读!

上一篇文章对DeepSeek-R1进行了详细的介绍,今天来看看DeepSeek-R1的基座模型DeepSeek-V3。 项目地址::现有的开源模型在性能和训练成本之间往往难以达到理想的平衡。 一方面,为了提升模型性能,需要增加模型规模和训练数据量,这会导致训练成本急剧上升;另一方面,高效的训练和推理架构对于降低计算资源消耗至关重要。
2/19/2025 10:49:30 AM
Glodma

一文说清楚分布式思维状态:由事件驱动的多智能体系统

译者 | 核子可乐审校 | 重楼大语言模型的能力上限止步于聊天机器人、问答系统、翻译等特定语言,要想进一步展现潜力、解决更广泛的问题,就必须想办法让它根据洞察力采取行动。 换言之,只有掌握了推理的武器,大语言模型才算真正的完全体。 这种推理智能体在AI研究领域有着悠久历史,他们能够对以往接触过的情况进行概括,再据此处理从未见过的情况。
2/19/2025 10:49:24 AM
核子可乐

我用 四天时间开发了一款 AI 应用程序,希望给你一点点启发

技术让世界发展得更快。 我们今天在人工智能上再次看到了这一点。 使用 Cursor 等工具,开发人员可以比以前快 5-10 倍地构建项目。
2/19/2025 10:48:15 AM
佚名

豪掷20万块GPU训练Grok-3,马斯克“大力出奇迹”了吗?

当时间周一,埃隆·马斯克旗下的xAI公司正式发布了最新大模型Grok-3。 这次,马斯克不仅带来了性能更强的AI,还秀了一把“肌肉”——20万块GPU组成的超级计算集群。 这背后,到底是真正的技术突破,还是一场“大力出奇迹”的豪赌呢?
2/19/2025 10:28:22 AM
小菲

目标检测中的 Anchor 详解

直观上,我们如何预测图像中的边界框? 第一个最明显的技术是滑动窗口。 我们定义一个任意大小的窗口,并在图像中“滑动”它。
2/19/2025 10:14:42 AM
二旺

全球首测!OpenAI开源SWELancer,大模型冲击100万年薪

今天凌晨2点,OpenAI开源了一个全新评估大模型代码能力的测试基准——SWE-Lancer。 目前,测试模型代码能力的基准主要有SWE-Bench和SWE-BenchVerified,但这两个有一个很大的局限性,主要针对孤立任务,很难反映现实中软件工程师的复杂情况。 例如,开发人员需处理全技术栈的工作,要考虑代码库间的复杂交互和权衡。
2/19/2025 9:40:58 AM
AIGC开放社区

OpenAI推出真实世界百万报酬AI编程能力测试基准:实测Claude 3.5 最强!

OpenAI 联合一众大佬发布了一项重磅研究,直接把目光瞄准了 真实世界的软件工程! 🔥 他们推出了一个全新的、价值百万美元的超硬核 benchmark —— SWE-Lancer! 具体是啥,我们来扒一扒划重点:什么是 SWE-Lancer?
2/19/2025 9:34:01 AM
AI寒武纪

官宣!OpenAI前CTO新公司:北大校友翁荔加盟,创始29人2/3来自OpenAI

正式官宣! OpenAI前CTO Mira Murati 成立新公司——Thinking Machines Lab。 整个创业团队可以说前所未有之豪华了,三分之二的都是以前的OpenAI旧部追随——其中包括OpenAI前研究(后训练)副总裁Barret Zoph,担任公司CTO;刚刚离职Anthropic、OpenAI离职联创John Schulman,任公司首席科学家,还有包括前OpenAI VP、北大校友翁荔等等。
2/19/2025 9:20:30 AM
量子位

Deepseek 这么厉害,普通人怎么用好它?

最近,Deepseek 的风头可谓是一时无两,相关消息一波接着一波。 它强大的能力让人惊叹不已,写代码、做翻译、生成文案……简直无所不能! 不少小伙伴跃跃欲试,却又担心自己不是程序员、不会写代码,用不好这么“高大上”的工具。
2/19/2025 8:50:05 AM
架构精进之路

本地运行 DeepSeek-R1 的成本究竟多高?

DeepSeek 让人们对大规模生成式模型的追求更进一步,甚至有人想在本地跑下规模高达 671B 参数的版本。 但要在家里开这种“巨无霸”,可不是闹着玩的:光是推理就对硬件提出了非常高的要求。 这篇文章将大致拆解一下,如果真想在个人电脑上运行 DeepSeek-R1,可能需要的硬件和费用是多少。
2/19/2025 8:33:18 AM
dev

前OpenAI CTO另立门户,2/3 ChatGPT骨干被挖!北大校友Lilian Weng加盟

离职近5个月,OpenAI前CTO Mira Murati终于官宣了! 新公司名叫「思考机器实验室」(Thinking Machines Lab),将人类价值观编码到AI模型中,让其更安全、更可靠。 Mira任CEO,OpenAI前后训练研究副总Barret Zoph任CTO,OpenAI联创John Schulman任首席科学家。
2/19/2025 8:29:27 AM
新智元

DeepSeek-R1详细解读!

DeepSeek-R1爆火,今天来详细看下。 论文地址::::现有LLMs在推理任务上的改进主要依赖监督微调(SFT)和后训练(Post-Training)方法,但这些方法需要大量人工标注数据且成本高昂。 OpenAI的o1系列模型虽通过扩展推理链(Chain-of-Thought, CoT)提升了性能,但其测试时扩展仍存在挑战。
2/19/2025 8:00:00 AM
GoldMa

基于Deepseek的安全分析工具设计实践

一、分享背景DeepSeek近日红的发紫,春节前发现一个叫Deepseek的LLM送 10 RMB的Token!!!,正巧符合生产工作中拥抱大模型的主旋律,又本着有羊毛必薅的原则配合B站ollama本地部署喂饭视频起了阿里qwen2.5(1.5b)就行Coding辅助。 ollama本地部署Coding模型复制step2:step3:效果:二、工具需求分析GUI化,免去命令行操作,12-80年龄段各类人群均适用。 固定的LLM回复结果,使每一次提问都能得到相同格式的回答(区分在线提问和工具脚本的关键)。
2/19/2025 7:59:06 AM
沈家伟

超简单:三步教你搞定DeepSeek本地部署

最近,国产AI神器DeepSeek爆火,其深度思考能力完美的体现了DeepSeek先进的算力和优越的性能。 可以这么说,DeepSeek的问世,推动了AI大模型的跨越式发展。 作为一款AI领域的现象级产品,DeepSeek的用户量在短时间内暴增,服务器也被大量攻击,不少小伙伴在使用DeepSeek时,经常会出现服务器繁忙的提示。
2/19/2025 7:53:19 AM
冰河