AI在线 AI在线

理论

一文说清楚分布式思维状态:由事件驱动的多智能体系统

译者 | 核子可乐审校 | 重楼大语言模型的能力上限止步于聊天机器人、问答系统、翻译等特定语言,要想进一步展现潜力、解决更广泛的问题,就必须想办法让它根据洞察力采取行动。 换言之,只有掌握了推理的武器,大语言模型才算真正的完全体。 这种推理智能体在AI研究领域有着悠久历史,他们能够对以往接触过的情况进行概括,再据此处理从未见过的情况。
2/19/2025 10:49:24 AM
核子可乐

我用 四天时间开发了一款 AI 应用程序,希望给你一点点启发

技术让世界发展得更快。 我们今天在人工智能上再次看到了这一点。 使用 Cursor 等工具,开发人员可以比以前快 5-10 倍地构建项目。
2/19/2025 10:48:15 AM
佚名

豪掷20万块GPU训练Grok-3,马斯克“大力出奇迹”了吗?

当时间周一,埃隆·马斯克旗下的xAI公司正式发布了最新大模型Grok-3。 这次,马斯克不仅带来了性能更强的AI,还秀了一把“肌肉”——20万块GPU组成的超级计算集群。 这背后,到底是真正的技术突破,还是一场“大力出奇迹”的豪赌呢?
2/19/2025 10:28:22 AM
小菲

目标检测中的 Anchor 详解

直观上,我们如何预测图像中的边界框? 第一个最明显的技术是滑动窗口。 我们定义一个任意大小的窗口,并在图像中“滑动”它。
2/19/2025 10:14:42 AM
二旺

全球首测!OpenAI开源SWELancer,大模型冲击100万年薪

今天凌晨2点,OpenAI开源了一个全新评估大模型代码能力的测试基准——SWE-Lancer。 目前,测试模型代码能力的基准主要有SWE-Bench和SWE-BenchVerified,但这两个有一个很大的局限性,主要针对孤立任务,很难反映现实中软件工程师的复杂情况。 例如,开发人员需处理全技术栈的工作,要考虑代码库间的复杂交互和权衡。
2/19/2025 9:40:58 AM
AIGC开放社区

OpenAI推出真实世界百万报酬AI编程能力测试基准:实测Claude 3.5 最强!

OpenAI 联合一众大佬发布了一项重磅研究,直接把目光瞄准了 真实世界的软件工程! 🔥 他们推出了一个全新的、价值百万美元的超硬核 benchmark —— SWE-Lancer! 具体是啥,我们来扒一扒划重点:什么是 SWE-Lancer?
2/19/2025 9:34:01 AM
AI寒武纪

官宣!OpenAI前CTO新公司:北大校友翁荔加盟,创始29人2/3来自OpenAI

正式官宣! OpenAI前CTO Mira Murati 成立新公司——Thinking Machines Lab。 整个创业团队可以说前所未有之豪华了,三分之二的都是以前的OpenAI旧部追随——其中包括OpenAI前研究(后训练)副总裁Barret Zoph,担任公司CTO;刚刚离职Anthropic、OpenAI离职联创John Schulman,任公司首席科学家,还有包括前OpenAI VP、北大校友翁荔等等。
2/19/2025 9:20:30 AM
量子位

Deepseek 这么厉害,普通人怎么用好它?

最近,Deepseek 的风头可谓是一时无两,相关消息一波接着一波。 它强大的能力让人惊叹不已,写代码、做翻译、生成文案……简直无所不能! 不少小伙伴跃跃欲试,却又担心自己不是程序员、不会写代码,用不好这么“高大上”的工具。
2/19/2025 8:50:05 AM
架构精进之路

本地运行 DeepSeek-R1 的成本究竟多高?

DeepSeek 让人们对大规模生成式模型的追求更进一步,甚至有人想在本地跑下规模高达 671B 参数的版本。 但要在家里开这种“巨无霸”,可不是闹着玩的:光是推理就对硬件提出了非常高的要求。 这篇文章将大致拆解一下,如果真想在个人电脑上运行 DeepSeek-R1,可能需要的硬件和费用是多少。
2/19/2025 8:33:18 AM
dev

前OpenAI CTO另立门户,2/3 ChatGPT骨干被挖!北大校友Lilian Weng加盟

离职近5个月,OpenAI前CTO Mira Murati终于官宣了! 新公司名叫「思考机器实验室」(Thinking Machines Lab),将人类价值观编码到AI模型中,让其更安全、更可靠。 Mira任CEO,OpenAI前后训练研究副总Barret Zoph任CTO,OpenAI联创John Schulman任首席科学家。
2/19/2025 8:29:27 AM
新智元

DeepSeek-R1详细解读!

DeepSeek-R1爆火,今天来详细看下。 论文地址::::现有LLMs在推理任务上的改进主要依赖监督微调(SFT)和后训练(Post-Training)方法,但这些方法需要大量人工标注数据且成本高昂。 OpenAI的o1系列模型虽通过扩展推理链(Chain-of-Thought, CoT)提升了性能,但其测试时扩展仍存在挑战。
2/19/2025 8:00:00 AM
GoldMa

基于Deepseek的安全分析工具设计实践

一、分享背景DeepSeek近日红的发紫,春节前发现一个叫Deepseek的LLM送 10 RMB的Token!!!,正巧符合生产工作中拥抱大模型的主旋律,又本着有羊毛必薅的原则配合B站ollama本地部署喂饭视频起了阿里qwen2.5(1.5b)就行Coding辅助。 ollama本地部署Coding模型复制step2:step3:效果:二、工具需求分析GUI化,免去命令行操作,12-80年龄段各类人群均适用。 固定的LLM回复结果,使每一次提问都能得到相同格式的回答(区分在线提问和工具脚本的关键)。
2/19/2025 7:59:06 AM
沈家伟

超简单:三步教你搞定DeepSeek本地部署

最近,国产AI神器DeepSeek爆火,其深度思考能力完美的体现了DeepSeek先进的算力和优越的性能。 可以这么说,DeepSeek的问世,推动了AI大模型的跨越式发展。 作为一款AI领域的现象级产品,DeepSeek的用户量在短时间内暴增,服务器也被大量攻击,不少小伙伴在使用DeepSeek时,经常会出现服务器繁忙的提示。
2/19/2025 7:53:19 AM
冰河

新手必看:用DeepSeek轻松产出爆款,三分钟掌握自媒体全流程

今天来分享如何利用 DeepSeek 高效创作自媒体文章,自媒体账号的打造和内容创作是一个系统性工程。 本文将详细拆解如何利用 DeepSeek 完成从账号定位到爆款内容创作的全流程,帮助你快速脱颖而出。 一、账号定位与赛道分析:知己知彼,精准切入1.
2/19/2025 12:07:56 AM
宇宙之一粟

自动化、高精度,告别人工测量!Meta SAM模型高效解析复杂纳米颗粒

编辑 | 2049在材料科学领域,纳米颗粒的形态特征直接决定了其物理化学性质与应用潜力。 然而,面对电子显微镜图像中数以千计的颗粒,传统的人工测量方法需要耗费数十小时,且易受主观偏差影响;而基于分水岭算法等半自动工具,则难以准确分割高度重叠的复杂颗粒结构。 德国康斯坦茨大学与巴西米纳斯吉拉斯联邦大学的研究团队提出了一种创新解决方案:利用预训练人工智能模型(Segment Anything Model, SAM)实现纳米颗粒的自动化分割与形态分析。
2/18/2025 4:26:00 PM
ScienceAI

AI应用圈大事周更新,Figure创始人推荐:国产机器人硬抗“胸口碎大石”,宇树机器人丝滑跳舞算法更新,日本惊现攻击人类的机器狗

出品 | 51CTO技术栈(微信号:blog51cto)开工后的第一周,DeepSeek的各种“疯狂接入”有没有把你弄蒙圈了,还是冷静下来看一看有哪些被你忽视的关键AI应用和产品的发布吧! 下面这份重要的总结出于Figure创始人Brett Adcock的汇总,值得大家细细研究。 Brett 汇总了来自Booster Robotics、Adobe、OpenAI、Figure、字节跳动、谷歌、Perplexity、Apptronik、Humanoid、Mentee Robotics等公司的最新消息。
2/18/2025 4:25:53 PM

AI看照片,几秒就能地理定位!因太危险被公司主动关闭,正向警方推销

在看刑侦片的时候,每当破案遇阻,你是否想象过,一种能够仅基于一张嫌疑人出现的场景照片,就即刻定位到场景所在地的具体经纬度的技术呢? 现在,这种想象,已然成为现实! 初创AI公司graylark发布了一项名为「GeoSpy」的系列产品,因其是一个革命性的照片地理定位系统,近来引发热议。
2/18/2025 3:30:00 PM
新智元

“地表最强”Grok 3震撼登场,马斯克演示却“小翻车”,网友调侃:加上擎天柱才是AGI!几个月后还将开源!

出品 | 51CTO技术栈(微信号:blog51cto)编辑 | 伊风、言征跳票多次! Grok 3终于来了! 此前,DeepSeek创造的破圈奇迹,把硅谷的大模型公司全部笼罩在阴影之下。
2/18/2025 3:16:25 PM
伊风