资讯列表
全球首测!OpenAI开源SWELancer,大模型冲击100万年薪
今天凌晨2点,OpenAI开源了一个全新评估大模型代码能力的测试基准——SWE-Lancer。 目前,测试模型代码能力的基准主要有SWE-Bench和SWE-BenchVerified,但这两个有一个很大的局限性,主要针对孤立任务,很难反映现实中软件工程师的复杂情况。 例如,开发人员需处理全技术栈的工作,要考虑代码库间的复杂交互和权衡。
2/19/2025 9:40:58 AM
AIGC开放社区
OpenAI推出真实世界百万报酬AI编程能力测试基准:实测Claude 3.5 最强!
OpenAI 联合一众大佬发布了一项重磅研究,直接把目光瞄准了 真实世界的软件工程! 🔥 他们推出了一个全新的、价值百万美元的超硬核 benchmark —— SWE-Lancer! 具体是啥,我们来扒一扒划重点:什么是 SWE-Lancer?
2/19/2025 9:34:01 AM
AI寒武纪
OpenAI 举报者之死疑云重重,家属送检有疑头发样本
OpenAI 举报者苏奇尔・巴拉吉(Suchir Balaji)的尸检报告近日已交给其家属。 然而,巴拉吉的家人对其被认定为自杀的结论表示怀疑,并表示已将其公寓内发现的一根奇怪的头发样本送往实验室进行检测。 图源备注:图片由AI生成,图片授权服务商Midjourney根据城市验尸官和警方联合发布的报告,调查人员在现场未发现任何证据或信息,能够确定巴拉吉的死因和方式为自杀,死因被认定为自残导致的头部枪伤。
2/19/2025 9:28:00 AM
AI在线
月之暗面Kimi暂停大规模投流 战略重心转向底层模型
国内大模型初创公司月之暗面(Moonshot AI)近日因大幅削减市场投放预算再次引发业界关注。 据界面新闻报道,月之暗面已暂停多个安卓渠道及第三方广告平台的投放。 此前,月之暗面以激进的市场策略著称,2024年9月起每月在营销和流量获取上的投入高达近2亿元,重点投放平台包括小红书、B站、知乎等。
2/19/2025 9:27:00 AM
AI在线
官宣!OpenAI前CTO新公司:北大校友翁荔加盟,创始29人2/3来自OpenAI
正式官宣! OpenAI前CTO Mira Murati 成立新公司——Thinking Machines Lab。 整个创业团队可以说前所未有之豪华了,三分之二的都是以前的OpenAI旧部追随——其中包括OpenAI前研究(后训练)副总裁Barret Zoph,担任公司CTO;刚刚离职Anthropic、OpenAI离职联创John Schulman,任公司首席科学家,还有包括前OpenAI VP、北大校友翁荔等等。
2/19/2025 9:20:30 AM
量子位
小红书重点打击黑灰产团伙用AIGC大模型大规模矩阵养号行为
日前,小红书发布了最新的 “黑灰产账号治理阶段进展公告”,宣布在过去三个月内,共计处置了超过320万的黑灰产账号。 根据公告,截至2023年2月17日,小红书的 “薯管家” 团队在治理过程中,发现并处理了401个拥有10万以上粉丝的账号,以及9215个拥有1万以上粉丝的账号。 这表明黑灰产账号在社区内的影响力不容小觑。
2/19/2025 9:16:00 AM
AI在线
“ChatGPT之母”官宣创办新 AI 公司:思维机器实验室
前 OpenAI 首席技术官 Mira Murati 在去年秋天突然离开 OpenAI 后,开始了她的新创业旅程。 近日,她向外界透露了自己正在筹备的新 AI 初创公司,名为 “思维机器实验室”(Thinking Machines Lab)。 虽然具体的产品细节尚未公开,但这家公司明确表示,其目标是让 AI 系统更加易于理解、可定制,并且具备更广泛的能力。
2/19/2025 9:05:00 AM
AI在线
李彦宏回应开源文心4.5:DeepSeek让我们明白要开源
近日,百度创始人李彦宏在百度2024年四季度及全年财报电话会上,就公司决定开源文心大模型4.5系列的原因进行了详细阐述。 李彦宏指出,百度从DeepSeek项目中汲取了宝贵经验,即开源最佳模型能够极大地促进用户对该模型的采用和认可。 他解释称,当一个模型被开源后,人们的好奇心会驱使他们进行尝试,这种自然的探索行为有助于模型更广泛地应用于实际场景中。
2/19/2025 9:00:24 AM
AI在线
Deepseek 这么厉害,普通人怎么用好它?
最近,Deepseek 的风头可谓是一时无两,相关消息一波接着一波。 它强大的能力让人惊叹不已,写代码、做翻译、生成文案……简直无所不能! 不少小伙伴跃跃欲试,却又担心自己不是程序员、不会写代码,用不好这么“高大上”的工具。
2/19/2025 8:50:05 AM
架构精进之路
掀桌子了!DeepSeek开源“双脑模型”Janus-Pro:左脑识图,右脑画图!
DeepSeek 这次直接把桌子掀了! 继把大模型价格打到地板价后,他们最新开源的多模态模型更狠——不仅看得懂《清明上河图》的细节,还能照着你的描述生图。 这个多模态模型就是他们悄悄开源的“双脑”视觉模型 Janus-Pro,被称为“左脑能当福尔摩斯解密图片,右脑能当画家挥毫泼墨。
2/19/2025 8:45:43 AM
言川Artie
短期高估、长期低估:微信接入DeepSeek的产品深度思考
微信搜索接入 DeepSeek 后,我看到了太多 DeepSeek 生成的水文,也看到了太多“王炸”、“里程碑”、“深水炸弹”、“重构 AI 搜索”、“游戏终结”等虎狼之词。 比如这篇,直接把 DeepSeek 幻觉搬上来了. 实在忍不住了,决定出来基于事实和逻辑来一版的冷静分析。
2/19/2025 8:41:48 AM
本地运行 DeepSeek-R1 的成本究竟多高?
DeepSeek 让人们对大规模生成式模型的追求更进一步,甚至有人想在本地跑下规模高达 671B 参数的版本。 但要在家里开这种“巨无霸”,可不是闹着玩的:光是推理就对硬件提出了非常高的要求。 这篇文章将大致拆解一下,如果真想在个人电脑上运行 DeepSeek-R1,可能需要的硬件和费用是多少。
2/19/2025 8:33:18 AM
dev
前OpenAI CTO另立门户,2/3 ChatGPT骨干被挖!北大校友Lilian Weng加盟
离职近5个月,OpenAI前CTO Mira Murati终于官宣了! 新公司名叫「思考机器实验室」(Thinking Machines Lab),将人类价值观编码到AI模型中,让其更安全、更可靠。 Mira任CEO,OpenAI前后训练研究副总Barret Zoph任CTO,OpenAI联创John Schulman任首席科学家。
2/19/2025 8:29:27 AM
新智元
谷歌憋大招:Gemini 将内嵌 AI 视频生成,让人人都能是导演
科技媒体 Android Authority 昨日(2 月 18 日)发布博文,报道称谷歌旗下 AI 助手 Gemini 即将具备生成视频能力。该功能虽未正式上线,但种种迹象表明,谷歌正在积极为 Gemini 添加新功能,旨在打造更强大的 AI 工具。
2/19/2025 8:28:11 AM
故渊
宇树负责人称四足机器人售价有望降至三四千元,真正进入消费级时代
宇树科技一位负责人称四足机器人降到三四千人民币“问题不大”,可以真正进入消费级时代。他认为,目前四足机器人1万人民币的价格,对普通老百姓来说“还是有点贵的”。
2/19/2025 8:24:54 AM
清源
研究:2000 人中仅两人能准确识别深度伪造内容
随着深度伪造技术(deepfake)的不断发展,人们对虚假信息、诈骗和身份盗窃的担忧日益加剧。一项最新研究显示,人们对 AI 工具的认知水平极低,难以有效识别深度伪造内容。
2/19/2025 8:04:25 AM
远洋
DeepSeek-R1详细解读!
DeepSeek-R1爆火,今天来详细看下。 论文地址::::现有LLMs在推理任务上的改进主要依赖监督微调(SFT)和后训练(Post-Training)方法,但这些方法需要大量人工标注数据且成本高昂。 OpenAI的o1系列模型虽通过扩展推理链(Chain-of-Thought, CoT)提升了性能,但其测试时扩展仍存在挑战。
2/19/2025 8:00:00 AM
GoldMa
基于Deepseek的安全分析工具设计实践
一、分享背景DeepSeek近日红的发紫,春节前发现一个叫Deepseek的LLM送 10 RMB的Token!!!,正巧符合生产工作中拥抱大模型的主旋律,又本着有羊毛必薅的原则配合B站ollama本地部署喂饭视频起了阿里qwen2.5(1.5b)就行Coding辅助。 ollama本地部署Coding模型复制step2:step3:效果:二、工具需求分析GUI化,免去命令行操作,12-80年龄段各类人群均适用。 固定的LLM回复结果,使每一次提问都能得到相同格式的回答(区分在线提问和工具脚本的关键)。
2/19/2025 7:59:06 AM
沈家伟