AI在线 AI在线

软件

从需求分析到代码生成,LLM都能干点啥?一文读懂291个软工Benchmark!

近年来,ChatGPT、Llama等大语言模型在软件工程领域的能力突飞猛进,从需求分析、代码生成到测试与维护几乎无所不能。 但一个核心问题是:我们如何客观评估这些模型在不同软件工程任务中的表现? 在SE领域,Benchmark既是分数卡,让不同模型在同一标准下比拼;也是方向盘,引导技术改进与未来研究方向。
8/28/2025 9:10:00 AM

16岁炒马斯克鱿鱼,SpaceX天才转投北大数学校友赵鹏麾下

16岁的天才小孩哥挥一挥衣袖,宣布从SpaceX离职了。 2年前,14岁的Kairan Quazi从圣克拉拉大学毕业,被马斯克pick,加入入职成功率仅有0.2%的SpaceX,成为Starlink部门最年轻的软件工程师——这是SpaceX工程密度最高的部门之一。 现在,智商超过180的Kairan转身离开,下一站:干金融,搞量化。
8/19/2025 4:17:49 PM

ChatGPT惊现“零点击攻击”,API密钥被轻松泄露,OpenAI暂未解决

ChatGPT存在“零点击攻击”安全问题。 用户无需点击,攻击者也能从ChatGPT连接的第三方应用窃取敏感数据,甚至窃取API密钥。 一位研究软件安全问题,名为塔米尔·伊沙雅·沙尔巴特(Tamir Ishay Sharbat)的小哥发了篇文章说道。
8/13/2025 9:05:00 AM

软件开发成本归零倒计时:AI工具正在颠覆整个行业

想象一下这个场景:一个周末的下午,你打开电脑,输入一句话"帮我做一个在线任务管理应用",然后去泡了杯咖啡。 等你回来时,一个功能完整、界面精美的应用已经躺在那里,连数据库都配置好了。 这不是科幻电影的桥段,而是现在正在发生的现实。
8/12/2025 9:15:11 AM
阿丸笔记

黄仁勋预言成真!AI智能体成GitHub主力,一天顶人类一年

最近,来自加拿大女王大学的一项最新研究,首次揭示了AI编程智能体如何大规模渗透开源社区。 论文地址::: Pull Request(PR,代码修改请求)发现,OpenAI Codex、GitHub Copilot和Claude Code等AI编程智能体已超越简单的代码补全角色,正作为真正的「AI程序员」活跃在开源一线:它们能独立发起PR、参与评审,甚至与人类开发者就修改方案展开「讨论」。 这标志着软件工程正式迈入知名AI科学家Andrej Karpathy所预言的3.0时代—AI从工具升级为协作伙伴,全球已有超过6.1万个开源项目开始接纳AI编程智能体作为「同事」。
8/6/2025 9:26:56 AM

不会被AI替代?100年前的农民也这么想的,这些图表让你害怕!

「我的岗位太复杂不会被AI替代的」。 如果你还在抱着这种看法来看待如今的AI时代,那你99%要完蛋了。 SAFE.没有任何工作是安全的。
6/30/2025 9:07:00 AM

AI 智能体到底应该如何构建?分享 Github 上收获 4k stars 的 12 条原则

1.AI Agent 是如何走到今天的1.1 我的观点仅供参考无论您是智能体领域的新手,还是像我这样固执的老兵,我都将试图说服您摒弃对 AI Agent 的大部分固有认知,退一步,从第一性原理(first principles)出发重新思考它们。 (如果你错过了不久前 OpenAI 发布的内容,这里有个剧透预警:把更多智能体逻辑塞进 API 后面并非正解)2.智能体本质上是软件,让我们简要追溯其发展历程让我们回溯智能体的发展脉络。 2.1 60 年前这个阶段重点探讨的是有向图(DGs)及其无环版本 —— 有向无环图(DAGs)。
6/13/2025 3:11:00 AM
BaihaiI DP

Andrej Karpathy最新暴论:这类软件正走向绝境,PS首当其冲?

Andrej Karpathy最新观点,觉得很有意思,分享给大家Karpathy 认为在人机协作日益紧密的时代,那些拥有复杂用户界面(UI)、充斥着大量滑块、开关、菜单,却缺乏脚本支持,并且建立在不透明、自定义二进制格式之上的软件产品,其前景堪忧Karpathy 的核心观点是,如果大型语言模型(LLM)无法读取软件的底层数据表示,也无法通过脚本来操作相关的设置和功能,那么这款产品就很难实现与专业人士的智能协同(AI Co-pilot),更无法赋能给数量庞大十倍、富有创造力的“产消者”(prosumers),让他们通过更接近自然语言的“氛围编程”(vibe coding)方式来驾驭产品他列举了不同风险等级的软件产品:高风险区:几乎所有的 Adobe 产品、数字音频工作站(DAWs)、CAD/3D建模软件。 这些产品严重依赖不透明的二进制对象或自定义文件格式,缺乏文本化的领域特定语言(DSL)支持。 AI难以理解其内部结构,更不用说进行编程控制中高风险区:Blender、Unity。
6/5/2025 9:03:39 AM

25岁MIT辍学天才一战成名!3年成为90亿美金公司CEO

硅谷又出现了一位新的天才。 AI浪潮中,一位年仅25岁的远见者正以惊人的速度改写着软件开发的未来,他就是Michael Truell,AI代码编辑器Cursor背后的母公司Anysphere的CEO。 Cursor仅仅用了12个月,ARR就达到了一亿美元,多篇业内分析认定Cursor是 「SaaS史上最快到$100M ARR的初创公司」。
5/15/2025 9:02:00 AM

Git诞生20周年!大佬Linus十天写出的项目,彻底变革全球软件开发

转眼间Git诞生20周年了! 为了给Git庆生,如今鲜少公开露面的Linus罕见接受采访,更多幕后故事被更进一步展开。 2005年4月7日,Linux之父Linus Torvalds,提交了Git的首个版本。
4/9/2025 8:50:00 AM
量子位

2025年人工智能领域即将发生的四大变革

2025年AI四大变革! 开发团队拥抱AI,从被动到主动;科技巨头主导GPU/TPU基础设施;开源LLM质量飙升,加速AI民主化;ModelOps融入SDLC,DataOps MLOps成关键。 译自:Four Transformational Changes Coming to AI in 2025作者:David DeSanto在过去的两年里,人工智能在软件开发中的应用呈指数级增长,而且这种趋势将在明年继续。
3/28/2025 8:26:19 AM
岱军

AI引爆全美失业潮,12个月内接管所有代码!3亿岗位被取代,70%职业大换血

AI,正在改变生活。 LinkedIn的新研究显示,很大程度上因为AI,到2030年,大多数职业的70%技能将发生变化。 然而,更大的AI的冲击或许就要到来:AI永久性地改变就业市场,并带来大规模失业。
3/25/2025 9:12:53 AM
新智元

人工智能到底是啥?今天彻底讲明白!

想象一下,你家里突然多了个超级聪明的机器人管家。 你对它说:“帮我点杯奶茶! ” 它立刻打开外卖软件,选好你最喜欢的口味,还自动用优惠券帮你省钱。
3/10/2025 11:48:10 AM
快乐程序猿

初创公司 Cambium 利用 AI 技术将废弃木材转化为可用木材

在美国的城市和郊区,树木被砍伐后,很多情况下并没有被制成木材,而是被直接粉碎。 这一现象令 Ben Christensen 深感不满。 Christensen 生长在新墨西哥州,家庭与木材行业有着深厚的渊源,父亲是一名木工,这让他对树木有着深切的尊重。
2/25/2025 11:31:00 AM
AI在线

DeepSeek是新源神!推理模型o1性能1/50价格,微调/数据/商用全免费,蒸馏1.5B小模型可比GPT-4o

DeepSeek新发布远超预期,Reddit/𝕏狂暴刷屏中。 这次大事共有3件:开源DeepSeek-R1推理大模型,与o1性能相近。 开源DeepSeek-R1-Zero,预训练模型直接RL,不走SFT,堪称语言模型的AlphaZero。
1/21/2025 10:10:56 AM

小红书AI翻译加急上线,网友评论区玩起Prompt,背后大模型被扒出

网友盛赞“最有用的大模型应用”,小红书AI翻译功能上线了! (Doge)一整个实测发现,实在是太好用了。 翻译软件做到的它能做,翻译软件不能做的它也能做。
1/20/2025 3:50:00 PM
量子位

微软打响裁员第一枪!AI智能体引爆2025失业潮,硅谷巨头停招程序员

去年12月,OpenAI公布了o3在代码方面的巨大进步。 有CS毕业生感觉专业白学了:找到对口工作的CS毕业生,可能还在庆幸,毕竟o3还只对安全研究员开放,没有进入市场,而且性价比可能也比较低。 但这次「狼」真的来了!
1/9/2025 1:41:14 PM
新智元

AI掌控编码人类狂按Tab,软件工程自主时代来临!OpenAI董事长Taylor重磅长文

2024年额度几近用完。 这一年,你认为AI对软件工程师最大的影响是什么? 今年3月,世界首个AI程序员Devin一出世,全网惊呼一切完结了!
12/30/2024 9:00:00 AM
新智元