软件
从需求分析到代码生成,LLM都能干点啥?一文读懂291个软工Benchmark!
近年来,ChatGPT、Llama等大语言模型在软件工程领域的能力突飞猛进,从需求分析、代码生成到测试与维护几乎无所不能。 但一个核心问题是:我们如何客观评估这些模型在不同软件工程任务中的表现? 在SE领域,Benchmark既是分数卡,让不同模型在同一标准下比拼;也是方向盘,引导技术改进与未来研究方向。
8/28/2025 9:10:00 AM
16岁炒马斯克鱿鱼,SpaceX天才转投北大数学校友赵鹏麾下
16岁的天才小孩哥挥一挥衣袖,宣布从SpaceX离职了。 2年前,14岁的Kairan Quazi从圣克拉拉大学毕业,被马斯克pick,加入入职成功率仅有0.2%的SpaceX,成为Starlink部门最年轻的软件工程师——这是SpaceX工程密度最高的部门之一。 现在,智商超过180的Kairan转身离开,下一站:干金融,搞量化。
8/19/2025 4:17:49 PM
ChatGPT惊现“零点击攻击”,API密钥被轻松泄露,OpenAI暂未解决
ChatGPT存在“零点击攻击”安全问题。 用户无需点击,攻击者也能从ChatGPT连接的第三方应用窃取敏感数据,甚至窃取API密钥。 一位研究软件安全问题,名为塔米尔·伊沙雅·沙尔巴特(Tamir Ishay Sharbat)的小哥发了篇文章说道。
8/13/2025 9:05:00 AM
软件开发成本归零倒计时:AI工具正在颠覆整个行业
想象一下这个场景:一个周末的下午,你打开电脑,输入一句话"帮我做一个在线任务管理应用",然后去泡了杯咖啡。 等你回来时,一个功能完整、界面精美的应用已经躺在那里,连数据库都配置好了。 这不是科幻电影的桥段,而是现在正在发生的现实。
8/12/2025 9:15:11 AM
阿丸笔记
黄仁勋预言成真!AI智能体成GitHub主力,一天顶人类一年
最近,来自加拿大女王大学的一项最新研究,首次揭示了AI编程智能体如何大规模渗透开源社区。 论文地址::: Pull Request(PR,代码修改请求)发现,OpenAI Codex、GitHub Copilot和Claude Code等AI编程智能体已超越简单的代码补全角色,正作为真正的「AI程序员」活跃在开源一线:它们能独立发起PR、参与评审,甚至与人类开发者就修改方案展开「讨论」。 这标志着软件工程正式迈入知名AI科学家Andrej Karpathy所预言的3.0时代—AI从工具升级为协作伙伴,全球已有超过6.1万个开源项目开始接纳AI编程智能体作为「同事」。
8/6/2025 9:26:56 AM
不会被AI替代?100年前的农民也这么想的,这些图表让你害怕!
「我的岗位太复杂不会被AI替代的」。 如果你还在抱着这种看法来看待如今的AI时代,那你99%要完蛋了。 SAFE.没有任何工作是安全的。
6/30/2025 9:07:00 AM
AI 智能体到底应该如何构建?分享 Github 上收获 4k stars 的 12 条原则
1.AI Agent 是如何走到今天的1.1 我的观点仅供参考无论您是智能体领域的新手,还是像我这样固执的老兵,我都将试图说服您摒弃对 AI Agent 的大部分固有认知,退一步,从第一性原理(first principles)出发重新思考它们。 (如果你错过了不久前 OpenAI 发布的内容,这里有个剧透预警:把更多智能体逻辑塞进 API 后面并非正解)2.智能体本质上是软件,让我们简要追溯其发展历程让我们回溯智能体的发展脉络。 2.1 60 年前这个阶段重点探讨的是有向图(DGs)及其无环版本 —— 有向无环图(DAGs)。
6/13/2025 3:11:00 AM
BaihaiI DP
Andrej Karpathy最新暴论:这类软件正走向绝境,PS首当其冲?
Andrej Karpathy最新观点,觉得很有意思,分享给大家Karpathy 认为在人机协作日益紧密的时代,那些拥有复杂用户界面(UI)、充斥着大量滑块、开关、菜单,却缺乏脚本支持,并且建立在不透明、自定义二进制格式之上的软件产品,其前景堪忧Karpathy 的核心观点是,如果大型语言模型(LLM)无法读取软件的底层数据表示,也无法通过脚本来操作相关的设置和功能,那么这款产品就很难实现与专业人士的智能协同(AI Co-pilot),更无法赋能给数量庞大十倍、富有创造力的“产消者”(prosumers),让他们通过更接近自然语言的“氛围编程”(vibe coding)方式来驾驭产品他列举了不同风险等级的软件产品:高风险区:几乎所有的 Adobe 产品、数字音频工作站(DAWs)、CAD/3D建模软件。 这些产品严重依赖不透明的二进制对象或自定义文件格式,缺乏文本化的领域特定语言(DSL)支持。 AI难以理解其内部结构,更不用说进行编程控制中高风险区:Blender、Unity。
6/5/2025 9:03:39 AM
25岁MIT辍学天才一战成名!3年成为90亿美金公司CEO
硅谷又出现了一位新的天才。 AI浪潮中,一位年仅25岁的远见者正以惊人的速度改写着软件开发的未来,他就是Michael Truell,AI代码编辑器Cursor背后的母公司Anysphere的CEO。 Cursor仅仅用了12个月,ARR就达到了一亿美元,多篇业内分析认定Cursor是 「SaaS史上最快到$100M ARR的初创公司」。
5/15/2025 9:02:00 AM
Git诞生20周年!大佬Linus十天写出的项目,彻底变革全球软件开发
转眼间Git诞生20周年了! 为了给Git庆生,如今鲜少公开露面的Linus罕见接受采访,更多幕后故事被更进一步展开。 2005年4月7日,Linux之父Linus Torvalds,提交了Git的首个版本。
4/9/2025 8:50:00 AM
量子位
2025年人工智能领域即将发生的四大变革
2025年AI四大变革! 开发团队拥抱AI,从被动到主动;科技巨头主导GPU/TPU基础设施;开源LLM质量飙升,加速AI民主化;ModelOps融入SDLC,DataOps MLOps成关键。 译自:Four Transformational Changes Coming to AI in 2025作者:David DeSanto在过去的两年里,人工智能在软件开发中的应用呈指数级增长,而且这种趋势将在明年继续。
3/28/2025 8:26:19 AM
岱军
AI引爆全美失业潮,12个月内接管所有代码!3亿岗位被取代,70%职业大换血
AI,正在改变生活。 LinkedIn的新研究显示,很大程度上因为AI,到2030年,大多数职业的70%技能将发生变化。 然而,更大的AI的冲击或许就要到来:AI永久性地改变就业市场,并带来大规模失业。
3/25/2025 9:12:53 AM
新智元
人工智能到底是啥?今天彻底讲明白!
想象一下,你家里突然多了个超级聪明的机器人管家。 你对它说:“帮我点杯奶茶! ” 它立刻打开外卖软件,选好你最喜欢的口味,还自动用优惠券帮你省钱。
3/10/2025 11:48:10 AM
快乐程序猿
初创公司 Cambium 利用 AI 技术将废弃木材转化为可用木材
在美国的城市和郊区,树木被砍伐后,很多情况下并没有被制成木材,而是被直接粉碎。 这一现象令 Ben Christensen 深感不满。 Christensen 生长在新墨西哥州,家庭与木材行业有着深厚的渊源,父亲是一名木工,这让他对树木有着深切的尊重。
2/25/2025 11:31:00 AM
AI在线
DeepSeek是新源神!推理模型o1性能1/50价格,微调/数据/商用全免费,蒸馏1.5B小模型可比GPT-4o
DeepSeek新发布远超预期,Reddit/𝕏狂暴刷屏中。 这次大事共有3件:开源DeepSeek-R1推理大模型,与o1性能相近。 开源DeepSeek-R1-Zero,预训练模型直接RL,不走SFT,堪称语言模型的AlphaZero。
1/21/2025 10:10:56 AM
小红书AI翻译加急上线,网友评论区玩起Prompt,背后大模型被扒出
网友盛赞“最有用的大模型应用”,小红书AI翻译功能上线了! (Doge)一整个实测发现,实在是太好用了。 翻译软件做到的它能做,翻译软件不能做的它也能做。
1/20/2025 3:50:00 PM
量子位
微软打响裁员第一枪!AI智能体引爆2025失业潮,硅谷巨头停招程序员
去年12月,OpenAI公布了o3在代码方面的巨大进步。 有CS毕业生感觉专业白学了:找到对口工作的CS毕业生,可能还在庆幸,毕竟o3还只对安全研究员开放,没有进入市场,而且性价比可能也比较低。 但这次「狼」真的来了!
1/9/2025 1:41:14 PM
新智元
AI掌控编码人类狂按Tab,软件工程自主时代来临!OpenAI董事长Taylor重磅长文
2024年额度几近用完。 这一年,你认为AI对软件工程师最大的影响是什么? 今年3月,世界首个AI程序员Devin一出世,全网惊呼一切完结了!
12/30/2024 9:00:00 AM
新智元
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
马斯克
智能体
AI创作
Anthropic
英伟达
论文
AI新词
代码
训练
算法
Stable Diffusion
LLM
芯片
蛋白质
腾讯
开发者
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
华为
AI设计
工具
RAG
大语言模型
搜索
字节跳动
具身智能
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
特斯拉
应用
DeepMind