编程
Claude 3.7登顶编程竞技场,大幅领先100分!最新布料模拟实测再惊艳网友
公认的编程开发能力第一! Claude 3.7 Sonnet刚刚登顶WebDev竞技场榜首。 大幅甩第二名100多分,在榜单前十的其它相邻模型分差仅为几分、几十分的情况下。
2/28/2025 9:00:00 AM
量子位
Kimi k1.6模型曝光:编程能力超越GPT-3,引领AI新风潮
最近,来自全球知名动态基准测试平台 LiveCodeBench 的信息显示,Kimi 最新发布的 k1.6模型在编程能力方面表现卓越,已经超越了 OpenAI 的 GPT-3(包括 o3mini 和 o1等版本),登上了性能排行榜的第一名。 这一消息无疑为科技界带来了激动与期待。 据月之暗面的研究员 Flood 透露,k1.6是在 k1.5的基础上进行训练和优化的,目前其性能仍在不断提升中。
2/27/2025 5:07:00 PM
AI在线
AI 编码 2.0 分析、思考与探索实践:从 Cursor Composer 到 AutoDev Sketch
在周末的公司【AI4SE 效能革命与实践:软件研发的未来已来】直播里,我分享了《AI编码工具 2.0 从 Cursor 到 AutoDev Composer》主题演讲,分享了 AI 编码工具 2.0 的核心、我们的思考、以及我们的 AI 编码工具 2.0 探索实践。 在这篇文章中,我将分享这次演讲的内容,希望能够给大家带来一些启发。 一、AI 编程工具 2.0 (趋势分析)我们分析了市面上最受欢迎的 AI 编程工具,如 Cursor、GitHub Copilot Edit、WindSurf、Cline 等,简单总结一下新一代 AI 编程工具的特点:图片AI 编程工具正在从代码补全、代码预测,到更加智能、更耗费 token 的 AI 自动化编码与验证,以及正在发展中的异步 AI 编码。
2/27/2025 1:00:00 AM
Phodal
AI编程工具Cursor已集成Claude 3.7 Sonnet推理模型
刚刚,Cursor AI宣布已集成Claude 3.7 Sonnet,并更新了用户界面,使其更加简洁易用。 此外,Cursor还引入了跨聊天对话功能,能够自动总结聊天摘要并继承到新开的聊天窗口中,进一步提升了用户体验。 早些时候,Anthropic公司正式发布其最新推理模型——Claude3.7Sonnet。
2/25/2025 8:26:00 AM
AI在线
14岁出道编程天才:新一代码农不会写代码了,AI正培养「文盲程序员」!
AI辅助编程的时代已经到来,代码生成工具触手可及。 这本应是开发效率的巨大飞跃,但一个令人不安的问题却浮出水面:我们是否正在培养出一批只会「复制粘贴」,却对代码底层逻辑一知半解的程序员? 当便捷的AI工具取代了艰苦的学习和思考过程,我们是否在无意中扼杀了真正的技术创新和深度理解?
2/24/2025 9:40:00 AM
新智元
OpenAI 最新研究:当前 AI 模型仍无法媲美人类程序员
尽管 OpenAI 首席执行官萨姆・奥尔特曼(Sam Altman)坚称,到今年年底,人工智能模型将能够超越“低级别”软件工程师,但该公司研究人员的最新研究却表明,即使是目前最先进的 AI 模型,仍无法与人类程序员相媲美。
2/24/2025 9:25:21 AM
远洋
AI智能体结对编程秒杀人类,90分钟神作惊动OpenAI总裁!引全网140万围观
无需人类插手,AI智能体联手AI智能体竟完成了程序开发。 这简直太疯狂了! 最近,AI开发者Lamar将OpenAI Operator和Replit Agent配对后,让其构建应用程序。
2/24/2025 8:36:00 AM
新智元
比尔盖茨自述:中学时期就开始偷偷996写代码
57年前的西雅图冬夜,一个瘦削少年翻出卧室窗户,奔向名为“C的立方”的计算机实验室。 比尔·盖茨不会想到,这段在寒夜中追逐代码的岁月,正悄然叩响数字时代的大门。 当湖滨中学的编程少年们以无偿劳动换取珍贵的上机时间时,一场改变人类文明进程的变革已在晶体管与二进制中孕育——在这个数字时代的黎明,一群年轻的先驱者站在了浪潮之巅,他们以智慧和勇气,开辟了一个全新的领域:个人计算机软件。
2/21/2025 9:10:00 AM
量子位
OpenAI掀「百万美金」编程大战!Claude 3.5 Sonnet狂赚40万拿下第一
昨天马斯克刚刚发布了号称「地表最聪明」的Grok 3模型,抢走了所有关注。 这边OpenAI就开始坐不住了,立刻扔出了SWE-Lancer(AI编码测试基准),看一下AI到底能在现实任务中挣到多少钱。 SWE-Lance是一个全新的、更贴近现实的基准测试,用于评估AI模型的编码性能。
2/19/2025 4:01:37 PM
新智元
OpenAI推出真实世界百万报酬AI编程能力测试基准:实测Claude 3.5 最强!
OpenAI 联合一众大佬发布了一项重磅研究,直接把目光瞄准了 真实世界的软件工程! 🔥 他们推出了一个全新的、价值百万美元的超硬核 benchmark —— SWE-Lancer! 具体是啥,我们来扒一扒划重点:什么是 SWE-Lancer?
2/19/2025 9:34:01 AM
AI寒武纪
比尔盖茨自述曾是熊孩子:16岁徒步数百英里,边走脑中边写BASIC代码
步入70岁之际,比尔·盖茨终于出版了自己人生中的首部自传《源代码》。 不同于以往的商业发展视角,无关对微软成就的宏大叙事,在这本书里,比尔·盖茨自己的成长历程和创业故事一一铺陈开:生在一个优秀的家庭,撞上历史性技术变革与乐观情绪弥漫的时代,自己在个人电脑革命方兴未艾之时步入成年……过去十几年,比尔·盖茨一直站在技术发展的潮头浪尖,他关于科技、计算机、AI的每一次预测和思考都引人注目。 今年1月13日,他在阿联酋的阿布扎比CNN学院,分享了自己关于AI基数的最新洞见。
2/14/2025 9:05:00 AM
量子位
OpenAI内部模型曝光!编程能力跻身全球Top50程序员,年底不再有人类对手
除了o1/o3,OpenAI另一个尚未公开的内部推理模型曝光了。 爆料者正是CEO奥特曼本人。 据他透露,与全球顶尖程序员相比,当前这一内部模型的编程能力已达Top50,甚至今年年底将排名第一。
2/10/2025 9:20:00 AM
量子位
新增AI Agent,GitHub Copilot重大更新,超强自动化编程
全球最大开源平台之一GitHub在官网宣布,对AI编程助手Copilot进行了重磅更新,增加AI Agent模式,可以自动迭代代码,识别并修复BUG。 GitHub同时还发布了另一个Agent—Project Padawan的预览版,主要协助开发人员自动执行一些重复、繁琐的开发流程,例如,设置开发环境、运行测试、合并代码等。 此外,GitHub在去年10月推出的Copilot.
2/8/2025 11:30:00 AM
AIGC开放社区
AI编程L1-L5超全分级来了!GitHub Copilot仅L1,Devin是L4
AI恰似一把神奇的钥匙,悄然开启了编程领域的全新大门。 从代码补全到项目级自动化,AI的角色从「助手」转变为「工程师」,甚至是「开发团队」,极大地改变了软件开发的传统格局。 借鉴自动驾驶的术语,AI编程工具可以划分为L1到L5五个等级。
2/6/2025 9:40:00 AM
新智元
会用ChatGPT≠工程师,谷歌资深员工发文,揭秘AI编程不为人知的真相
尽管程序员们纷纷反馈用上AI辅助之后,工作效率提升,但我们用到的软件中bug依旧不少。 针对这一现象,前谷歌产品经理Peter Szalontay,以及现任的谷歌Chrome的工程团队领导Addy Osmani都给出了自己的分析,并提供了一些如何使用AI辅助编程的建议。 AI编码工具的黑暗真相1月7日,前谷歌产品经理Peter Szalontay发推,并配上了一个令人惊心动魄的标题:「无人谈论的AI编码工具的黑暗真相」。
1/24/2025 9:10:00 AM
新智元
刚刚,OpenAI首个智能体提前曝光!高级编码AI剑指400万年薪L6级工程师
AGI或许就在本周? 刚刚外媒爆料称,OpenAI暗藏的首个智能体项目「Operator」即将发布。 网友发现Operator已登陆ChatGPT,不过可能Pro用户最先用上这款AI智能体将与ChatGPT深度集成,直接可以接管你的屏幕,自动化完成任务。
1/24/2025 9:00:00 AM
新智元
返老还童,OpenAI做到了?首个逆龄AI将登场,人类寿命可延长10年
超级智能要来了? 人类「长生不老」有希望了? 外媒称,OpenAI开发出了首款用于「长寿」的AI模型 ——GPT-4b micro,预计将人类寿命延长10年。
1/20/2025 9:13:00 AM
新智元
重磅!微软发布新AI Agent,集成在office全家桶、自动化时代来了
今天凌晨,微软在官网发布了全新企业级AI助手——Microsoft 365 Copilot Chat。 Copilot Chat除了支持的传统的文本生成、文件分析(PDF、Word等)、图像生成之外,最大亮点便是支持AI Agent功能,并且集成在了Microsoft 365商业版中,可直接调用企业自有数据,执行夸端到端的超复杂自动化业务流程。 例如,在供应链管理中,Copilot Chat能够实时监控库存水平,根据销售数据和市场趋势预测需求,自动生成采购订单,并协调物流配送,提升整个供应链工作效率。
1/16/2025 10:07:44 AM
AIGC开放社区
资讯热榜
阿里推出 AI 医学助手 App“氢离子”:收录千万级核心期刊文献,还可查疾病、找药品
Lovart 实战深度测评!仅需4小时帮你完成一整套品牌全案设计!
OpenAI 董事会主席:如果你想快速烧掉百万美元,就开发自己的 AI 模型吧
Meta 被指控盗用 2000 余部成人影片训练 AI,或面临 3.5 亿美元天价赔偿
刷新无监督异常检测上限!首提「匹配代价滤波for异常检测」范式 | ICML'25
行业首个 100% 开源的企业级智能体,京东云开源 JoyAgent
2025 世界人工智能大会今日开幕:百余款首发首秀,规模创历届之最
AI和云基础设施初创企业E2B如何成为88%的财富100强企业的必备选择
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用