最真实大模型编程评估!字节开源FullStack Bench,首次全覆盖超11类现实编程场景
代码大模型越来越卷,评估AI编程水平的“考卷”也被迫升级。 12月5日,字节豆包大模型团队开源最新代码大模型评估基准FullStack Bench,在业界首次囊括编程全栈技术中超11类真实场景,覆盖16种编程语言,包含3374个问题,相比此前基准,可以更有效地评估大模型在现实世界中的代码开发能力。 代码评估基准是衡量大模型编程能力的标准工具,也是推动模型优化的关键驱动力。- 974
- 0
高效使用Cursor以实现10x编程
译者 | 布加迪审校 | 重楼出品 | 51CTO技术栈(微信号:blog51cto)在生成式人工智能时代,我们的许多工作已发生了巨大的变化,这包括编程工作,大语言模型(LLM)极大地促进了这个过程。 最近,许多基于生成式人工智能的代码辅助工具已纷纷亮相。 许多工具执行同样的任务,但有一款工具备受公众的关注,那就是Cursor。- 969
- 0
试了下Cursor,感觉程序员工种危险了!
大家好,我是汤师爷~今年8月份,AI 编程工具 Cursor 在开发者社区彻底火了。 在 Twitter 平台上,Cloudflare 副总裁分享了一段视频,展示了一个令人震惊的案例。 他年仅 8 岁的女儿,仅用 Cursor AI 这款工具,在短短 45 分钟内,就成功构建了一个功能完整的聊天机器人。- 971
- 0
Claude化身服务器联通一切!AI写好代码自己发Github,人类程序员只配动嘴了
Anthropic又发大礼包! 现在Claude自己就是一台服务器。 能直连GitHub,AI自己写代码、自己创建仓库、Push代码、创建Issue、创建分支、创建PR一条龙服务。- 972
- 0
阿里通义代码模式上线:号称即便不懂编程,也能大白话一键生成应用
通义代码模式基于 Qwen2.5-Coder 模型开发,官方表示即便用户不懂代码和编程,也可用大白话让通义 AI 自动编码,网站、数据图表和小游戏等。- 972
- 0
ChatGPT深夜更新:Mac版支持“读屏编程”,Windows版全员可用了
ChatGPT客户端,支持“读屏编程”了。 即日起,Mac端的Plus用户,可以直接让ChatGPT客户端读取开发工具中的代码。 目前,包括常用的Xcode和VS Code在内,该功能一共支持五款编程工具。- 971
- 0
Java真的能玩AI了?Spring AI轻松接入大模型,几行代码就搞定!
您还在为Java难以对接AI模型而发愁吗? 您是否羡慕Python开发者能轻松调用各种大模型? 您是否也想用熟悉的Java技术栈开发AI应用?- 974
- 0
程序员不应被AI取代写代码,而是写文档!谷歌大牛呼吁:老板们应该倾听开发者心声,现在的AI代码生成器操之过急,风险太大!
编译 | 言征出品 | 51CTO技术栈(微信号:blog51cto)对于“AI帮助生产力提高”这件事情上,开发人员与他们的老板,意见其实非常不一致。 最近, Atlassian-DX DevEx 进行了一项现状调查,结果非常有意思——调查结果显示,公司老板们认为 AI 是提高开发人员生产力和满意度的最有效方法,但高达三分之二的开发人员却不这么想,他们认为实际上没有任何显著的 AI 生产力提升。 …- 970
- 0
用 PyTorch 构建神经网络的 12 个实战案例
用PyTorch构建神经网络是机器学习领域中非常热门的话题。 PyTorch因其易用性和灵活性而受到广大开发者的喜爱。 本文将通过12个实战案例,带你从零开始构建神经网络,逐步掌握PyTorch的核心概念和高级技巧。- 970
- 0
Anthropic 为 Claude 推出 JavaScript 沙盒工具:可 AI 写代码、可上传自有代码运行
Anthropic 现已为 Claude AI 推出了一款 JavaScript 沙盒工具,允许用户利用 Claude 编写 JavaScript 代码、在沙盒环境中上传自己的代码并自动生成运行结果,相应功能目前已作为预览版本向所有用户开放。 此外,Anthropic 还提到 Claude AI 新增的这套沙盒工具允许用户加载本地文件,帮助企业快速处理 / 分析客户数据,快速将相关内容进行可视化处…- 17
- 0
谷歌报告称 76% 的开发者依赖 AI 工具完成编写、解释代码等任务
谷歌于 10 月 23 日发布 2024 年 DevOps 状态报告,称超过 75% 的开发者和 IT 专业人士依赖于人工智能(AI)来处理至少 1 项日常专业任务。 谷歌云(Google Cloud)的 DevOps 研究与评估(DORA)团队调查全球近 3000 名技术专业人士,表明越来越多的人开始使用 AI 技术。 AI在线援引该媒体报道,附上报告中相关数据如下:76% 的受访者表示依赖 A…- 5
- 0
“稚晖君”创业项目,智元机器人宣布灵犀 X1 面向全球开源
智元机器人今日宣布“灵犀 X1”面向全球正式开源,软硬件全套图纸和代码水灵灵地上线到 GitHub 啦,开发指南上线至智元机器人官网。 智元机器人官方称,作为业内首家全栈开源人形机器人图纸和代码的公司,此次开源将毫无保留地提供“一站式”软硬件技术资源,总资料大小超过 1.2GB。 在整机结构硬件方面,开源内容包含详尽的整机结构图纸、硬件框图和物料清单(BOM)、装机说明。- 16
- 0
JetBrains 为开发者打造最强 AI 助手 Mellum:为编程而生,延迟低、补全快、准确度高
感谢JetBrains 公司昨日(10 月 22 日)发布博文,专门设计推出了全新的大语言模型 Mellum,为软件开发者提供更快速、更智能和更具上下文意识的代码补全。官方表示 Mellum 相比较其它大语言模型,最大的亮点就是专门为开发者编程而设计的,具备延迟低、性能强、功能全面等优点,可以在最短时间内为开发者提供相关建议。Mellum 已支持 Java、Kotlin、Python、Go 和 P…- 12
- 0
OpenAI 推出全新写作、编码工具 ChatGPT Canvas,将免费开放
感谢OpenAI 今日宣布推出全新写作、编码工具 Canvas,这是一个与 ChatGPT 合作编写和编码项目的新界面,超越了简单的聊天。AI在线从官方介绍获悉,ChatGPT Canvas 可以更好地了解任务的上下文,用户可以突出显示特定部分,以准确表明希望 ChatGPT 关注的内容。用户也可以直接编辑文本或代码,要求 ChatGPT 调整写入长度、调试代码并快速执行其他操作,并且提供后退按钮…- 10
- 0
JetBrains AI Assistant 编程助手正式在国内发布,基于阿里通义大模型
在本周举行的 2024 云栖大会上,JetBrains 正式发布了基于阿里云通义大模型的 JetBrains Al Assistant。JetBrains 官方介绍称,JetBrains Al Assistant 与多款 JetBrains 产品深度集成,是专为中国开发者量身定制的“提效神器”。JetBrains Al Assistant 支持全链路优化开发,可在特定 IDE 工具窗口中作为内联操…- 15
- 0
亚马逊 CEO 安迪・贾西:AI 助手 Amazon Q 可节省约 4500 个开发人员一年工作量
亚马逊 CEO 安迪・贾西昨天在其领英主页发帖称,将亚马逊的生成式 AI 开发助手“Amazon Q”集成到内部系统后,利用新的代码转换功能,Amazon Q 将应用程序升级到 Java 17 的平均时间从开发人员的 50 天左右缩短到了几个小时,估计节省了约 4500 个开发人员一年的工作量。对于软件开发团队来说,最乏味(但却最关键)的任务之一就是更新基础软件。这不是新功能的工作,也不会让人感觉…- 17
- 0
明确了:文本数据中加点代码,训练出的大模型更强、更通用
代码知识原来这么重要。如今说起大语言模型(LLM),写代码能力恐怕是「君子六艺」必不可少的一项。在预训练数据集中包含代码,即使对于并非专门为代码设计的大模型来说,也已是必不可少的事。虽然从业者们普遍认为代码数据在通用 LLM 的性能中起着至关重要的作用,但分析代码对非代码任务的精确影响的工作却非常有限。在最近由 Cohere 等机构提交的一项工作中,研究者系统地研究了代码数据对通用大模型性能的影响…- 38
- 0
AI 编码无需人类插手:Claude 工程师摔断右手后,一周狂肝 3000 行代码
一次意外右手骨折,Claude 工程师的工作竟被 AI 挽救了。近两个月的时间,他们一起结对编程,甚至在一周内肝出 3000 行代码。他疯狂暗示,未来 1-3 年,就是「AI 工程师」的天下。原来,摔断胳膊也是一件幸事......当事人表示,「我再也不想回到过去了」。这是为何?事情是这样的,几个月前,Claude 工程师 Erik Schluntz 骑车上班的路上,意外摔断右手,打上了石膏。为了生…- 22
- 0
智能化软件开发2.0 | aiXcoder落地Agent技术,聚焦企业项目级代码生成场景
基于大模型的AI Agent,作为能够自主感知环境、形成记忆、规划行动、并调用各类工具执行复杂任务的新一代技术,正在重塑软件开发流程,引领智能化软件开发进入2.0阶段。北大aiXcoder团队早在2023年初就开始基于大模型的Agent在软件工程领域中的研究,先后发表了多篇相关论文【1,2,3,4】,是全球第一批研究通过大模型+工具调用去解决项目级代码生成问题的团队,为Agent技术在软件开发领域…- 21
- 0
ChatGPT 无法取代人类程序员: IEEE 35 页论文测出困难编码正确率仅为 0.66%
【新智元导读】6 月,IEEE 刊登了一篇对 ChatGPT 代码生成任务进行系统评估的论文,数据集就是程序员们最爱的 LeetCode 题库。研究揭示了 LLM 在代码任务中出现的潜在问题和能力局限,让我们能够对模型做出进一步改进,并逐渐了解使用 ChatGPT 写代码的最佳姿势。有了 ChatGPT,还需要人类程序猿编码吗?上个月,一项发表在 IEEE TSE 期刊(Transactions …- 2
- 0
智谱发布并开源代码生成大模型 CodeGeeX 第四代,号称百亿以下规模性能最强
正在进行的 2024 世界人工智能大会(WAIC 2024)期间,智谱 AI 发布并开源代码生成大模型 CodeGeeX 的第四代产品 CodeGeeX4-ALL-9B,集代码补全和生成、代码问答、代码解释器、东西挪用、联网搜刮、项目级代码问答等所有威力于一体,号称是目前百亿(10B)参数以下性能最强、最全能的代码大模型。据介绍,该模型在 GLM4 的语言威力的基础上大幅增强了代码生成威力。Cod…- 9
- 0
Meta 推出 LLM Compiler 代码优化模型,可搭配其他 AI 改善代码生成 / 编译能力
Meta 前天推出了一款名为“LLM Compiler”的模型,该模型基于 Meta 现有的 Code Llama 打造,主打代码优化,目前相干模型已登陆 Hugging Face,提供 70 亿参数及 130 亿参数两个版本,允许学术及商业应用,IT之家附项目地址如下:点此访问。Meta 认为,尽管业界各大谈话模型已在各种编程代码使命中展现了出色的能力,但此类模型在代码优化还有进步空间,目前推出…- 7
- 0
baidu智能代码助手“文心快码”发布:撑持 100+ 主流编程语言及多种 IDE
在今日举行的baidu WAVE SUMMIT 深度学习开发者大会上,baidu推出了旗下智能代码助手 —— 文心快码(Baidu Comate)。文心快码(Baidu Comate)基于文心大模型,结合baidu积累多年的编程现场大数据和外部优秀开源数据,拥有代码智能、场景丰富、创造价值、广泛运用等多重产品优势,可实现“帮你想、帮你写、帮你改”的场景运用形态。baidu表示,该公司内部上万工程师…- 7
- 0
代码
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!