开发
一句话让Agent自主干活,清华复旦斯坦福等开源的智能体开发框架抢先了OpenAI
近期,OpenAI CEO Sam Altman 宣布,2025 年将推出名为 “Operator” 的虚拟员工计划,AI 代理将能够自主执行任务,如写代码、预订旅行等,成为企业中的 “数字同事”。 在 OpenAI 发布 “Operator” 之前,清华、复旦和斯坦福的研究者联合提出了名为 “Eko” 的 Agent 开发框架,旨在让开发者通过简洁的代码和自然语言,快速构建可用于生产的 “虚拟员工”。 这种框架使得 AI 代理能够接管用户的电脑和浏览器,代替人类完成各种任务,为工作流程提供自动化支持。
1/15/2025 1:30:00 PM
机器之心
ETH&PICO开源MADPose:通过显式仿射校正单目深度预测的相对位姿估计方法
本文经3D视觉之心公众号授权转载,转载请联系出处。 单目深度估计的关键局限和挑战近年来,基于深度学习的单目深度估计(Monocular Depth Estimation, MDE)能够从单张二维图像中提取出日益准确的三维信息。 这些进展为利用三维先验丰富传统几何计算机视觉任务开辟了新的可能性。
1/14/2025 9:48:24 AM
3D视觉之心
快上车!吴恩达老师分享自用 AI 辅助编程快速打造软件原型最佳实践
在人工智能时代,如何利用 AI 辅助编程快速构建软件原型? 吴恩达老师在这篇信中分享了他的心得与最佳实践。 他不仅介绍了自己当前使用的技术栈(包括 Python FastAPI、Uvicorn、MongoDB 等),还探讨了如何通过明确选择工具和优化开发流程,大幅提升开发效率文中重点包括:1.
1/13/2025 8:40:00 AM
AI寒武纪
使用 Teachable Machine 构建图像识别模型
Teachable Machine 是由 Google 开发的一款基于网页的工具,允许任何人在不需要深入了解编程或机器学习的情况下创建机器学习模型。 它的设计易于使用且用户友好,适合初学者、教育工作者,甚至是想要探索人工智能概念的孩子们。 Teachable Machine 支持的模型Teachable Machine 支持以下机器学习模型:图像分类 — 识别图像中的物体音频分类 — 识别声音、语音或其他音频输入姿态分类 — 识别人体姿态或动作要训练模型,您需要为 Teachable Machine 提供自己的数据集,例如图像或录音。
1/11/2025 11:14:52 PM
二旺
吴恩达对话业界领袖:揭秘2025人工智能五大风口
吴恩达(Andrew Ng)在新年伊始,与我们分享了他对人工智能未来发展的个人见解,吴老师特别指出,AI正在降低软件开发成本,使得快速构建软件原型变得前所未有的容易。 无论是为孩子制作抽认卡,还是管理国际账户的外汇汇率,亦或是自动分析用户评论以快速发现产品问题,AI辅助编码都能迅速实现这些应用。 吴恩达认为,AI辅助编码在原型开发中尤为有效,因为原型通常不需要复杂的上下文和软件集成,且在早期测试阶段对可靠性的要求相对较低。
1/8/2025 1:30:00 PM
AI寒武纪
PyTorch vs PyTorch Lightning 框架对比
在不断发展的深度学习领域,PyTorch 已经成为开发者和研究人员家喻户晓的名字。 其动态计算图、灵活性以及广泛的社区支持使其成为构建从简单神经网络到复杂前沿模型的首选框架。 然而,灵活性也带来了编写大量样板代码的责任——尤其是在训练循环、日志记录和分布式学习方面。
1/8/2025 8:30:38 AM
二旺
YOLO、SSD 和 Faster R-CNN 三种方案实现物体识别的对比
本文旨在开发一个能够准确检测和分割视频中物体的计算机视觉系统。 我将使用最先进的三种SoA(State-of-the-Art)方法:YOLO、SSD和Faster R-CNN,并评估它们的性能。 然后,我通过视觉分析结果,突出它们的优缺点。
1/6/2025 12:20:00 PM
二旺
OpenAI微软「秘密协议」首次曝光:盈利超过1000亿美元就是AGI!
何谓AGI? 就在今天,我们终于有了一个明确的、数值上的「定义」! 要知道,此前微软和OpenAI合作的基础之所以能存在,就是因为双方曾有这样一个协定——一旦OpenAI达到AGI水平,它就可以终止与微软的独家合作关系。
12/30/2024 7:40:00 AM
新智元
OpenAI 发布 o1 及开发者新工具:模型升级、实时 API 优化、偏好微调等重磅更新
OpenAI 12天发布会Day9, 今日宣布推出一系列针对开发者的强大模型、全新定制工具以及性能、灵活性和成本效益的升级,旨在助力开发者构建更智能、更强大的 AI 应用。 本次更新涵盖以下关键内容:1. API 中的 OpenAI o1:OpenAI o1 模型正式在 API 中向 5 级使用用户开放。
12/18/2024 12:20:15 PM
AI寒武纪
项目爆火立刻脱离大厂!谷歌NotebookLM核心团队集体离职,另起炉灶创业
谷歌最火爆大模型产品,背后团队刚刚集体离职创业了! 就是被大神Karpathy强烈安利、盛赞为有可能开启“和ChatGPT一样大机会”的NotebookLM,幕后的关键人物们。 团队负责人Raiza Martin(简称拉姐)在自己的社交媒体上公布了这一消息:在谷歌干了5.5年,今天是我的last day。
12/4/2024 8:30:00 AM
量子位
从本地部署到企业级服务:十种主流LLM推理框架的技术介绍与对比
大语言模型(Large Language Models, LLMs)的部署是一项具有技术挑战性的工作。 随着模型架构日益复杂,以及硬件需求不断提升,部署过程变得愈发复杂。 业界已经发展出多种解决方案,使LLM的部署和扩展变得更加便捷。
12/2/2024 2:41:00 PM
Gautam Chutani
吴恩达开源大模型套件:11个模型平台一种方式调用,已获星标超1.2K
吴恩达发布的开源大模型套件aisuite,不到半天就斩获了1200 星标。 它把11家知名大模型平台集中到了一起,统一了接口,可以用相同的方式调用不同模型。 切换模型时,只需要改动一个字符串,不用在不同的API之间摸不着头脑了。
11/26/2024 2:20:00 PM
量子位
十倍开发者与AI:科技精英程序员会被取代吗?
顶尖开发人员将与现在看起来大不相同。 公司需要改变他们对高绩效开发团队的看法。 译自The 10x Developer vs.
11/26/2024 12:35:30 AM
岱军
程序员不应被AI取代写代码,而是写文档!谷歌大牛呼吁:老板们应该倾听开发者心声,现在的AI代码生成器操之过急,风险太大!
编译 | 言征出品 | 51CTO技术栈(微信号:blog51cto)对于“AI帮助生产力提高”这件事情上,开发人员与他们的老板,意见其实非常不一致。 最近, Atlassian-DX DevEx 进行了一项现状调查,结果非常有意思——调查结果显示,公司老板们认为 AI 是提高开发人员生产力和满意度的最有效方法,但高达三分之二的开发人员却不这么想,他们认为实际上没有任何显著的 AI 生产力提升。 众所周知,目前最热门的软件开发 AI 用例属于代码生成。
11/8/2024 10:25:58 AM
言征
“稚晖君”创业项目,智元自主研发的机器人中间件 AimRT 开源
智元自主研发的机器人中间件 AimRT 开源上线。▲ AimRT 架构图官方表示,AimRT 是一个更现代、轻量易用,且高效稳定的通信开发框架,具备机器人开发流程所必备的许多实用特性,并解决了主流开源中间件的一些痛点:在软件开发效率方面,AimRT 基于现代 C 新标准开发,轻量易部署,将现代化设计模式应用在资源管控、异步编程、部署配置等方面,使得机器人应用的开发更加快捷和高效。在工具链与调测效率方面,AimRT 提供了完善的调试、性能分析工具,以及良好的可观测性支持,有助于快速发现并解决系统中的问题,相比较传
9/25/2024 4:55:32 PM
沛霖(实习)
消息称软银计划到 2025 年投资 1500 亿日元,加速 AI 大模型开发
据《日本经济新闻》报道,软银计划到 2025 年投资 1500 亿日元(IT之家备注:当前约 70.2 亿元人民币),加速 AI 大模型的开发工作。软银 2023 年就在生成式 AI 算力基础设施上进行了 200 亿日元(当前约 9.36 亿元人民币)的投资,此次追加投资后整体投资规模将创下日本企业历史第一。据悉,软银目标在年内完成 390B 参数模型的开发,并在明年开始研发万亿参数级别的日语大模型。报道指出,日本企业中 NTT 和 NEC 等已跟进 AI 模型开发热潮,但这些企业的模型产品参数规模停留在数 B 至
4/23/2024 3:01:54 PM
溯波(实习)
DCloud CTO崔红保:跨端框架性能优化实践
在掘力计划系列活动第20场, uni-app 跨端框架负责人、DCloud CTO、跨平台开发老兵崔红保分享了跨端框架性能优化实践。
8/1/2023 11:35:00 AM
新闻助手
ImageNet「众包」成就伟大数据集,「昇腾众智」创新AI开发模式
作为人工智能社区群策群力的早期形式,「众包」成就了 ImageNet 等一批成功的数据集,也加快了整个社区的发展进程。但要构建人工智能技术开发生态,仅靠「众包」是不够的。
3/26/2021 3:42:00 PM
机器之心
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind