开发
截胡OpenAI!清华复旦等抢先开源智能体框架Eko,一句话打造「虚拟员工」
OpenAI的首席执行官Sam Altman最近宣布,2025年将推出「虚拟员工计划」,代号Operator,AI智能体能够自主执行任务,如写代码、预订旅行等,成为企业中的「数字同事」。 抢在OpenAI发布Operator之前,清华、复旦和斯坦福的研究者联合提出了名为Eko的 Agent开发框架,开发者可以通过简洁的代码和自然语言,快速构建可用于生产的「虚拟员工」。 AI智能体能够接管用户的电脑和浏览器,代替人类完成各种任务,为工作流程提供自动化支持。
1/22/2025 3:17:43 PM
新智元
Github热门机器学习笔记:「从零构建大型语言模型」
本文经AIGC Studio公众号授权转载,转载请联系出处。 今天给大家推荐一份GitHub上很火的机器学习学习笔记《从零构建大型语言模型》,目前已经收获1.4K stars,,这份笔记完美展示了从零构建LLM的技术路线图,既有理论深度,又包含实践要点。 每个核心概念都配有清晰的示意图,便于理解和实践。
1/20/2025 9:41:29 AM
AIGC Studio
斯坦福研究:ChatGPT性能,曾出现下降趋势
斯坦福大学和加州伯克利大学的研究人员在“哈佛数据科学评论”上,发布了一篇名为《ChatGPT行为随时间变化》的论文。 研究人员通过GPT-3.5、GPT-4(2023年3月和6月两个版本)模型在数学问题、代码生成、多跳知识密集问答、美国医学执照考试、多跳知识密集型问题回答等7项任务进行了深度研究,以查看ChatGPT随着时间推移其性能的变化趋势。 结果显示, GPT-3.5 GPT-4的性能和行为在3个月内出现了明显波动。
1/17/2025 10:26:19 AM
AIGC开放社区
马斯克Boss直聘新玩法:不看学历,只看代码
新鲜出炉的马斯克版Boss直聘,风格是酱婶儿的:不care工作履历,不care学历背景,甚至没上过学也不是不行。 重点就一个:just show us your code。 这就是他为自己手里𝕏招揽资深工程师人才的唯一要求。
1/16/2025 11:55:00 AM
量子位
重磅!微软发布新AI Agent,集成在office全家桶、自动化时代来了
今天凌晨,微软在官网发布了全新企业级AI助手——Microsoft 365 Copilot Chat。 Copilot Chat除了支持的传统的文本生成、文件分析(PDF、Word等)、图像生成之外,最大亮点便是支持AI Agent功能,并且集成在了Microsoft 365商业版中,可直接调用企业自有数据,执行夸端到端的超复杂自动化业务流程。 例如,在供应链管理中,Copilot Chat能够实时监控库存水平,根据销售数据和市场趋势预测需求,自动生成采购订单,并协调物流配送,提升整个供应链工作效率。
1/16/2025 10:07:44 AM
AIGC开放社区
一句话让Agent自主干活,清华复旦斯坦福等开源的智能体开发框架抢先了OpenAI
近期,OpenAI CEO Sam Altman 宣布,2025 年将推出名为 “Operator” 的虚拟员工计划,AI 代理将能够自主执行任务,如写代码、预订旅行等,成为企业中的 “数字同事”。 在 OpenAI 发布 “Operator” 之前,清华、复旦和斯坦福的研究者联合提出了名为 “Eko” 的 Agent 开发框架,旨在让开发者通过简洁的代码和自然语言,快速构建可用于生产的 “虚拟员工”。 这种框架使得 AI 代理能够接管用户的电脑和浏览器,代替人类完成各种任务,为工作流程提供自动化支持。
1/15/2025 1:30:00 PM
机器之心
ETH&PICO开源MADPose:通过显式仿射校正单目深度预测的相对位姿估计方法
本文经3D视觉之心公众号授权转载,转载请联系出处。 单目深度估计的关键局限和挑战近年来,基于深度学习的单目深度估计(Monocular Depth Estimation, MDE)能够从单张二维图像中提取出日益准确的三维信息。 这些进展为利用三维先验丰富传统几何计算机视觉任务开辟了新的可能性。
1/14/2025 9:48:24 AM
3D视觉之心
快上车!吴恩达老师分享自用 AI 辅助编程快速打造软件原型最佳实践
在人工智能时代,如何利用 AI 辅助编程快速构建软件原型? 吴恩达老师在这篇信中分享了他的心得与最佳实践。 他不仅介绍了自己当前使用的技术栈(包括 Python FastAPI、Uvicorn、MongoDB 等),还探讨了如何通过明确选择工具和优化开发流程,大幅提升开发效率文中重点包括:1.
1/13/2025 8:40:00 AM
AI寒武纪
使用 Teachable Machine 构建图像识别模型
Teachable Machine 是由 Google 开发的一款基于网页的工具,允许任何人在不需要深入了解编程或机器学习的情况下创建机器学习模型。 它的设计易于使用且用户友好,适合初学者、教育工作者,甚至是想要探索人工智能概念的孩子们。 Teachable Machine 支持的模型Teachable Machine 支持以下机器学习模型:图像分类 — 识别图像中的物体音频分类 — 识别声音、语音或其他音频输入姿态分类 — 识别人体姿态或动作要训练模型,您需要为 Teachable Machine 提供自己的数据集,例如图像或录音。
1/11/2025 11:14:52 PM
二旺
吴恩达对话业界领袖:揭秘2025人工智能五大风口
吴恩达(Andrew Ng)在新年伊始,与我们分享了他对人工智能未来发展的个人见解,吴老师特别指出,AI正在降低软件开发成本,使得快速构建软件原型变得前所未有的容易。 无论是为孩子制作抽认卡,还是管理国际账户的外汇汇率,亦或是自动分析用户评论以快速发现产品问题,AI辅助编码都能迅速实现这些应用。 吴恩达认为,AI辅助编码在原型开发中尤为有效,因为原型通常不需要复杂的上下文和软件集成,且在早期测试阶段对可靠性的要求相对较低。
1/8/2025 1:30:00 PM
AI寒武纪
PyTorch vs PyTorch Lightning 框架对比
在不断发展的深度学习领域,PyTorch 已经成为开发者和研究人员家喻户晓的名字。 其动态计算图、灵活性以及广泛的社区支持使其成为构建从简单神经网络到复杂前沿模型的首选框架。 然而,灵活性也带来了编写大量样板代码的责任——尤其是在训练循环、日志记录和分布式学习方面。
1/8/2025 8:30:38 AM
二旺
YOLO、SSD 和 Faster R-CNN 三种方案实现物体识别的对比
本文旨在开发一个能够准确检测和分割视频中物体的计算机视觉系统。 我将使用最先进的三种SoA(State-of-the-Art)方法:YOLO、SSD和Faster R-CNN,并评估它们的性能。 然后,我通过视觉分析结果,突出它们的优缺点。
1/6/2025 12:20:00 PM
二旺
OpenAI微软「秘密协议」首次曝光:盈利超过1000亿美元就是AGI!
何谓AGI? 就在今天,我们终于有了一个明确的、数值上的「定义」! 要知道,此前微软和OpenAI合作的基础之所以能存在,就是因为双方曾有这样一个协定——一旦OpenAI达到AGI水平,它就可以终止与微软的独家合作关系。
12/30/2024 7:40:00 AM
新智元
OpenAI 发布 o1 及开发者新工具:模型升级、实时 API 优化、偏好微调等重磅更新
OpenAI 12天发布会Day9, 今日宣布推出一系列针对开发者的强大模型、全新定制工具以及性能、灵活性和成本效益的升级,旨在助力开发者构建更智能、更强大的 AI 应用。 本次更新涵盖以下关键内容:1. API 中的 OpenAI o1:OpenAI o1 模型正式在 API 中向 5 级使用用户开放。
12/18/2024 12:20:15 PM
AI寒武纪
项目爆火立刻脱离大厂!谷歌NotebookLM核心团队集体离职,另起炉灶创业
谷歌最火爆大模型产品,背后团队刚刚集体离职创业了! 就是被大神Karpathy强烈安利、盛赞为有可能开启“和ChatGPT一样大机会”的NotebookLM,幕后的关键人物们。 团队负责人Raiza Martin(简称拉姐)在自己的社交媒体上公布了这一消息:在谷歌干了5.5年,今天是我的last day。
12/4/2024 8:30:00 AM
量子位
从本地部署到企业级服务:十种主流LLM推理框架的技术介绍与对比
大语言模型(Large Language Models, LLMs)的部署是一项具有技术挑战性的工作。 随着模型架构日益复杂,以及硬件需求不断提升,部署过程变得愈发复杂。 业界已经发展出多种解决方案,使LLM的部署和扩展变得更加便捷。
12/2/2024 2:41:00 PM
Gautam Chutani
吴恩达开源大模型套件:11个模型平台一种方式调用,已获星标超1.2K
吴恩达发布的开源大模型套件aisuite,不到半天就斩获了1200 星标。 它把11家知名大模型平台集中到了一起,统一了接口,可以用相同的方式调用不同模型。 切换模型时,只需要改动一个字符串,不用在不同的API之间摸不着头脑了。
11/26/2024 2:20:00 PM
量子位
十倍开发者与AI:科技精英程序员会被取代吗?
顶尖开发人员将与现在看起来大不相同。 公司需要改变他们对高绩效开发团队的看法。 译自The 10x Developer vs.
11/26/2024 12:35:30 AM
岱军
资讯热榜
OpenAI 开源模型被 Meta 研究员“逆改”!只动0.3%参数,gpt-oss-20B 解锁无约束基座
奥特曼:我承认GPT-5发布搞砸了
首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
阿里千问踢馆子了!Qwen3新作秒杀ChatGPT,侧脸杀切换第一人称视角,表情包绝绝子,小编:再也不用美图秀秀去水印了
小红书发布DynamicFace人脸生成技术,实现高质量图像视频人脸融合
网易有道发布子曰教育大模型多款AI新品,定义教育AI应用能力L1-L5分级
深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
Anthropic
英伟达
代码
训练
算法
Stable Diffusion
芯片
AI新词
LLM
蛋白质
腾讯
开发者
生成式
Claude
苹果
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
特斯拉
应用