应用
AI 大神 Karpathy 官宣创业:打造 80 亿人 AI 原生学校,首款课程 GitHub 斩获 17k 星
今天,AI 圈再次掀起海啸级巨震,离职 OpenAI 近半年的 AI 大牛 Karpathy 终于官宣了最终动向。他激动地宣布,自己正在创办一家 AI 教育的公司 —— Eureka Labs。Karpathy 这条官宣帖子,已有近百万浏览。Eureka Labs 官推初次现身,写下了「你好世界」。不难想到,自 2 月离职以来,Karpathy 一直都在专注在线授课领域,并不断动手尝试自己的新项目。当时,网友们便对 Karpathy 能够坚持输出高质教育内容的呼声越来越高。如今,愿望成真了!▲ 唯一的不足就是
7/17/2024 1:43:13 PM
汪淼
消息称字节将于 7 月 19 日首次大范围公布文生图 / 视频等 AI 模型进展
钛媒体 AGI 报道称,字节跳动团队将会在 7 月 19 日(本周五)首次大范围公布文生图、类 sora 新视频等全新人工智能(AI)模型技术进展,尤其在长视频、高动态方向上具备创新技术,或将直接对标 Sora 效果。消息人士表示,字节跳动内部将 AI 大模型设为集团 P0 最高级别的方向。此外抖音、剪映等内部多个团队也在研发 AI 视频模型应用,预计将在近期公布。字节跳动将在新加坡举办关于世界模型(World Models)探索的 AI 技术菁英论坛(ByteDance AI Luminary Talks)活动,
7/17/2024 10:48:46 AM
沛霖(实习)
戴盟机器人王煜:「具身技能」才能发挥人形机器人的作用 | 具身智能十人谈
作者:赖文昕编辑:岑峰本月,在爆火的世界人工智能大会(WAIC 2024)中,人形机器人「十八金刚」成为了会场中当之无愧的焦点。 由青龙、智元-远征A2、宇树-H1、傅利叶-GR-1、星动纪元-XBot-L、乐聚-夸父4代等一众人形机器人组成的先锋阵列,作为「镇馆之宝」被陈列在展览馆进门处,成为了所有进场观众看到的首个惊喜。 在大模型技术的加持下,长出「大脑」的人形机器人被视为通向 AGI 的必经之路,「具身智能元年」似乎已经到来。
7/17/2024 10:22:00 AM
赖文昕
AI 编程新星 Anysphere 获 A16z 估值 4 亿美元投资;微软为 Excel 等研发新 AI 模型丨AI情报局
今日融资快报AI编程Anysphere获得A16z新一轮投资,估值达4亿美元AI 编程初创公司 Anysphere 发布AI代码编辑器 Cursor,并成功从知名风险投资公司 A16z 获得新一轮融资,估值至少达到4亿美元。 Cursor 被多个大型科技公司使用,包括 OpenAI 和 Perplexity。 Anysphere 的目标是通过AI 编辑器帮助开发者提高工作效率,简化编码过程。
7/17/2024 9:55:00 AM
我在思考中
苹果、英伟达等公司被曝使用争议 YouTube 资源训练 AI 模型:5.7GB,涉及 4.8 万个频道 17.4 万个视频字幕
非营利性新闻工作室 ProofNews 昨日(7 月 16 日)发布博文,表示包括苹果、英伟达、Salesforce 和 Anthrophic 在内的大型科技公司,在训练其 AI 模型时均使用了来自 YouTube 的视频资源。 报道称这些科技公司在训练其 AI 模型过程中,使用了名为 YouTube Subtitles 的数据集,大小为 5.7GB(4.89 亿个单词)。该数据集由 EleutherAI 创建,最早发布于 2020 年,涉及超过 48000 个频道的 173536 个 YouTube 视频字幕内容
7/17/2024 9:45:24 AM
故渊
第三波!2024年7月精选实用设计工具合集
大家好,这是 2024 年 7 月的第 3 波干货合集!这一期干货合集包含有好几个资源合集类型的素材,有基于 Notion 整合的资源和 AI 工具合集,有免费的矢量 LOGO 素材网站,有超全面的海外版设计资源导航,也有专业的图标和插画素材网站。此外,这次合集中还有基于 AI 的配色工具,可以直接导入 Figma 的那种,还有基于 AI 的手绘转数字版图表的工具,相当专业。
当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、基于 Notion 的设计资源和 AI 工具合集
7/17/2024 1:23:08 AM
陈子木
ComfyUI 进阶篇!完整梳理 ComfyUI 的核心节点(二)
前言:
学习 ComfyUI 是一场持久战。当你掌握了 ComfyUI 的安装和运行之后,会发现大量五花八门的节点。面对各种各样的工作流和复杂的节点种类,可能会让人感到不知所措。在这篇文章中,我们将用通俗易懂的语言对 ComfyUI 的核心节点进行系统梳理,并详细解释每个参数。希望大家在学习过程中培养自我思考的能力,真正掌握和理解各个节点的用法与功能。在实践中不断提升自己的技术水平。只有通过不断的探索和总结,才能在面对复杂的工作流时游刃有余。祝大家学习顺利,早日成为 ComfyUI 的高手!一、VAE Decode
7/17/2024 12:04:35 AM
AI实战
能给后院鸟儿起名,智能喂食器用 AI 技术识别鸟类个体
智能喂食器 Bird Buddy 近期宣布了名为“Nature Intelligence”的更新,为用户带来一系列新功能。升级后,Bird Buddy 不仅能识别光顾喂食器鸟儿的品种,还能通过人工智能图像识别技术,区分个体鸟类并为其起名,让观鸟更加有趣。Bird Buddy 公司将此功能称为“非侵入式鸟类标记”。传统鸟类标记需要在鸟腿上安装追踪器,而 Bird Buddy 则依靠其喂食器内置的 5MP 高清摄像头和 AI 图像识别技术,通过识别鸟儿的细节特征来区分不同的个体。该公司 CEO Franci Zidar
7/16/2024 10:28:23 PM
远洋
科技巨头被曝未经授权用 YouTube 内容训练 AI,苹果、英伟达在列
据 Wired 报道,包括苹果在内的一些科技巨头未经 YouTube 视频创作者同意,就使用了他们视频的字幕文件来训练人工智能模型。AI在线注意到,此次事件影响到的创作者包括知名科技博主 MKBHD (Marques Brownlee)、MrBeast、PewDiePie、以及脱口秀主持人斯蒂芬・科尔伯特、约翰・奥利弗和吉米・坎摩尔等。这些被用于训练 AI 的字幕文件相当于视频的文本转录内容。调查记者披露,一些世界上最富有的科技公司一直在利用来自成千上万个 YouTube 视频的素材来训练 AI,而这违反了 You
7/16/2024 9:47:50 PM
远洋
英国监管机构出手,正调查微软与 Inflection AI 相关交易
英国竞争和市场管理局(CMA)7 月 16 日发布声明称,正调查微软雇佣 Inflection AI 部分前员工以及与 Inflection 方面达成相关安排的情况。该监管机构担心此举可能导致“竞争实质性减少”。图源 PexelsCMA 在声明中表示,做出第一阶段决定的截止日期为 9 月 11 日,届时该机构将宣布是否将此案转入第二阶段的深入调查。今年 4 月,CMA 曾表示正在征集公众意见,针对一系列科技巨头与人工智能初创公司的交易展开调查,其中包括微软与 Inflection AI 的交易、微软与 Mistra
7/16/2024 7:46:05 PM
远洋
人类模仿AI新赛道,AI:论疯癫,你是我爹
机器之能报道编辑:杨文AI被人类带坏!这个世界,太癫了……最近,社交媒体上冒出来一堆搞怪视频,打着 AI 的旗号,真人 cos AI,甚至抖音还专门出了个热门话题——人类模仿 AI 大赛。(视频来自抖音博主「关妮乱石」)视频链接::左边一张旧照片,右边打着「AI 修复」的字幕,实际由真人演绎着脑干缺失的狗血「剧情」。-1-AI:第一次被人冒充,没想到比我还抽象自从可灵、Luma 发布以来,全球网友组团整活,什么特朗普和拜登打啵,鳌拜和韦小宝秀恩爱,奥特曼和黄仁勋打起来……只有你想不到,没有 AI「祸害」不到。(查看
7/16/2024 6:37:00 PM
机器之能
美国参议员提跨党派提案:打击有害深度伪造,禁止篡改 AI 生成内容来源信息
来自共和民主两党的三位美国联邦参议院议员于当地时间 7 月 11 日宣布推出一项名为《保护内容来源和完整性,防止编辑和深度伪造媒体法案》的提案。AI在线注:这一法案英文全称为 Content Origin Protection and Integrity from Edited and Deepfaked Media Act,首字母简称为 COPIED ACT,后文以“COPIED 提案”代指。该提案旨在打击正在兴起的有害深度伪造,目标在美国联邦层面建立一个检测、标记与认证 AI 生成内容的透明度准则,保护记者、演
7/16/2024 5:44:15 PM
溯波(实习)
微软 CTO 坚信大型语言模型的“规模定律”依然奏效,未来可期
微软首席技术官(CTO)凯文・斯科特(Kevin Scott)上周在接受红杉资本旗下播客采访时,重申了他坚信大型语言模型 (LLM) 的“规模定律”将继续推动人工智能进步的观点,尽管该领域一些人怀疑进步已经停滞。斯科特在推动微软与 OpenAI 达成 130 亿美元的技术共享协议方面发挥了关键作用。斯科特表示:“其他人可能持不同观点,但我认为规模化并未达到边际收益递减的临界点。我想让人们理解这里存在着一个指数级提升的过程,遗憾的是,你只能每隔几年才能看到一次,因为建造超级计算机然后用它们训练模型都需要时间。”202
7/16/2024 5:25:59 PM
远洋
微软 Recall 功能灵感来自 29 岁的比尔・盖茨的预言?早年节目录音流出
微软备受争议的 Windows Recall(回顾)功能是否出自 29 岁的比尔・盖茨的构想?近日,一档来自上世纪 80 年代中期广播节目的录音浮出水面,让人们不禁产生遐想。微软联合创始人盖茨当时只有 29 岁,他受邀参加了名为“知名电脑俱乐部”(The Famous Computer Cafe)的电台访谈节目。谈话中,盖茨阐述了他将个人电脑带入千家万户的愿景,以及赋予计算机学习能力的可能性。盖茨表示,随着用户的使用,计算机将能够学习并记住用户之前做过的操作,从而减少重复输入指令的麻烦。盖茨当时的设想与微软当前备受
7/16/2024 4:42:57 PM
远洋
谷歌 AI 概览多次产生错误内容后,现仅在 7% 的搜索中展示
Search Engine Land 报道称,5 月份 AI Overview(AI 概览)刚发布时,约有 80% 的搜索结果会出现 AI 概览,而现在 AI 概览仅在 7% 的搜索中展示。谷歌 5 月份在搜索中增加了 AI 概览功能,用户搜索问题时谷歌 AI 自动抓取网页内容生成总结,用户不需要点击每个搜索结果即可获得答案。据AI在线此前报道,有网友在谷歌搜索寻找“芝士和披萨粘不到一块”的解决办法时,谷歌 AI 提供的建议里却提到“你可以把 1/8 杯的无毒胶水加到酱料里,让其更黏”。随后谷歌发布相关声明,表示会
7/16/2024 4:30:16 PM
沛霖(实习)
抛弃视觉编码器,这个「原生版」多模态大模型也能媲美主流方法
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]一作刁海文,是大连理工大学博士生,导师是卢湖川教授。目前在北京智源人工智能研究院实习,指导老师是王鑫龙博士。他的研究兴趣是视觉与语言,大模型高效迁移,多模态大模型等。共同一作崔玉峰,毕业于
7/16/2024 3:00:00 PM
机器之心
智能化软件开发2.0 | aiXcoder落地Agent技术,聚焦企业项目级代码生成场景
基于大模型的AI Agent,作为能够自主感知环境、形成记忆、规划行动、并调用各类工具执行复杂任务的新一代技术,正在重塑软件开发流程,引领智能化软件开发进入2.0阶段。北大aiXcoder团队早在2023年初就开始基于大模型的Agent在软件工程领域中的研究,先后发表了多篇相关论文【1,2,3,4】,是全球第一批研究通过大模型+工具调用去解决项目级代码生成问题的团队,为Agent技术在软件开发领域应用奠定了坚实的理论基础。基于系列领先的研究成果,结合多年来为各行业落地个性化企业代码大模型的实践经验,aiXcoder
7/16/2024 2:54:00 PM
新闻助手
大模型集体“失智”:9.11 和 9.9 哪个大,几乎全翻车了
没眼看……“9.11 和 9.9 哪个大”这样简单的问题,居然把主流大模型都难倒了??强如 GPT-4o,都坚定地认为 9.11 更大。谷歌 Gemini Advanced 付费版,同样的口径。新王 Claude 3.5 Sonnet,还一本正经的给出离谱的计算方法。9.11 = 9 1/10 1/1009.9 = 9 9/10到这一步还是对的,但下一步突然就不讲道理了如上所示,9.11 比 9.90 大 0.01。你想让我进一步详细解释小数的比较吗?这你还解释啥啊解释,简直要怀疑是全世界 AI 联合起
7/16/2024 12:30:09 PM
汪淼
资讯热榜
OpenAI 开源模型被 Meta 研究员“逆改”!只动0.3%参数,gpt-oss-20B 解锁无约束基座
大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷
谷歌最新「0.27B」Gemma 3开源!身板小却猛如虎,开发者直呼救命稻草
奥特曼:我承认GPT-5发布搞砸了
蚂蚁AI健康管家AQ上线四大打假功能 向假医疗广告宣战
阿里千问踢馆子了!Qwen3新作秒杀ChatGPT,侧脸杀切换第一人称视角,表情包绝绝子,小编:再也不用美图秀秀去水印了
小红书发布DynamicFace人脸生成技术,实现高质量图像视频人脸融合
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
Anthropic
英伟达
代码
训练
算法
Stable Diffusion
芯片
LLM
AI新词
蛋白质
开发者
腾讯
生成式
Claude
苹果
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
人形机器人
xAI
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
场景
大型语言模型
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
特斯拉
应用