应用
OpenAI 首席战略官 Jason Kwon:不会一夜之间突然发布一个“包罗万象”的 AI
韩媒“Chosun Ilbo”当地时间周二公布了 8 月 7 日对 OpenAI 首席战略官 Jason Kwon 的采访内容。Jason Kwon 负责监督 OpenAI 未来的战略制定,处理围绕 AI 的伦理和法律问题,同时也参与技术开发。图源 PexelsAI在线汇总对话主要内容如下:Jason Kwon 认为,关键技术发展到通用人工智能(AGI)可能还需几年时间。“我们内部假设这可能比预期更快到来,因此正在相应地准备安全措施。”尽管业界认为 AGI 可能在三到五年之间出现,但 Jason Kwon 认为这一
8/15/2024 8:51:54 AM
清源
第二波!2024年8月精选实用设计工具合集
大家好,这是 2024 年 8 月的第 2 波干货合集!
在搜集整理 3D 工具的时候,我注意到 2 个对于设计师非常友好的 3D 工具,其中一个是更加适宜新手入坑 3D 的建模平台 Womp3D,以及可以帮助前端快速将 3D 资源插入到网页中的代码工具,这俩在网页前端设计落地的过程中,甚至可以直接联动起来。
而 AI 工具这边,这期搜集到了 3 个非常值得关注的好东西,一个是阿里出品的开源的 AI 自动剪辑工具,对于做影视的小伙伴会非常友好,另外 2 个则和 UI 设计落地有关的 AI 平台,它们甚至隐约呈现出了
8/15/2024 7:19:49 AM
陈子木
集成 Photoshop 功能的强大节点!ComfyUI layer style节点保姆级教程(一)
前言:
学习 ComfyUI 是一场持久战,而 ComfyUI layer style 是一组专为图片设计制作且集成了 Photoshop 功能的强大节点。该节点几乎将 PhotoShop 的全部功能迁移到 ComfyUI,诸如提供仿照 Adobe Photoshop 的图层样式、提供调整颜色功能(亮度、饱和度、对比度等)、提供 Mask 辅助工具、提供图层合成工具和工作流相关的辅助节点、提供图像效果滤镜等。旨在集中工作平台,使我们可以在 ComfyUI 中实现 PhotoShop 的一些基础功能。一、安装方式
方
8/15/2024 12:01:13 AM
AI实战
蚂蚁集团T空间启用,超3000人入驻 技术人才占比近8成
日前,蚂蚁集团在北京的自有园区——蚂蚁T空间正式启用,蚂蚁集团创新科技总部正式落地北京。蚂蚁集团董事长兼CEO井贤栋在T空间启用仪式上说,“蚂蚁会利用北京人才和科创高地的优势,加大投入,开启蚂蚁科技的全新篇章。”(图说:蚂蚁T空间)一直以来,北京都是蚂蚁集团重要的创新研发中心,早在2010年,支付宝(中国)就设立了北京分公司,2020年国产分布式数据库OceanBase商业化公司也落户北京。去年蚂蚁集团与北京海淀区政府签署战略合作协议,宣布在海淀区设立创新科技总部。据了解,该总部覆盖了蚂蚁在蚂蚁人工智能和数据要素领
8/14/2024 5:10:00 PM
新闻助手
AI在用 | 穿越了!3款AI工具让梵高、莫扎特们「活」在当下
机器之能报道编辑:杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。 我们也欢迎读者投稿亲自实践的创新型用例。最近,有博主将一堆世界名人的自画像制成了动画,吸引了不少网友围观。例如,文森特・梵高略带忧郁地抚摸着红色的络腮胡子:一副贵族气质的莫扎特摆弄起礼服:写出《傲慢与偏见》的简・奥斯汀坐在椅子上露出微笑:贝多芬忘我地拉着小提琴:还有达芬
8/14/2024 5:04:00 PM
机器之能
Grok-2来了,能生图识图、性能比肩GPT-4o,马斯克:发展猛如火箭
GPT-5 不出,Grok 已经赶上了。就在谷歌与 OpenAI 互相抢新闻的同一天,马斯克旗下的 xAI 也没有闲着。北京时间周三下午,xAI 正式发布了新一代 Grok 2 大模型。第三方大模型基准组织 Chatbot Arena 也立即更新了 LMSYS 榜的成绩列表。Grok 2 的早期型号(sus-column-r)紧随 GPT-4o(0513 版)之后可以位列第四,表现优于 Claude 3.5 Sonnet 和 GPT-4-Turbo。它在编码、复杂问题和数学方面表现出色。马斯克不免自夸起来,「Gro
8/14/2024 4:23:00 PM
机器之心
OpenAI「草莓」模型再次跳票,凌晨发布的SWE-bench Verified是个啥?
有人说,「我们期待的是草莓,但他们发布的是羽衣甘蓝。」我们来看看这个「羽衣甘蓝」是做什么用的。一直以来,大模型的编程能力都备受关注,超强 AI 程序员 Devin 的问世更是将「AI 能否替代程序员」这一话题推上了风口浪尖。最近,Devin 也迎来了新对手 —— 初创公司 Cosine 推出的自主 AI 程序员 Genie。该公司表示,Genie 的表现轻松超越了 Devin,在第三方基准测试 SWE-bench 上的得分为 30%,而 Devin 的得分仅为 13.8%。这个 SWE-Bench 是一个用于评估
8/14/2024 2:38:00 PM
机器之心
没有等来OpenAI开源GPT-4o,等来了开源版VITA
开源领域又传来好消息。大语言模型 (LLM) 经历了重大的演变,最近,我们也目睹了多模态大语言模型 (MLLM) 的蓬勃发展,它们表现出令人惊讶的多模态能力。特别是,GPT-4o 的出现显著推动了 MLLM 领域的发展。然而,与这些模型相对应的开源模型却明显不足。开源社区迫切需要进一步促进该领域的发展,这一点怎么强调也不为过。本文 ,来自腾讯优图实验室等机构的研究者提出了 VITA,这是第一个开源的多模态大语言模型 (MLLM),它能够同时处理和分析视频、图像、文本和音频模态,同时具有先进的多模态交互体验。研究者以
8/14/2024 2:33:00 PM
机器之心
同时操控手机和电脑,100项任务,跨系统智能体评测基准有了
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]跨平台的多模态智能体基准测试 CRAB 由 CAMEL AI 社区主导,由来自牛津、斯坦福、哈佛、KAUST、Eigent AI 等机构的研究人员合作开发。CAMEL AI 社区开发的 C
8/14/2024 2:27:00 PM
机器之心
新成绩!毫末用户智驾里程突破2亿公里
在自动驾驶技术的快速发展浪潮中,毫末智行再次迎来新成绩。8月14日,毫末智行宣布其用户智能驾驶行驶里程突破2亿公里大关,这一成绩不仅是毫末技术实力的迈进,也标志着毫末数据闭环能力的迈上新台阶。在自动驾驶技术的研发与量产落地方面,毫末智行始终走在行业前列。经过四年多的发展,毫末乘用车智能驾驶产品HPilot搭载车辆超过20款,毫末用户智能驾驶行驶里程已达2亿公里,是中国量产自动驾驶领军者。目前,搭载毫末HPilot的乘用车已广泛行驶于中国数百个城市,为用户带来安全、便捷、智能的出行体验。截至目前,毫末已推出三代七款智
8/14/2024 2:23:00 PM
新闻助手
OpenAI 找回场子:chatgpt-4o-latest AI 模型力压谷歌 Gemini 1.5 Pro,多项跑分重夺第一
谷歌上周发布最强 Gemini 1.5 Pro 模型,在 LMSYS 的聊天机器人竞技场(Chatbot Arena)比赛中取得第一名,而 OpenAI 迅速“找回场子”,最新 chatgpt-4o-latest 模型重夺第一。chatgpt-4o-latest 简介OpenAI 公司上周发布了 gpt-4o-2024-08-06,其 API 支持结构化输出;昨日再次发布了名为 chatgpt-4o-latest 的全新前沿模型,是 GPT-4o 的最新版本,上下文窗口输入最高 128000 个词元(tokens)
8/14/2024 12:33:56 PM
故渊
谷歌版 Her 大翻车:试了 3 次且换手机才成功… 网友:我手动只需 10 秒
翻车,大翻车。就在今天凌晨,谷歌版 Her——Gemini Live 正式发布。毕竟明显是对标 OpenAI 家的 GPT-4o,可以说是吸足了科技圈的眼球。在官网发布的 demo 中,拍照问答功能的效果是这样的:它大致实现的功能,是用手机拍摄演唱会的海报,并让 Gemini 查看用户的日历,看看行程是否适合参加。以及还可以基于此进行一系列后续的操作,包括定时间查票价等等。然而…… 当来到发布会现场演示环节的时候,画风却 180° 大变样。请看 VCR: 第一次:失败了。第二次:失败了。第三次:换手机,成功了。嗯…
8/14/2024 12:26:03 PM
清源
AI 斗图神器:普通视频秒变 meme,手绘动画轻松融入
哎鸭,鸭鸭摔倒了!鸭鸭是真的,摔跤是真的,但端的咖啡和端咖啡的手,是 AI 给 p 上去的。△ 还好手里的咖啡只洒了亿点点来自一个开源项目,VideoDoodles,这两天在外网上的讨论度直线上升。这项目妙就妙在,能给视频加上手绘风格的涂鸦,可可爱爱的也行,奇奇怪怪的也行。就跟人工一帧一帧画上去的没差。这对目前市场上大多数的 2D 视频编辑软件来说,还是比较难的。想要达成同等效果,一般还是得创作者真・一帧一帧画上去。怪费力气的。但 VideoDoodles 能靠在视频中重建 3D 场景,然后在其中放置平面画布,来生
8/14/2024 12:12:56 PM
清源
我用AI帮义乌老板重新设计全红婵“丑鱼”拖鞋
作者:马蕊蕾编辑:林杰鑫最近巴黎奥运会火得不止运动员,和他们相关的“奥运”同款,商品搜索量和销量一路暴涨。 全红婵的同款“丑鱼”拖鞋,这周在某宝的上升热度提升了113%,搜索关键词全红婵,第一个提示词就是“丑鱼”拖鞋。 你有想过为啥每次订单爆了,都能及时供上货?
8/14/2024 11:47:00 AM
马蕊蕾
谷歌介绍 Call Notes AI 功能:本地运行,摘录通话内容
谷歌公司在今天凌晨 1 点举办的 Made By Google 活动中,在发布 Pixel 9 系列手机之外,还介绍了全新的 Call Notes 功能,可摘录、总结通话内容。Call Notes 功能简介Call Notes 功能隶属于 Call Assist 工具集,可以调用 AI 来摘录用户的通话内容,如果用户在没有纸笔的情况下,想要梳理通话内容或者想要记录某个电话号码,该功能可以非常方便地处理重要信息。用户操作也非常简单,打开 Google Phone 应用程序,点击联系人,就能看到最近一次的通话摘要,而且
8/14/2024 11:15:27 AM
故渊
昆仑万维发布全球首个 AI 流媒体音乐平台 Melodio:持续、稳定生成特定风格歌曲
昆仑万维今日宣布,正式发布全球首个 AI 流媒体音乐平台 Melodio,并同步推出 AI 音乐商用创作平台 Mureka。据介绍,用户根据此刻的场景或心情在 Melodio 输入 Prompt(提示),Melodio 便会持续生成相应风格的定制化音乐。用户在 Melodio 音乐生成与播放过程中可以随时修改输入文案,改变音乐生成内容,还能够实时查询生成的歌词,并对于喜欢的片段进行保存、分享。▲ Melodio 使用页面官方还表示,Melodio 是业内首个能够持续、稳定生成特定风格歌曲(如:中国风、Rap、DJ
8/14/2024 10:58:52 AM
沛霖(实习)
全球最强AI程序员:GPT-4o加持,需求到跑通只需84秒
大家都在排 waitlist。大模型正在「替代人类程序员」的道路上快速前进。今年 3 月,人工智能软件工程师 Devin 引爆了 AI 社区,该产品由 OpenAI 的 GPT-4 基础大型语言模型(LLM)提供支持,可以在收到自然语言文本指令后自主编写和编辑代码。但在生成式 AI 领域,快速发展是主旋律,现在技术又迭代了。本周,一家 Y Combinator 支持,名为 Cosine 的创业公司宣布推出自己的全新自主 AI 工程师 Genie。该公司表示,Genie 的表现轻松超越了 Devin,在第三方基准测试
8/14/2024 10:36:00 AM
机器之心
Fireworks乔琳:AI产品上市时间从五年压缩到五天,我们的秘诀是什么?
在大模型革命的第一波浪潮中,许多初创公司和企业基于领先的闭源模型,如OpenAI的ChatGPT设计自己的商业模式。 然而,随着越来越多新的开源模型的出现,大模型从训练转向推理,基于大模型的商业模式也在悄然改变。 最近,在人工智能领域,一家名为Fireworks AI的公司迅速崭露头角。
8/14/2024 10:36:00 AM
刘洁
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
蛋白质
xAI
开发者
生成式
人形机器人
神经网络
机器学习
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
字节跳动
工具
华为
AGI
计算
大型语言模型
AI设计
搜索
生成式AI
视频生成
亚马逊
DeepMind
AI模型
特斯拉
场景
深度学习
Transformer
架构
MCP
Copilot
编程
视觉