应用
苹果终止电车项目后大裁员,押注家用机器人,这会是Next Big Thing吗?
新的出路,苹果能让我们耳目一新吗?苹果公司压力山大,何以见得?苹果公司的电动汽车项目在今年二月份取消了,他们还决定放弃为 Apple Watch 自主生产下一代屏幕的尝试。这两个项目都因成本超支和上市延迟而受阻。此外,混合现实眼镜还需要多年时间才能成为苹果主要的盈利点。在这样的情况下,苹果面临着巨大的收入压力。 图源:彭博社电动汽车项目的一些剩余员工将被转移到苹果公司的生成式 AI 项目。其他人将有 90 天时间在公司内部找到其他角色的重新分配,否则就
4/7/2024 12:18:00 AM
机器之心
Up主已经开始鬼畜,腾讯开源「AniPortrait」让照片唱歌说话
AniPortrait 模型是开源的,可以自由畅玩。「小破站鬼畜区的新质生产力工具。」近日,腾讯开源发布的一个新项目在推上获得了如此评价。这个项目是 AniPortrait,其可基于音频和一张参考图像生成高质量动画人像。话不说多,我们先看看可能会被律师函警告的 demo:动漫图像也能轻松开口说话:该项目刚上线几天,就已经收获了广泛好评:GitHub Star 数已经突破 2800。下面我们来看看 AniPortrait 的创新之处。论文标题:AniPortrait: Audio-Driven Synthesis o
4/7/2024 12:12:00 AM
机器之心
李飞飞主讲,斯坦福2024 CS231n开课,依旧座无虚席
「这是自 Karpathy 和我 2015 年启动这门课程以来的第 9 个年头,这是人工智能和计算机视觉令人难以置信的十年!」知名 AI 科学家李飞飞的计算机视觉「神课」CS231n,又一次开课了。总共 600 多位学生报名,第一堂课的现场座无虚席:从 2015 年到如今,CS231n 已经走到九个年头,也成为了一代计算机视觉专业学生心中的「必修课」:虽然课程代码不变,但可以猜到,2024 年的课程相比 2021 年版本的课程有不少新增内容,这还要归因于视觉生成技术三年来的巨大飞跃。在今年初的国际消费类电子产品展览
4/7/2024 12:02:00 AM
机器之心
如何用AIGC加速设计?来看京东3C数码年货节设计复盘(上)
3CDesign 设计团队服务于京东零售 3C 数码范围内的设计项目。重点关注京东 6.18、京东 11.11、京东电器营销品类相关全案项目设计、通讯、电脑数码、配件业务、京东电竞等。团队会针对用户体验、营销、交互、品牌、研究、前端代码设计等层面服务 3C 数码事业群。从创意到商业化价值的转化,再从数据理性分析并驱动,最终形成商业设计赋能于业务帮助业务增长。同时团队是个关注设计商业化、设计价值领域的所有项目的创新设计。一、项目背景
1. 背景介绍
2024 京东 3C 数码年货节项目,旨在通过富有创意的场景化布局为
4/7/2024 12:00:20 AM
团队京东JellyDesign
AI无人商店背后,是上千个印度人通过摄像头看美国人买西蓝花?
AI无人商店,背后疑似是1000印度人看摄像头:大厂的「拿货即走」没有走通?人们常说,有多少智能,就有多少人工。但是,亚马逊的这个项目,人工含量似乎有点高。这个项目名叫「Just Walk Out」。就像它的名字所暗示的,你可以走进亚马逊的无人购物商店里,选好东西,然后直接走出去,无需排队等待结账。因为,通过与计算机视觉和深度学习算法相结合,Just Walk Out 技术能够准确识别你拿取的商品,并完成结算,整个过程非常省心,听起来也很智能。但是,事实可能并非如此。据外媒 The Information 报道,「
4/6/2024 11:59:00 PM
机器之心
ChatGPT现在能帮你P图了,只需简单说几个字
现在,不论是网页、iOS 还是安卓版的 ChatGPT,都可以用上 DALL-E 3 强大的编辑图像功能了。OpenAI 的 DALL-E 今天进行了多项升级,在通往 Midjourney 加 Photoshop 的道路上又前进了一大步。现在,你可以在 ChatGPT 中使用 DALL-E 组件进行复杂的图像编辑。DALL-E 现在提供预设风格建议,以帮助激发图像创作灵感 —— 与很多新一代安卓旗舰手机 AI 生成壁纸的提示类似。在 AI 画图领域,Stable Diffusion,Midjourney 与 DAL
4/6/2024 11:38:00 PM
机器之心
让AI进入物理世界,首届中国具身智能大会展望智能新纪元
前不久,图灵奖得主Yann Lecun在Lex Fridman的播客中讲道:机器人行业的兴起已经等待了 10、20 年,而这个行业的发展要寄希望于AI的进步。AI 发展可谓是瞬息万变。科技巨头们不是抢占时机,比谁先发布,就是猛攻质量,比性能优劣。2022 年还被称为 AIGC 元年,而 2024 年,就已经来到了具身智能元年。何为具身智能?先不谈定义,看看下面这些展示,你有属于自己的理解吗?具身智能其实是基于物理身体进行感知和行动的智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智
4/6/2024 11:31:00 PM
机器之心
马斯克造大模型,从特斯拉连挖高管
要不他们可能就跳槽到 OpenAI 了。当全球首富埃隆・马斯克(Elon Musk)建立 xAI,准备与 OpenAI、谷歌竞争大模型时,他必须与众多科技巨头、初创公司争夺人才。不过,他使用了一些取巧的办法:从自家的特斯拉挖来了几名优秀工程师。该初创公司的网站显示,上个月,机器学习科学家 Ethan Knight 成为第三位投身 xAI 的特斯拉工程师。据一位前员工透露,在特斯拉,Knight 负责监督特斯拉自动驾驶技术的计算机视觉团队。而在他之前,一些在特斯拉从事超级计算、自动驾驶系统和人工智能基础设施的工作的工
4/6/2024 11:28:00 PM
机器之心
CVPR 2024满分论文,英伟达开源BOP排行榜6D物体姿态第一名方法
物体姿态估计对于各种应用至关重要,例如机器人操纵和混合现实。实例级方法通常需要纹理 CAD 模型来生成训练数据,并且不能应用于测试时未见过的新物体;而类别级方法消除了这些假设(实例训练和 CAD 模型),但获取类别级训练数据需要应用额外的姿态标准化和检查步骤。为了解决这些问题,来自英伟达的研究团队提出了一个统一的框架,称为 FoundationPose,它在基于模型和无模型设置下,使用 RGBD 图像对新颖物体进行姿态估计和跟踪。如下图所示,FoundationPose 优于现有专门针对这四项任务中每一项的 SOT
4/6/2024 11:26:00 PM
机器之心
德科集团发布报告:41% 高管认为企业借助 AI 可精简员工规模
最新调查报告显示,人工智能固然无法完全取代现有工作岗位,但 41% 的高级管理人员认为,人工智能技术会导致员工人数减少。图源 intelligentliving全球知名人力资源公司德科集团(Adecco Group)就 AI 技术未来发展,以及对企业发展影响,询问了全球 2000 家大型公司的高级管理人员,这是同类调查中规模最大的一次。德科询问了来自美国、英国、法国、德国、日本、西班牙、加拿大、澳大利亚和新加坡的 2000 多家大型公司,涉及国防、制药、医疗保健、物流等行业。虽然大多数受访者表示人工智能将带来革命性
4/6/2024 3:06:42 PM
故渊
谷歌安卓版 Gmail 将迎新特性:整合 Gemini,帮用户总结邮件内容
消息源 @AssembleDebug 近日发布推文,挖掘安卓版 Gmail v2024.03.31.621006929 版本更新,发现谷歌正在测试“Summarize this email”功能,帮用户总结当前邮件内容。根据曝光的截图,Gmail 新版在邮件标题下方会出现“Summarize this email”按钮,只是现阶段该功能没有生效,但从名称判断可以确认是总结当前邮件内容。网友推测在点击该按钮之后,将在屏幕底部弹出一个窗口,以要点形式显示电子邮件的摘要。这与网页上的操作方式有些类似,只是网页版会跳出侧边
4/6/2024 10:39:00 AM
故渊
3 个月增长 300%,OpenAI 企业版 ChatGPT 用户规模突破 60 万
感谢OpenAI 首席运营官布拉德・莱特凯普(Brad Lightcap)本周四接受彭博商业周刊采访时表示,当前企业版 ChatGPT 注册用户数量超过 60 万。IT之家注:OpenAI 于 2023 年 8 月发布企业版 ChatGPT,不仅可以无限制地快速访问强大的 GPT-4 模型,还可以进行更深入的数据分析,帮助企业快速理解信息,并且可以向 ChatGPT 提出更复杂的问题。OpenAI 曾于 2024 年 1 月发布报告,表示企业版 ChatGPT 注册用户数量为 15 万,也就是说在过去短短 3 个月
4/6/2024 10:28:09 AM
故渊
YouTube CEO 点名 OpenAI:若利用其平台视频训练 AI 模型属违规行为
感谢YouTube 首席执行官尼尔・莫汉(Neal Mohan)近日在采访中公开表示,尽管没有直接证据表明 OpenAI 使用 YouTube 视频来训练 Sora(文本生成视频的 AI 模型),但警告称这种行为违反了 YouTube 现行的平台服务条款。莫汉在接受彭博社采访时强调,下载 YouTube 视频,然后用于训练 Sora 等 AI 模型显然违反了平台的相关条款。莫汉表示:“从创作者的角度来看,当创作者将他们的辛勤劳动上传到我们的平台时,他们有一定的期望。其中之一就是符合 YouTube 的服务条款,不允
4/6/2024 9:20:33 AM
故渊
应对隐私 / 版权问题,5 月起 Meta Threads / Instagram 等平台将标记“疑似由 AI 生成的内容”
感谢AI 兴起产生的各种隐私 / 版权问题如今已成为科技行业许多人越来越关注的重点,而 Meta 公司今日发布新闻稿,宣布将在 5 月起在自家 Instagram、Threads 及 Facebook 平台为 AI 内容添加“水印标记”。Meta 在新闻稿中声称,这些变化来自公司内部监督委员会的建议、公共调查的结果和“学术界、民间社会组织和其他方面”的建议。IT之家注意到,Meta 公司将使用算法及真人检测“可能由 AI 生成的内容“,而用户也可以自行在图片中注释”相关图片由 AI 生成”,此类消息将作为水印添加至
4/6/2024 7:38:56 AM
漾仔
人形机器人也要服“软”
机器之能报道编辑:SIA用整个身体(而不是双手),携带、搬挪更多的东西。你能想象这些台上的明星人形机器人给你一个舒适、温暖的拥抱吗?或者模仿你怀抱一堆快递包裹进门的样子?受限于刚性材料,这些人形机器人的运动能力也受到极大限制。嗯.......它们做不到。这些钢铁战士的工作方式未能跳脱传统大型工业机器人的窠臼——用一双“手(末端执行器)”干活,虽然常见但也非常低效。有什么办法能让大家做事更高效呢?想想我们平时是如何创造性地动用全身部位,像杂技演员一样应对各种情况的吧。比如,怀抱一堆快递来到楼下,好不容易腾出一只手打开
4/5/2024 6:37:00 PM
机器之能
目标 10 年培养 9500 万 AI 人才,思科牵头微软等 8 家公司组建新联盟
思科公司牵头,携手微软等 8 家企业共同组建了人工智能信息与通信技术劳动力联盟,计划未来 10 年内培养超过 9500 万的 AI 领域人才。该联盟全称为 The AI-Enabled ICT Workforce Consortium,由思科公司牵头,埃森哲、Eightfold、谷歌、IBM、Indeed、英特尔、微软和 SAP 八家公司共同组建而成。此外该联盟雇佣了包括美国劳工联合会和工业组织大会、CHAIN5、美国通信工人协会、DIGITALEUROPE、欧洲职业培训协会、Khan Academy 和 SMEU
4/5/2024 9:43:45 AM
故渊
OpenAI 展示 Sora AI 生成的首支音乐短片《Worldweight》
感谢OpenAI 近日在其 YouTube 官方频道发布视频,介绍了由 August Kamp 参与制作,完全由文本转视频 AI 模型 Sora 生成的首支音乐短片《Worldweight》。 这支音乐短片(Music Video)完全由 Sora 生成,然后 Kamp 再拼接相关片段形成时长为 2 分 19 秒的音乐短片,宽高比为 8:3,展现了各种环境的模糊镜头。Kamp 并未透露《Worldweight》具体使用了哪些提示词,IT之家翻译该视频描述如下:身心融合,完全沉浸、徜徉在艺术世界中的那个时刻至今仍萦绕
4/4/2024 4:29:28 PM
故渊
Stable Audio 2.0 发布:生成最长 3 分钟音频,能帮音乐家补全创意作品
Stability AI 近日发布新闻稿,宣布推出 Stable Audio2.0,可以基于用户输入的提示词,生成最长 3 分钟的完整音轨。Stable Audio 2.0 在此前 1.0 版本基础上,进一步为音频生成扩展了前奏、副歌、收尾和立体声效果等内容,最长可以生成 3 分钟的音频内容。Stable Audio 2.0 扩充了生成功能之外,还提供了音频生成音频功能,基于用户上传的一小段音频内容,扩展生成、补充相关的音频内容。IT之家附上演示视频如下: 例如音乐家如果在创作某段音乐的时候“卡壳”了,可以上传某段
4/4/2024 10:23:56 AM
故渊
资讯热榜
OpenAI 开源模型被 Meta 研究员“逆改”!只动0.3%参数,gpt-oss-20B 解锁无约束基座
奥特曼:我承认GPT-5发布搞砸了
首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
阿里千问踢馆子了!Qwen3新作秒杀ChatGPT,侧脸杀切换第一人称视角,表情包绝绝子,小编:再也不用美图秀秀去水印了
深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
网易有道发布子曰教育大模型多款AI新品,定义教育AI应用能力L1-L5分级
小红书发布DynamicFace人脸生成技术,实现高质量图像视频人脸融合
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
Anthropic
英伟达
代码
训练
算法
Stable Diffusion
芯片
AI新词
LLM
蛋白质
腾讯
开发者
生成式
Claude
苹果
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
特斯拉
应用