应用
百度发布“全球首个 AI 原生操作系统”DuerOS X,用于小度音箱等
感谢在今日举行的 Create 2024 百度 AI 开发者大会上,小度科技宣布推出“全球首个 AI 原生操作系统”DuerOS X。据介绍,该系统基于百度文心大模型进行了全面升级,在多模态感知和拟人化呈现方面有了“重要突破”。通过 DuerOS X,小度的人机交互体验将实现“质的飞跃”,为用户提供更加自然、智能的交互方式。DuerOS 是百度在 2017 年推出的首个对话式人工智能操作系统,目前用于小度智能音箱等产品,已经迭代到 7.0 版本,DuerOS X 将迎来更多 AI 功能升级。DuerOS X 融合百
4/16/2024 12:47:56 PM
汪淼
刷爆多模态任务榜单!贾佳亚团队Mini-Gemini登热榜,代码、模型、数据全部开源
Mini-Gemini 堪比 GPT4 DALLE3 王炸组合。更高清图像的精确理解、更高质量的训练数据、更强的图像解析推理能力,还能结合图像推理和生成,香港中文大学终身教授贾佳亚团队提出的这款多模态模型 Mini-Gemini 堪称绝绝子,相当于开源社区的 GPT4 DALLE3 的王炸组合!Github 地址: 地址: ::: 还提供了 2B 小杯到 34B 的超大杯,最强模型在多个指标上相比 Google Gemini Pro 甚至 GPT-4V 都不遑多让。目前,Mini-Gemini 从代码、模型、到数据
4/16/2024 11:41:00 AM
机器之心
多篇顶会一作却申博失败?斯坦福博士生亲述:AI领域太卷
「尽管我在顶级 ML 会议上发表了多篇一作论文,为开源项目做出了贡献,也在业界产生了影响,但我仍在为进入博士课程而苦苦挣扎。我被顶尖大学拒之门外,感到迷茫和疲惫。」「我开始怀疑自己,怀疑如果没有合适的人脉或家庭背景,光有强大的研究背景是否还不够。我正在考虑放弃攻读博士学位以及从事有价值研究的梦想。」在刚刚过去的周末,关于「AI 博士申请条件卷上天」的帖子成为了 Reddit 社区讨论的焦点。这个帖子的作者在 EMNLP、NeurIPS、ACM、ACL 等顶级会议和研讨会上以第一作者发表了多篇研究论文,也被公司评为过
4/16/2024 11:35:00 AM
机器之心
陶哲轩力荐、亲自把关:AI for Math照这个清单学就对了
在 AI for Math 领域,如果你一直找不到合适的资源,这份清单或许会有帮助。刚刚,著名数学家陶哲轩的个人博客又更新了,这次他们整理了一份有用的资源列表,该资源专注于 AI for Math,专为那些希望进入数学 AI 领域的人提供帮助。这份清单发起时间最早可追溯到去年,发起机构由美国国家科学院、工程院和医学院组织的研讨会「人工智能辅助数学推理」提出,陶哲轩担任研讨会主持人。目前,网址资源已经公开。网址:,这是一个初步的资源列表,最初由 UIUC 教授 Talia Ringer 整理,供那些希望进入 AI 数
4/16/2024 11:27:00 AM
机器之心
「音乐界Sora」Udio来了:前DeepMind员工创业,比Suno可定制性更强
我们已经看到,AI 已经能够理解和生成文本、图像、视频,尽管各个产品目前能达到的准确性和审美水准还不相同。自带曲谱的音乐生成似乎是 AI 要征服的下一座山峰,而这场竞争正在白热化。近日,音乐生成领域再次迎来新玩家「Udio」。与前段时间大火的 Suno V3 相似,Udio 仅通过一些人工输入的文本提示(包括用户提供的歌词),就可以创建高保真音乐音频。但它拥有比 Suno 更多的自定义能力,风格涵盖乡村音乐、理发店四重唱(Barbershop)、德国流行乐(German pop)、古典音乐、硬摇滚、嘻哈、演唱曲调等
4/16/2024 11:23:00 AM
机器之心
睿蓝汽车与科大讯飞签署战略合作协议,星火大模型上车
感谢4 月 15 日,睿蓝汽车与科大讯飞战略合作签约仪式在科大讯飞总部安徽合肥举行。据介绍,本次战略合作协议,双方将从智能座舱、智能音效、数字营销等多个板块展开全面深入合作。此次与睿蓝汽车展开合作,也将为睿蓝品牌十五万级车型带来全新的数智 AI 升级。睿蓝 7 汽车已上线飞鱼智能音频管理系统,支持 50 吋巨幕 AR-HUD 和星火专属调音,还可根据个人喜好自由调节 ESE 声浪模式。接下来,睿蓝汽车旗下睿蓝 7、睿蓝 9 等代表车型,将全面搭载科大讯飞星火大模型,AI 不仅可以通过用户情绪感知,进行个性化推荐和共
4/16/2024 9:16:49 AM
汪淼
AI神器Udio详细拆解教程!一键生成高质量歌曲,效果不输 Suno
大家好,这里是和你们一起探索 AI 的花生~
前不久为大家介绍了一款 AI 歌曲生成神器 Suno V3,如今不到一个月的时间就又出现了一款新的工具 Udio,它也支持通过文本生成高质量的的歌曲,并且在某些方面的表现比 Suno 还要好。今天就为大家详细介绍一下 Udio 的特点及用法~
相关推荐:一、Udio 简介
网址直达:
Udio 是最新推出的一款 AI 音乐创作工具,支持通过文本生成高质量的歌曲或纯音乐。在 Suno V3 风头正盛的时候,Uido 仅凭一个内测用户放出来的音乐片段就立刻在网上引起了广泛
4/16/2024 8:47:14 AM
夏花生
英国着手起草 AI 法规,确保其发展处于可控状态
根据彭博社报道,英国目前正在起草 AI 监管草案,进一步加强对 GPT-4 等 AI 模型的监管力度,确保 AI 发展处于可控状态,不会对人类造成潜在危害。英国科学、创新和技术部(DSIT)目前已经开始起草相关的法案,最早可能会在 2024 年年底前发布,或者于 2025 年年初在法国举行的人工智能会议上公布。IT之家从报道中获悉,英国此前对待 AI 一直采取谨慎的态度,英国首相苏纳克(Rishi Sunak)在去年举行的首届世界领导人人工智能峰会上表示,各国不应“急于监管”人工智能。不过英国文化、媒体与体育部的官
4/16/2024 8:18:56 AM
故渊
Adobe Premiere Pro 引入全新 AI 功能,文本转视频、添加 / 删除视频对象等
Adobe 今日宣布将为其专业视频编辑软件 Premiere Pro 加入一系列由生成式人工智能驱动的强大功能,这些新功能将帮助视频剪辑师们更高效地完成工作。得益于全新的人工智能功能“生成扩展”,Premiere Pro 将能够为视频片段添加额外的帧,方便剪辑师们对场景进行恰当的时长调整并加入平滑的转场效果,例如延长某个场景的画面。此外,通过智能选取和跟踪工具,用户还可以轻松添加或移除视频中的物体。Adobe 表示,视频剪辑师们可以利用这一功能移除不需要的元素,例如画面中的杂物,或是为演员更换虚拟服装,甚至还能为场
4/16/2024 7:45:09 AM
远洋
大厂实战案例!京东物流AI问答助手体验设计完整复盘
随着技术的不断成熟,AI 越来越多的被运用到各种项目中。AI 在项目中主要有两大作用,一是作为技术支撑,在产品实现功能时借助 AI 技术提供预测数据、推荐数据,从而帮助企业预测/预警风险发生,提前实现调度工作,减少重复劳动,帮助企业实现降本增收。另一个则是用户通过键盘或者语音输入,对系统发出指令,AI 通过对语言识别去回答用户问题,这类主要用于客服或者知识问答,利用 AI 技术减少人工成本,减少重复劳动力,同时能将知识类文档进行收口,形成企业知识库。本文主要围绕设计师如何利用 AI 技术赋能物流行业。一、人机对话发
4/16/2024 2:06:20 AM
团队京东JellyDesign
轻松搞定!AI视频+微动效生成神器 PixVerse 生成秘籍
AI 在当下对于视频&微动效的处理能力如何?是否已经达到了可以商用的程度?曾经试过一些 AI 视频工具但是体验不好,应该如何操作?不会 AE、C4D 但是我想做个动态效果怎么弄?接下来将对此进行详细解答。
一、为什么要AI做视频 & 动效
1. 省时间
通过 AI 可以快速完成视频&动效设计,仅需要几分钟的时间就能完成传统需要拍摄或渲染等几个小时才能完成的工作,在短时间内提供有效的解决方案。
2. 高质量
拍摄高质量镜头画面时,传统需要使用高清摄像设备,并且需要利用补光灯确保视频画面明亮而均匀,避免出现强烈的阴影区
4/16/2024 1:06:12 AM
团队58UXD
大模型首次接入天文望远镜:“星语 3.0”发布,基于阿里通义千问
4 月 14 日,中国科学院国家天文台人工智能工作组发布新一代天文大模型 ——“星语 3.0”。“星语 3.0”基于阿里云通义千问开源模型打造,目前已成功接入国家天文台兴隆观测站望远镜阵列 —— Mini“司天”。据介绍,随着望远镜数量的不断增加,如何控制大型望远镜阵列已成为当今天文界共同面临的挑战。以往天文观测主要依赖观测助手和科研人员的配合。科研人员往往需要根据观测所在地气象情况修改观测计划,在观测室等待数据返回并实时分析数据,再根据结果修改观测计划。重要观测目标的每个环节都需要人工参与,效率低且难以同时控制多
4/15/2024 6:43:14 PM
汪淼
RBR50 2024:OpenAI上榜,人形机器人势不可挡
机器之能报道编辑:吴昕2024 年,发那科公司交付了第 100 万台工业机器人。同时,OpenAI 上榜也展示出生成式 AI 与机器人技术的日益相关性。Robotics Business Review RBR 50 榜单已经成为全球机器人行业重要风向标。每年 4 月,Robotics Business Review 都会评选出全球最具创新性和影响力的 50 家机器人企业和机构,许多业内知名企业波士顿动力、发那科、亚马逊、英伟达、优傲、Locus Robotics 等都曾入选 RBR50 榜单。2024 年,传统工业
4/15/2024 5:24:00 PM
机器之能
三星 Galaxy AI 即将支持粤语、阿拉伯语等更多语言
三星电子宣布 Galaxy AI 即将支持更多语言,包括阿拉伯语、印尼语、俄语、澳大利亚英语、粤语和加拿大法语,将于 4 月起未来数月陆续上线,每种语言都可以在设置中,以语言包的形式下载使用。结合既有的 13 种语言,三星将为全球更多 Galaxy 用户提供 Galaxy AI 的能力。此外,除前述语言外,三星计划在今年稍晚进一步扩大支持语言,包括罗马尼亚语、土耳其语、荷兰语、瑞典语、繁体中文和欧洲葡萄牙语。三星电子移动通信部门总裁卢泰文表示:“三星致力于将移动 AI 普及给所有人,Galaxy AI 翻译功能的语
4/15/2024 3:35:53 PM
汪淼
GPT-4 整治学术不端:人大 / 浙大团队实测 7000 篇论文,撤稿预测与人类 95% 一致
【新智元导读】人大与浙大学者发现,GPT-4 对于论文给出的撤稿预测结果,竟然和人类审稿人有将近 95% 的相似性。看来大模型虽然有可能引发学术不端,但也有办法维护科研诚信啊。学术论文的撤稿事件时有发生,这不仅损害了科研诚信,也可能对公众信任和科学进展产生负面影响。传统上,学术界依赖同行评审和出版后的读者反馈来识别和纠正问题论文,但这些方法可能无法及时发现所有问题,尤其是在当前科研论文出版数量急剧增加的背景下。在这种情况下,如何快速识别存在问题的论文,并促进它们的撤稿,成了学术界亟待解决的一个难题。最近,来自中国人
4/15/2024 12:46:16 PM
清源
Marvell 美满电子获得新 AI 芯片订单,到 2026 财年相关业务收入将达 25 亿美元
Marvell 美满电子在上周举办的一场有关 AI 基础设施领域的投资者活动上表示其新近获得了一份来自大型科技公司的 AI 芯片订单。Marvell 宣称,包括这份订单在内,其已从“四家美国超大型企业”中的三家拿下定制芯片订单,包括为客户 A 定制 AI 训练加速器和 AI 推理加速器,为客户 B 定制 Arm 架构 CPU 和近日的为客户 C 定制 AI 加速器。▲ 图源 Marvell 美满电子官方,下同Marvell 表示,客户 A 的 AI 训练加速器和客户 B 的 Arm 架构 CPU 已处于产能爬坡阶段
4/15/2024 11:24:18 AM
溯波(实习)
上海举办国内首个 AI 音乐会
4 月 13 日至 14 日,上海民族乐团国乐与 AI 音乐会《零・壹|中国色》,在第 39 届上海之春国际音乐节首演,这是全国首台 AI 创作的国乐音乐会。据悉,《零・壹|中国色》由上海民族乐团、腾讯音乐娱乐集团(TME)、1862 时尚艺术中心联合主办,参演曲目以颜色为创作灵感,由腾讯音乐娱乐集团和腾讯 AI Lab 联合研发的 AI 音乐大模型“琴乐大模型”创作,并经过乐团演奏家们二度创作最终成曲,通过大自然色彩的起承转合千变万化,让观众从乐曲中感受到不同的色彩演绎。IT之家附重点节目名单如下:笙曲《东方既白
4/15/2024 10:18:13 AM
归泷(实习)
除了唱歌,AI还能替你演出?又一AI公司将虚拟人推到新高度
用 Suno 十秒写歌,是不是已经很震撼?现在不仅如此,用最新的 AI 工具,我们还可以快速生成歌手唱歌 MV。最近,一家名为 AKOOL 的 AI 公司推出了一个唱歌虚拟人工具,用户只需在平台上选择虚拟人,简单输入歌词指令,便可生成能唱歌的虚拟人 MV。视频中的 “歌手” 在雪地里随着音乐翩翩起舞,“假唱” 对口型也毫不逊色。声音、面容,一键替换 AKOOL 拥有丰富的 AI 换脸视觉表现技术以及成熟的声音克隆技术。在 Tiktok 上,用 AKOOL 制作的换脸、换声视频非常风靡,受到很多人的欢迎。去年, A
4/15/2024 9:31:00 AM
机器之心
资讯热榜
标签云
人工智能
OpenAI
AI
AIGC
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
Sora
3D
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind