应用
AI 歌曲生成神器 Udio 重磅更新!可拆分音轨/控制音调/中文优化明显
大家好,这里是和你们一起探索 AI 的花生~
之前为大家推荐过的 AI 歌曲生成神器 Udio 最近推出了最新的 v1.5 模型,整体生成质量比之前有了大幅提升;还新增了音调控制、音轨拆分、音乐视频一键分享等新功能,使用更方便;中文歌曲的表现也比之前好很多,今天就一起来看看此次更新的具体细节。
还不了解 Udio 小伙伴可以先看这里:一、生成质量整体大提升
Udio 官网直达:
在 4 月份刚推出的时候,Udio 虽然在歌曲质量上令人惊艳,但是只能生成 32s 的音乐片段,无法直接构成一首完整的歌曲,因此整体效果
7/29/2024 7:31:51 AM
夏花生
让输出结果更稳定!超好用的 GPTs “窗口定向”策略
在前面几篇我分别讲解了 GPT 的基本使用、高阶技巧和 GPTs 的创建。GPTs 确实很好用,当我们预设好 prompt,可以创建一个个专属的、定向输出的 GPT 助手。然而,我在使用 GPTs 的过程中遇到了一个问题:每次使用自己创建的 GPTs 时,输出的结果仍存在随机性,难以保证一致的格式和风格。这增加了我对预设 Prompt 的顾虑,我开始的时候怀疑是因为我的 Prompt 定义的不够清楚,开始反复调试,并针对输出格式做三令五申般的限制,但在测试中仍然发现 GPT 的输出具有不稳定性。
为了应对这一问题,
7/29/2024 12:12:53 AM
小普
AI有哪些提高效率的落地应用场景?实战案例来了!
如果说今年的风口,那一定是 AI。不过 AI 像一把双刃剑,既有助益也有风险。我们将从 IBM Watson 的高飞与坠落,到 Google Allo 的黯然失色,探索 AI 应用中的教训。同时,瑞幸咖啡的成功故事展现了凭借策略得当的 AI 应用,即使在困境中也能崛起。通过 ChatGPT 实践案例,我们进一步揭示 AI 在日常工作中的潜能,从 PRD 文档编写到内容管理的自动化。最后,我们讨论如何与 AI 高效交流,确保 AI 是成为推动进步的力量而非阻碍。在整篇文章中,我将分享 AI 的正确应用价值,和如何嵌入
7/29/2024 12:02:29 AM
小普
防不胜防:黑客可利用 AI 通过 HDMI 线远程窃取屏幕信息
乌拉圭的研究人员发现,黑客可以使用人工智能通过拦截电脑显示器和主机之间 HDMI 线缆泄露的电磁辐射来窥探屏幕内容。他们表示,这种攻击可能已经存在,但普通家庭电脑用户不必过于担心。图源 Pexels据AI在线了解,攻击者可以通过多种方式实施攻击,包括使用放置在建筑物外的天线来拦截 HDMI 线缆的信号,这种间谍活动通过拦截从电脑 HDMI 线缆泄露的电磁辐射进行。研究人员表示,虽然数字视频传输比模拟信号复杂得多,但仍然存在可乘之机。乌拉圭共和国大学的费德里科・拉罗卡和他的团队开发了一种人工智能模型,可以从几米外的泄
7/28/2024 9:39:25 PM
远洋
Meta 训练 Llama 3 遭遇频繁故障:16384 块 H100 GPU 训练集群每 3 小时“罢工”一次
Meta 发布的一份研究报告显示,其用于训练 4050 亿参数模型 Llama 3 的 16384 个英伟达 H100 显卡集群在 54 天内出现了 419 次意外故障,平均每三小时就有一次。其中,一半以上的故障是由显卡或其搭载的高带宽内存(HBM3)引起的。由于系统规模巨大且任务高度同步,单个显卡故障可能导致整个训练任务中断,需要重新开始。尽管如此,Meta 团队还是保持了 90% 以上的有效训练时间。AI在线注意到,在为期 54 天的预预训练中,共出现了 466 次工作中断,其中 47 次是计划中断,419 次
7/28/2024 7:20:54 PM
远洋
阿里大模型元老杨红霞去向官宣:入职香港高校!被曝创业项目也在推进
最新消息,阿里大模型元老杨红霞入职香港理工大学,任电子计算机系教授。杨红霞是 AI 领域知名科学家。她曾在 IBM T.J.沃森研究中心担任研究人员,并在雅虎担任首席科学家。2016 年加入阿里巴巴,就职于达摩院智能计算实验室;2023 年 3 月入职字节跳动。她在达摩院期间领导了通义千问前身 M6 大模型的研发,是 M6 大模型从百亿、千亿参数量进化到万亿规模的主要功臣,并领导通义大模型核心技术“统一学习范式 OFA-M6”的开发。任职字节期间,她主要负责大模型研发,向字节 AML 和豆包大模型 Foundati
7/28/2024 5:47:12 PM
远洋
OpenAI SearchGPT 官方演示大翻车,源代码竟暴露搜索机制
SearchGPT 发布刚过两天,已有人灰度测试到了。今天,网友 Kesku 自制的 demo 全网刷屏,SearchGPT 结果输出如此神速,让所有人为之震惊。当询问 Porter Robinson 出了新唱片吗?只见,SearchGPT 眨眼功夫之间,即刻给出了答案「Smile」,最后还附上了链接。再来看移动版本的回答速度,回答延迟几乎为 0。评论区下方,震惊体铺屏。但另一方面,OpenAI 当天放出的官方演示,被外媒《大西洋月刊》曝出其中的问题。在回答「8 月在北卡罗来纳 Boone 举办的音乐节」的问题时,
7/28/2024 5:33:29 PM
远洋
密苏里大学许东:大模型时代,Prompt 为生物信息学研究带来新动力丨IJAIRR
自ChatGPT在2022年横空出世,人工智能领域便迎来了一场新的革命。 大语言模型(LLMs)以其卓越的文本处理能力,迅速成为研究者和开发者的新宠。 随着这些模型的崛起,如何与它们有效交互的问题也日益凸显,提示词(Prompt)的概念逐渐成为研究的热点。
7/28/2024 9:58:00 AM
岑大师
为什么AI数不清Strawberry里有几个 r?Karpathy:我用表情包给你解释一下
让模型知道自己擅长什么、不擅长什么是一个很重要的问题。还记得这些天大模型被揪出来的低级错误吗?不知道 9.11 和 9.9 哪个大,数不清 Strawberry 单词里面有多少个 r…… 每每被发现一个弱点,大模型都只能接受人们的无情嘲笑。嘲笑之后,大家也冷静了下来,开始思考:低级错误背后的本质是什么?大家普遍认为,是 Token 化(Tokenization)的锅。在国内,Tokenization 经常被翻译成「分词」。这个翻译有一定的误导性,因为 Tokenization 里的 token 指的未必是词,也可以
7/27/2024 11:22:00 PM
机器之心
贾扬清点赞:3K star量的SGLang上新,加速Llama 405B推理秒杀vLLM、TensorRT-LLM
用来运行 Llama 3 405B 优势明显。最近,Meta 开源了最新的 405B 模型(Llama 3.1 405B),把开源模型的性能拉到了新高度。由于模型参数量很大,很多开发者都关心一个问题:怎么提高模型的推理速度?时隔才两天,LMSYS Org 团队就出手了,推出了全新的 SGLang Runtime v0.2。这是一个用于 LLM 和 VLM 的通用服务引擎。在运行 Llama 3.1 405B 时,它的吞吐量和延迟表现都优于 vLLM 和 TensorRT-LLM。在某些情况下(运行 Llama 系列
7/27/2024 11:08:00 PM
机器之心
无视网站反 AI 抓取政策,Anthropic 爬虫机器人惹多个网站所有者不满
据 The Verge 当地时间 26 日报道,Anthropic 公司使用的 ClaudeBot 在短短 24 小时之内,就访问了 iFixit 网站近百万次,此举违反了该网站的使用条款。这一显得有些疯狂的举动,引起 iFixit 的 CEO Kyle Wiens 直接在 X(推特)上开怼,AI在线附大意如下:“如果这些请求(指访问)中的任何一个访问了我们的使用条款,那么它会告诉你我们的内容被明确禁止使用。别问我,去问 Claude!”“我知道你渴望获得数据,Claude 也真的很聪明!但是,你真的有必要在 24
7/27/2024 6:17:20 PM
清源
蔚来发布“中国首个”智能驾驶世界模型 NWM:0.1 秒内推演出 216 种可能发生的场景
在今日下午的 NIO IN 2024 蔚来创新科技日活动中,蔚来发布智能驾驶世界模型 NWM(NIO World Model),号称是“中国首个”。据介绍,它是一个多元自回归生成式的具身驾驶模型,可全量理解数据、具有长时序推演和决策能力,能在 100 毫秒内推演出 216 种可能发生的场景,在「万千平行世界」中寻找最优路径。作为生成式模型,NWM 还能基于 3 秒的驾驶视频,生成 120 秒的想象视频。NWM 具备与生俱来的闭环仿真测试能力,已在复杂交互场景中全面测试并验证性能。AI在线从发布会获悉,蔚来还发布了智
7/27/2024 4:33:32 PM
汪淼
70 年前的阿兰・图灵情书!计算机之父和一段「有罪」的罗曼史
1953 年,计算机之父 Alan Turing 和 Christopher Strachey 创作出情书生成器,科技与情感早在 70 年前以情书为载而交汇。在 20 世纪 50 年代初,曼彻斯特大学计算实验室的墙上贴满了小而奇特的情书。情书很寻常,不寻常的是,这些抒发炽热情感的情书是由冰冷算法写成的,远远早于 ChatGPT 出现 70 年。而情书背后的历史更加离奇,1952 年,早在阿尔特曼和 OpenAI 还不知道在哪儿的时候,曼彻斯特大学的两位学生,Alan Turing 和 Christopher Str
7/27/2024 4:12:12 PM
清源
大厂实战案例!如何用AIGC快速完成IP设计?
在公司接到一个 IP 形象的设计需求?作为乙方接到了甲方的 IP 设计?想要给自己设计一个 IP 形象?我知道你很急,但是请先别急,AIGC 也能做 IP!
本文邀请大家围观设计师是如何借助 AI 快速生产出 “图图”IP 的~一、图图是谁?为什么要做?
“图图“是 58 最新开发的图库平台-图狗 TUGO 的 IP 形象,本文将为大家带来 AIGC 是如何帮助设计师更高效地进行 IP 形象设计,为 IP 设计提供全新的创作方式和灵感。
IP 形象设计作为品牌设计延伸的一种,承载着品牌的独特性与想象空间。在品牌宣传
7/27/2024 7:51:05 AM
团队58UXD
“AI 分析师”登陆华尔街,摩根大通开始内部推广聊天机器人
据《金融时报》今日报道,摩根大通开始在公司内部推出一款生成式 AI 产品,并告诉员工这款“自有版本的 ChatGPT”可以完成研究分析师的工作。▲ 图源摩根大通报道援引摩根大通内部备忘录称,该公司已经向其资产和财富管理部门的员工提供了一个名为 LLM Suite 的大型语言模型平台。高管们告诉员工,LLM Suite 可以通过访问第三方模型帮助他们撰写、生成创意和总结文件。LLM Suite 被描述为一个“类似 ChatGPT 的产品”,用于“通用生产力”领域。知情人士表示,摩根大通今年早些时候开始向部分银行员工推
7/26/2024 11:09:38 PM
清源
大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容
Meta、OpenAI 等大模型厂商密集发力之际,谷歌也宣布了一项重磅更新 ——即日起,Gemini 聊天机器人将改由 Gemini 1.5 Flash 驱动。与之前的版本相比,窗口长度提高到了 4 倍,响应速度也更快了。按照谷歌的介绍,新版聊天机器人背后的 1.5 Flash 模型,主打的就是轻量化和速度提升。当然模型回复的质量也有提升,上下文窗口也从原先(基于 1.0 Pro)的 8k 提升到了 32k。此外新版聊天机器人还增加了“事实核查”功能,可以一键检测生成的内容是否属实,减轻模型幻觉带来的不良影响。有网
7/26/2024 10:36:43 PM
清源
智谱 AI CEO 张鹏谈文生视频:当前可用来做影视辅助工作,若要改变电影制作仍需距离
据新浪科技报道,智谱 CEO 张鹏今日接受采访,谈到了基于生成式 AI 的文生视频技术对影视行业的冲击等话题。他表示,从 OpenAI 的 Sora 出现之后,有关话题就一直在讨论。在国外,这件事已经引起很大影响,包括好莱坞罢工等。张鹏透露,自己有一次在北京电影学院与教师一同讨论此事,众人得出了一致的看法:从技术发展角度来看,大家都认为 AI 的发展“是很好的事情”,也是“很重要的方向”,对影视行业的变化有积极意义。张鹏表示,从目前来看,“至少也觉得如果把这项技术用在直接面向最终观众的生产过程当中,可能还是不太够。
7/26/2024 10:28:00 PM
清源
国际奥委会:最大限度发挥 AI 工具影响力,体育人才选拔方式有望得到革新
据新华社报道,在 24 日召开的发布会上,国际奥委会首席信息科技官伊拉里奥・科尔纳表示,已经确定了超过 180 个潜在的 AI 应用场景,要最大限度发挥它们的影响力。据介绍,AI 工具可以在辨别体育人才方面展现价值 —— 通过相应技术,仅凭手机软件就能在世界任何地方“发现”新的体育人才。目前,国际奥委会与英特尔正共同开发相关定制化技术,旨在帮助各国和地区奥委会创新体育人才识别和投资培养方式,相关技术已在塞内加尔完成相应测试。图源 Pexels2026 年,塞内加尔即将迎来非洲地区首个奥林匹克赛事 —— 达喀尔青奥会
7/26/2024 4:52:42 PM
清源
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind