AI在线 AI在线

应用

AI 歌曲生成神器 Udio 重磅更新!可拆分音轨/控制音调/中文优化明显

大家好,这里是和你们一起探索 AI 的花生~ 之前为大家推荐过的 AI 歌曲生成神器 Udio 最近推出了最新的 v1.5 模型,整体生成质量比之前有了大幅提升;还新增了音调控制、音轨拆分、音乐视频一键分享等新功能,使用更方便;中文歌曲的表现也比之前好很多,今天就一起来看看此次更新的具体细节。 还不了解 Udio 小伙伴可以先看这里:一、生成质量整体大提升 Udio 官网直达: 在 4 月份刚推出的时候,Udio 虽然在歌曲质量上令人惊艳,但是只能生成 32s 的音乐片段,无法直接构成一首完整的歌曲,因此整体效果
7/29/2024 7:31:51 AM
夏花生

让输出结果更稳定!超好用的 GPTs “窗口定向”策略

在前面几篇我分别讲解了 GPT 的基本使用、高阶技巧和 GPTs 的创建。GPTs 确实很好用,当我们预设好 prompt,可以创建一个个专属的、定向输出的 GPT 助手。然而,我在使用 GPTs 的过程中遇到了一个问题:每次使用自己创建的 GPTs 时,输出的结果仍存在随机性,难以保证一致的格式和风格。这增加了我对预设 Prompt 的顾虑,我开始的时候怀疑是因为我的 Prompt 定义的不够清楚,开始反复调试,并针对输出格式做三令五申般的限制,但在测试中仍然发现 GPT 的输出具有不稳定性。 为了应对这一问题,
7/29/2024 12:12:53 AM
小普

AI有哪些提高效率的落地应用场景?实战案例来了!

如果说今年的风口,那一定是 AI。不过 AI 像一把双刃剑,既有助益也有风险。我们将从 IBM Watson 的高飞与坠落,到 Google Allo 的黯然失色,探索 AI 应用中的教训。同时,瑞幸咖啡的成功故事展现了凭借策略得当的 AI 应用,即使在困境中也能崛起。通过 ChatGPT 实践案例,我们进一步揭示 AI 在日常工作中的潜能,从 PRD 文档编写到内容管理的自动化。最后,我们讨论如何与 AI 高效交流,确保 AI 是成为推动进步的力量而非阻碍。在整篇文章中,我将分享 AI 的正确应用价值,和如何嵌入
7/29/2024 12:02:29 AM
小普

防不胜防:黑客可利用 AI 通过 HDMI 线远程窃取屏幕信息

乌拉圭的研究人员发现,黑客可以使用人工智能通过拦截电脑显示器和主机之间 HDMI 线缆泄露的电磁辐射来窥探屏幕内容。他们表示,这种攻击可能已经存在,但普通家庭电脑用户不必过于担心。图源 Pexels据AI在线了解,攻击者可以通过多种方式实施攻击,包括使用放置在建筑物外的天线来拦截 HDMI 线缆的信号,这种间谍活动通过拦截从电脑 HDMI 线缆泄露的电磁辐射进行。研究人员表示,虽然数字视频传输比模拟信号复杂得多,但仍然存在可乘之机。乌拉圭共和国大学的费德里科・拉罗卡和他的团队开发了一种人工智能模型,可以从几米外的泄
7/28/2024 9:39:25 PM
远洋

Meta 训练 Llama 3 遭遇频繁故障:16384 块 H100 GPU 训练集群每 3 小时“罢工”一次

Meta 发布的一份研究报告显示,其用于训练 4050 亿参数模型 Llama 3 的 16384 个英伟达 H100 显卡集群在 54 天内出现了 419 次意外故障,平均每三小时就有一次。其中,一半以上的故障是由显卡或其搭载的高带宽内存(HBM3)引起的。由于系统规模巨大且任务高度同步,单个显卡故障可能导致整个训练任务中断,需要重新开始。尽管如此,Meta 团队还是保持了 90% 以上的有效训练时间。AI在线注意到,在为期 54 天的预预训练中,共出现了 466 次工作中断,其中 47 次是计划中断,419 次
7/28/2024 7:20:54 PM
远洋

阿里大模型元老杨红霞去向官宣:入职香港高校!被曝创业项目也在推进

最新消息,阿里大模型元老杨红霞入职香港理工大学,任电子计算机系教授。杨红霞是 AI 领域知名科学家。她曾在 IBM T.J.沃森研究中心担任研究人员,并在雅虎担任首席科学家。2016 年加入阿里巴巴,就职于达摩院智能计算实验室;2023 年 3 月入职字节跳动。她在达摩院期间领导了通义千问前身 M6 大模型的研发,是 M6 大模型从百亿、千亿参数量进化到万亿规模的主要功臣,并领导通义大模型核心技术“统一学习范式 OFA-M6”的开发。任职字节期间,她主要负责大模型研发,向字节 AML 和豆包大模型 Foundati
7/28/2024 5:47:12 PM
远洋

OpenAI SearchGPT 官方演示大翻车,源代码竟暴露搜索机制

SearchGPT 发布刚过两天,已有人灰度测试到了。今天,网友 Kesku 自制的 demo 全网刷屏,SearchGPT 结果输出如此神速,让所有人为之震惊。当询问 Porter Robinson 出了新唱片吗?只见,SearchGPT 眨眼功夫之间,即刻给出了答案「Smile」,最后还附上了链接。再来看移动版本的回答速度,回答延迟几乎为 0。评论区下方,震惊体铺屏。但另一方面,OpenAI 当天放出的官方演示,被外媒《大西洋月刊》曝出其中的问题。在回答「8 月在北卡罗来纳 Boone 举办的音乐节」的问题时,
7/28/2024 5:33:29 PM
远洋

密苏里大学许东:大模型时代,Prompt 为生物信息学研究带来新动力丨IJAIRR

自ChatGPT在2022年横空出世,人工智能领域便迎来了一场新的革命。 大语言模型(LLMs)以其卓越的文本处理能力,迅速成为研究者和开发者的新宠。 随着这些模型的崛起,如何与它们有效交互的问题也日益凸显,提示词(Prompt)的概念逐渐成为研究的热点。
7/28/2024 9:58:00 AM
岑大师

为什么AI数不清Strawberry里有几个 r?Karpathy:我用表情包给你解释一下

让模型知道自己擅长什么、不擅长什么是一个很重要的问题。还记得这些天大模型被揪出来的低级错误吗?不知道 9.11 和 9.9 哪个大,数不清 Strawberry 单词里面有多少个 r…… 每每被发现一个弱点,大模型都只能接受人们的无情嘲笑。嘲笑之后,大家也冷静了下来,开始思考:低级错误背后的本质是什么?大家普遍认为,是 Token 化(Tokenization)的锅。在国内,Tokenization 经常被翻译成「分词」。这个翻译有一定的误导性,因为 Tokenization 里的 token 指的未必是词,也可以
7/27/2024 11:22:00 PM
机器之心

贾扬清点赞:3K star量的SGLang上新,加速Llama 405B推理秒杀vLLM、TensorRT-LLM

用来运行 Llama 3 405B 优势明显。最近,Meta 开源了最新的 405B 模型(Llama 3.1 405B),把开源模型的性能拉到了新高度。由于模型参数量很大,很多开发者都关心一个问题:怎么提高模型的推理速度?时隔才两天,LMSYS Org 团队就出手了,推出了全新的 SGLang Runtime v0.2。这是一个用于 LLM 和 VLM 的通用服务引擎。在运行 Llama 3.1 405B 时,它的吞吐量和延迟表现都优于 vLLM 和 TensorRT-LLM。在某些情况下(运行 Llama 系列
7/27/2024 11:08:00 PM
机器之心

无视网站反 AI 抓取政策,Anthropic 爬虫机器人惹多个网站所有者不满

据 The Verge 当地时间 26 日报道,Anthropic 公司使用的 ClaudeBot 在短短 24 小时之内,就访问了 iFixit 网站近百万次,此举违反了该网站的使用条款。这一显得有些疯狂的举动,引起 iFixit 的 CEO Kyle Wiens 直接在 X(推特)上开怼,AI在线附大意如下:“如果这些请求(指访问)中的任何一个访问了我们的使用条款,那么它会告诉你我们的内容被明确禁止使用。别问我,去问 Claude!”“我知道你渴望获得数据,Claude 也真的很聪明!但是,你真的有必要在 24
7/27/2024 6:17:20 PM
清源

蔚来发布“中国首个”智能驾驶世界模型 NWM:0.1 秒内推演出 216 种可能发生的场景

在今日下午的 NIO IN 2024 蔚来创新科技日活动中,蔚来发布智能驾驶世界模型 NWM(NIO World Model),号称是“中国首个”。据介绍,它是一个多元自回归生成式的具身驾驶模型,可全量理解数据、具有长时序推演和决策能力,能在 100 毫秒内推演出 216 种可能发生的场景,在「万千平行世界」中寻找最优路径。作为生成式模型,NWM 还能基于 3 秒的驾驶视频,生成 120 秒的想象视频。NWM 具备与生俱来的闭环仿真测试能力,已在复杂交互场景中全面测试并验证性能。AI在线从发布会获悉,蔚来还发布了智
7/27/2024 4:33:32 PM
汪淼

70 年前的阿兰・图灵情书!计算机之父和一段「有罪」的罗曼史

1953 年,计算机之父 Alan Turing 和 Christopher Strachey 创作出情书生成器,科技与情感早在 70 年前以情书为载而交汇。在 20 世纪 50 年代初,曼彻斯特大学计算实验室的墙上贴满了小而奇特的情书。情书很寻常,不寻常的是,这些抒发炽热情感的情书是由冰冷算法写成的,远远早于 ChatGPT 出现 70 年。而情书背后的历史更加离奇,1952 年,早在阿尔特曼和 OpenAI 还不知道在哪儿的时候,曼彻斯特大学的两位学生,Alan Turing 和 Christopher Str
7/27/2024 4:12:12 PM
清源

大厂实战案例!如何用AIGC快速完成IP设计?

在公司接到一个 IP 形象的设计需求?作为乙方接到了甲方的 IP 设计?想要给自己设计一个 IP 形象?我知道你很急,但是请先别急,AIGC 也能做 IP! 本文邀请大家围观设计师是如何借助 AI 快速生产出 “图图”IP 的~一、图图是谁?为什么要做? “图图“是 58 最新开发的图库平台-图狗 TUGO 的 IP 形象,本文将为大家带来 AIGC 是如何帮助设计师更高效地进行 IP 形象设计,为 IP 设计提供全新的创作方式和灵感。 IP 形象设计作为品牌设计延伸的一种,承载着品牌的独特性与想象空间。在品牌宣传
7/27/2024 7:51:05 AM
团队58UXD

“AI 分析师”登陆华尔街,摩根大通开始内部推广聊天机器人

据《金融时报》今日报道,摩根大通开始在公司内部推出一款生成式 AI 产品,并告诉员工这款“自有版本的 ChatGPT”可以完成研究分析师的工作。▲ 图源摩根大通报道援引摩根大通内部备忘录称,该公司已经向其资产和财富管理部门的员工提供了一个名为 LLM Suite 的大型语言模型平台。高管们告诉员工,LLM Suite 可以通过访问第三方模型帮助他们撰写、生成创意和总结文件。LLM Suite 被描述为一个“类似 ChatGPT 的产品”,用于“通用生产力”领域。知情人士表示,摩根大通今年早些时候开始向部分银行员工推
7/26/2024 11:09:38 PM
清源

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Meta、OpenAI 等大模型厂商密集发力之际,谷歌也宣布了一项重磅更新 ——即日起,Gemini 聊天机器人将改由 Gemini 1.5 Flash 驱动。与之前的版本相比,窗口长度提高到了 4 倍,响应速度也更快了。按照谷歌的介绍,新版聊天机器人背后的 1.5 Flash 模型,主打的就是轻量化和速度提升。当然模型回复的质量也有提升,上下文窗口也从原先(基于 1.0 Pro)的 8k 提升到了 32k。此外新版聊天机器人还增加了“事实核查”功能,可以一键检测生成的内容是否属实,减轻模型幻觉带来的不良影响。有网
7/26/2024 10:36:43 PM
清源

智谱 AI CEO 张鹏谈文生视频:当前可用来做影视辅助工作,若要改变电影制作仍需距离

据新浪科技报道,智谱 CEO 张鹏今日接受采访,谈到了基于生成式 AI 的文生视频技术对影视行业的冲击等话题。他表示,从 OpenAI 的 Sora 出现之后,有关话题就一直在讨论。在国外,这件事已经引起很大影响,包括好莱坞罢工等。张鹏透露,自己有一次在北京电影学院与教师一同讨论此事,众人得出了一致的看法:从技术发展角度来看,大家都认为 AI 的发展“是很好的事情”,也是“很重要的方向”,对影视行业的变化有积极意义。张鹏表示,从目前来看,“至少也觉得如果把这项技术用在直接面向最终观众的生产过程当中,可能还是不太够。
7/26/2024 10:28:00 PM
清源

国际奥委会:最大限度发挥 AI 工具影响力,体育人才选拔方式有望得到革新

据新华社报道,在 24 日召开的发布会上,国际奥委会首席信息科技官伊拉里奥・科尔纳表示,已经确定了超过 180 个潜在的 AI 应用场景,要最大限度发挥它们的影响力。据介绍,AI 工具可以在辨别体育人才方面展现价值 —— 通过相应技术,仅凭手机软件就能在世界任何地方“发现”新的体育人才。目前,国际奥委会与英特尔正共同开发相关定制化技术,旨在帮助各国和地区奥委会创新体育人才识别和投资培养方式,相关技术已在塞内加尔完成相应测试。图源 Pexels2026 年,塞内加尔即将迎来非洲地区首个奥林匹克赛事 —— 达喀尔青奥会
7/26/2024 4:52:42 PM
清源