应用
字节打造大模型TTS:不仅能高保真合成,而且支持调整编辑
通过高保真合成语音与真人语音无异。首先来听一段《凡人修仙传》:你猜的没错,这段有声书并非来自某个专业制作团队,而是一个 AI 模型 Seed-TTS,而这个模型则是来自字节跳动的 Seed Team。TTS 是指文本转语音,这是一种具备诸多妙用的技术,像是让个人智能助理说话、为视频或游戏配音、辅助视障人士、制作有声书等等。对于 TTS 技术研发者来说,流畅自然的表达一直以来都是值得追求的重要目标。字节跳动 Seed Team 发布的 Seed-TTS 不只是一个模型,而是一整个模型系列。论文标题:Seed-TTS:
6/18/2024 3:10:00 PM
机器之心
Runway版Sora发布:高保真、超强一致性,Gen-3 Alpha震撼到网友了
虽然生成的视频只有10秒左右,但在清晰度、细节、角色一致性等方面看起来可以匹敌现有一切视频生成模型。刚刚,AI视频生成初创公司Runway推出了新的视频生成基础模型Gen-3 Alpha。该模型可以创建具有复杂场景变化、多种电影风格和详细艺术指导的高精细视频。Runway表示,Gen-3 Alpha是即将推出的一系列模型中的首个。系列模型是在为大规模多模态训练而构建的新基础设施上训练的。与Gen-2相比,Gen-3 Alpha在保真度、一致性和运动性方面有了重大改进,并朝着构建通用世界模型迈出了重要一步。在博客中,
6/18/2024 2:48:00 PM
机器之心
AI 教父 Hinton:我支持超级 AI 取代人类
【新智元导读】「AI 教父」Geoffrey Hinton 在最近的采访中表达了自己对 AI 智能的理解 ——LLM 并不是简单的统计模型,已经具备了理解能力。与此同时,网友翻出了去年 12 月的「过期」视频,惊奇地发现 Hinton 早就「叛变」了,竟然对超级 AI 取代人类的未来表示支持。最近,半退休的「AI 教父」Geoffrey Hinton 频频出现在各种采访中,输出他关于 ASI 的各种言论和观点,甚至只是聊点生涯轶事都可以引起网友们的热烈讨论。不到一个月之前,他就揭发了爱徒 Ilya 在暑假受够了炸薯
6/18/2024 12:36:25 PM
汪淼
Canalys 预计今年全球 AI 手机市场份额达 16%,2028 年将激增至 54% 首次过半
根据 Canalys 对具有生成式 AI 能力智能手机市场的调研预测,2024 年,AI 手机出货量预计占全球智能手机出货量的 16%,到 2028 年,这一比例将激增至 54%。从 2023 年到 2028 年,AI 手机市场年均复合增长率(CAGR)将达到 63%。▲ 图片源于 Canalys 官网,下同从一些关键数据来看,全球有 63% 的受访者对于手机上的 AI 应用及 AI 能力有兴趣,仅有 7% 的受访者对 AI 手机展现出极高度的兴趣倾向。印度和中国大陆消费者对 AI 手机的兴趣倾向远高于德国和美国消
6/18/2024 11:59:32 AM
满河(实习)
让用户更省心驾驭 PDF 文档,Adobe Acrobat 升级 AI 技能:文生图、梳理信息等
Adobe 公司昨日(6 月 17 日)发布新闻稿,表示将于本周晚些时候开始,通过 Adobe 的 Firefly Image 3 模型,为旗下 Acrobat 应用程序添加图像生成功能。Adobe 公司表示 Acrobat 应用程序将引入全新的“Generate Image”功能,用户可以选择 PDF 文件中的某段内容,调用 AI 来生成图片,此外用户还可以调整生成图片的样式和大小,让其更契合整个 PDF 文档内容。Adobe 新版 Acrobat 应用程序还引入了“Edit Image”功能,通过 Firefl
6/18/2024 10:16:20 AM
故渊
Runway 发布第三代视频生成模型,90 秒生成 10 秒片段
专为电影和图像内容创作者打造生成式 AI 工具的公司 Runway 发布了 Gen-3 Alpha 视频生成模型。IT之家附 Gen-3 Alpha 官方网站: 表示,与其之前的旗舰视频模型 Gen-2 相比,该模型在生成速度和保真度方面有了“重大”改进,并且对生成视频的结构、风格和运动提供了细粒度的控制。Gen-3 将在未来几天内向 Runway 订阅用户提供,包括企业客户和 Runway 创意合作伙伴计划中的创作者。Runway 联合创始人 Anastasis Germanidis 表示,Gen-3 的视频生成
6/18/2024 10:10:02 AM
沛霖(实习)
超强 AI 视频生成模型 Dream Machine 来啦!效果秒杀 Runway,可免费使用
大家好,这里是和你们一起探索 AI 的花生~
最近一款新的 AI 视频生成模型 Dream Machine 爆火出圈,它虽然只能生成 5s 的视频片段,但是在画面清晰度、动态的自然流畅程度、以及对提示词的理解上秒杀了 Runway、Pika 等一众工具,甚至能与 Sora 一较高下,因此得到了很多专业人士的肯定和称赞。今天就为大家详细介绍一下 Dream Machine 的用法和特点。
相关推荐:Dream Machine
官网直达:
Dream Machine 是 Luma AI 新推出的一款视频生成模型,这家
6/18/2024 8:22:38 AM
夏花生
4500字深度思考!苹果如何用沉浸来重塑 AI 体验?
其实 6 月 11 日凌晨的 WWDC 24 特别活动,看得我特别煎熬。各个群里、社交媒体上都在等着苹果的 AI 王炸。压轴登场时,出乎意料,又在情理之中。周一晚上我精神涣散没来得及细想,第二天清醒之后,才咂摸出味来。
现场演示的功能,其实没有那么重要,但是它的存在形式和所指方向,又非常重要。
这篇稿子写了删,删了写,到现在才挤出来。是 Apple Intelligence,而非 AI
姑且把这次 WWDC 上苹果所「承诺」的,都视作为画饼。苹果一直都是谐音梗大户。Artificial Intelligence 是
6/18/2024 7:20:06 AM
陈子木
严打虚拟主播?腾讯微信视频号新规拟限制数字人带货
感谢近日,腾讯对《视频号橱窗达人“发布低质量内容”实施细则》进行修订,修订内容于今年 6 月 7 日-6 月 13 日进行意见征集。最新方案显示,“使用插件、AI 等工具生成虚拟形象进行直播”“提供、售卖、教学或展示平台不提倡传播的内容:如讲解和售卖虚拟人代播软件”等涉及虚拟人 / 数字人直播,将被视频号明确列入低质量内容,并进行违规处理。据澎湃新闻今日报道,相关人士透露,使用数字人 / 虚拟人直播目前属于平台直播带货中的违规行为,如被平台发现,将依据相关规则进行处罚,包括不限于减少直播推荐、减少账号推荐、限制直播
6/17/2024 9:10:22 PM
浩渺
加速生成式 AI 应用开发,亚马逊 AWS 宣布向全球创企提供 2.3 亿美元资助
亚马逊 AWS 云科技近日宣布将向全球 AI 初创企业提供价值 2.3 亿美元(IT之家备注:当前约 16.73 亿元人民币)的资助,以支持这些企业加速开发生成式 AI 应用。这部分资金将用于为初创(尤其是早期初创)企业提供指导、教育和免费的 AWS 云服务,促进这些企业进一步使用 AI 和 ML 技术。作为整体资助的一部分,亚马逊将启动第二批 AWS Generative AI Accelerator 计划,为 80 家使用生成式 AI 解决复杂挑战的顶级早期初创企业提供为期 10 周的系统性指导。这 80 家企
6/17/2024 6:52:11 PM
溯波(实习)
抖音联合博纳影业推出首部 AIGC 科幻短剧集《三星堆:未来启示录》
博纳影业出品制作、抖音联合出品的 AIGC 科幻短剧集《三星堆:未来启示录》今日亮相博纳 25 周年新闻发布会。该剧第一季共 12 集,由抖音联合出品,将在抖音短剧暑期档播出。即梦 AI 作为首席 AI 技术支持方,基于豆包大模型技术,为《三星堆:未来启示录》提供了 AI 剧本创作、概念及分镜设计、镜头画面生成、图像到视频转换、视频编辑和媒体内容增强等十种 AI 技术。据介绍,《三星堆:未来启示录》的故事设定在科技飞速发展的近未来。地球古文明遗迹的异变引起全球古文明研究组织的高度关注,泛大西洋人工智能组织 ACE
6/17/2024 6:36:16 PM
汪淼
项目征集 | 全球创新项目路演:AI创新集结号,寻找下一个科技独角兽!
“全球创新项目路演”作为深度链接世界人工智能大会(WAIC)和全球开发者先锋大会(GDC)两大行业顶级盛会的投融资对接平台及全球合作平台的重要活动之一,旨在为创新和创业项目提供优秀的展示平台,推动其技术创新及落地转化;同时为企业与投资人做好精准对接,帮助企业在合适的时间内完成融资,推动企业高质量发展。 作为人工智能行业的顶级路演IP,自创办以来累计收到来自海内外近千家人工智能初创和成长型企业的踊跃报名,覆盖北美、欧洲、亚太等多个国家地区以及上海、北京、深圳等国内城市。 吸引近百家投资机构参与,包括政府产业基金、上市公司战投以及财务投资。
6/17/2024 5:05:00 PM
我在思考中
软银宣布与 Perplexity AI 搜索引擎达成战略合作:其用户可免费试用一年 Pro 订阅,价值 29500 日元
感谢日本软银今天宣布与 AI 初创公司 Perplexity 达成战略合作,将于 6 月 19 日向 Softbank、Y-Mobile 和 LINEMO 三大品牌的用户开放 Perplexity Pro 一年免费试用的申请。据介绍,Perplexity Pro 是 AI 搜索引擎 Perplexity 的付费订阅版本,提供更多专业搜索次数、自选 AI 模型、限量上传及分析文件等功能,一年订阅价值 29500 日元(IT之家备注:当前约 1362 元人民币)。Perplexity 今年 4 月获得来自软银和德国电信
6/17/2024 4:00:45 PM
泓澄(实习)
全域机动的豪华电动越野座驾,猛士917蛟龙战甲开启预售
6月17日,中国第一款电影联名车,东风旗下猛士科技全域机动豪华电动越野座驾——猛士917蛟龙战甲正式开启预售,新车预售价格区间为76.8万元—86.8万元。猛士917蛟龙战甲还推出了具有吸引力的预定政策: 9月17日前下定的大定用户,可享终身整车质保、终身免费取送车、终身免费移动服务车、终身免费道路救援、连续5年20G每月座舱娱乐流量、一年影音会员等6大权益。除此之外,还将赠送家冲充桩、碳纤维内饰套件、原厂底盘装甲等3项限定大礼,总价值达到28000元。作为中国第一款电影联名车,猛士917蛟龙战甲出道大银幕,彰显了
6/17/2024 3:39:00 PM
新闻助手
利用 AI 合成“艳照”敲诈勒索,广东 / 山东警方破获两起“AI 换脸伪造不雅照”案
今天央视新闻 CCTV13《法治在线》介绍了两起“AI 换脸伪造不雅照”案,相关诈骗团伙主要利用被害者视频照片信息制作“艳照”进行敲诈。IT之家从报道中获悉,深圳市民吴先生近日收到一张包含自己与一名不认识女子的“艳照”彩信,犯罪嫌疑人同时在彩信中威胁当事人需在指定时间前将钱财转到指定账号“破财消灾”,此后吴先生报警求助。深圳坪山警方经调查锁定了一个流窜作案的犯罪团伙,该团伙以“已掌握你在外面找小姐”、“艳照将公诸于众”等方式进行威胁,在多地警方协作下,警方抓获了以王某为首的十多名犯罪嫌疑人,相关团伙分工明确,据称“
6/17/2024 3:32:10 PM
漾仔
3D 版 SORA 来了!DreamTech 推出全球首个原生 3D-DiT 大模型 Direct3D
2024 年 5 月,DreamTech 官宣了其高质量 3D 生成大模型 Direct3D,并公开了相关学术论文 Direct3D: Scalable Image-to-3D Generation via 3D Latent Diffusion Transformer。链接: 3D 大模型,通过采用 3D Diffusion Transformer (3D-DiT),解决了长期以来困扰行业的高质量三维内容生成难题。坚持原生 3D 技术路线并取得突破此前,3D AIGC 通常采用的技术路线是 2D-to-3D li
6/17/2024 3:25:00 PM
机器之心
《奇点临近》续作来了!雷・库兹韦尔预言人类「永生」,活 120 岁太短
感谢IT之家网友 刺客 的线索投递!【新智元导读】雷・库兹韦尔即将出版《奇点临近》的全新续作 ——《奇点更近》。在书中,他更加大胆地承诺,人类可以获得「永生」,库兹韦尔认为在本世纪 40-50 年代,人类将重建自己的身体和大脑,使其远远超出我们生物体的能力。声名赫赫的未来学家雷・库兹韦尔(Ray Kurzweil),即将出版新书《奇点更近:当我们与人工智能融合》(The Singularity Is Nearer: When We Merge With AI)。将由企鹅兰登旗下的维京出版社于 2024 年 6 月
6/17/2024 2:58:15 PM
清源
AI 一键去衣“1 块 5 一张”,北京一男子非法制造七千余张不雅照片被捕
今天央视新闻 CCTV13《法治在线》曝光了一起“AI 脱衣”案件,北京一男子白某某在社交平台上刊载广告,声称可提供“一键去衣”服务,单价为“1 块 5 一张”,警方根据其留下的账号线索顺藤摸瓜抓获了嫌疑人。IT之家从报道中获悉,该男子在 2023 年 6 月至 8 月利用 Stable Diffusion 框架配合特定 AI 模型,在社交平台公然发布广告,并利用微信 / QQ 等聊天工具进行交流转账,将他人提供的女明星、女同事、女同学照片制作为裸体不雅照片。据检察机关统计,白某某在社交平台上发布的广告点击量有 3
6/17/2024 2:56:13 PM
漾仔
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
Anthropic
英伟达
代码
训练
算法
Stable Diffusion
芯片
LLM
AI新词
蛋白质
开发者
腾讯
生成式
Claude
苹果
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
人形机器人
xAI
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
场景
大型语言模型
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
特斯拉
应用