应用
字节跳动发布豆包视频生成模型,这效果让我分不清 AI 与现实
9 月 24 日,火山引擎 AI 创新巡展在深圳举办,带来了豆包大模型的最新进展。豆包大模型家族迎来了新成员。具体来说,火山引擎全新推出了豆包・视频生成模型,以及豆包音乐模型、同声传译模型,同时还升级了通用语言模型、文生图模型、语音模型,不断增强各类模态以及规模化的调用量,让豆包大模型“更强模型、更低价格、更易落地”的优势持续凸显。此外,多家行业客户也在会上分享了大模型应用的实践经验。本次豆包带来的一系列大模型进展中,最引人关注的,莫过于全新豆包视频生成模型,它能够带来影视级视觉感受的视频生成效果,全面推动豆包大模
9/29/2024 1:24:05 PM
汐元
研究发现:AI 越聪明就越有可能“胡编乱造”
一项新研究发现,随着大型语言模型(LLM)变得越来越强大,它们似乎也越来越容易编造事实,而不是避免或拒绝回答它们无法回答的问题。这表明,这些更聪明的 AI 聊天机器人实际上变得不太可靠。图源 PexelsAI在线注意到,该研究发表在《自然》杂志上,研究人员研究了一些业界领先的商业 LLM:OpenAI 的 GPT 和 Meta 的 LLaMA,以及由研究小组 BigScience 创建的开源模型 BLOOM。研究发现,虽然这些 LLM 的回答在许多情况下变得更加准确,但总体上可靠性更差,给出错误答案的比例比旧模型更
9/29/2024 1:20:36 PM
远洋
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
「火山爆发,震撼天地。」这八个字会在你的头脑中触发怎样的影像?是否与下面的视频类似? 提示词:火山喷发,升起巨大蘑菇云,岩浆顺着山体往下流,镜头拉近,岩浆正在火山口跳动冒出。这段 10 秒的视频是豆包视频生成模型基于以上提示词想象创造的。可以说这段视频的拟真度非常高,并且有着娴熟的运镜,足以放入任何影视作品中。有着剪映、即梦等视频创作工具的字节跳动,正式宣告进军 AI 视频生成领域。那是在本周二,「2024 火山引擎 AI 创新巡展」来到了深圳。这一巡展上,字节跳
9/29/2024 12:54:00 PM
机器之心
顶会卷到中学:人大附中吴悠上榜 NeurIPS,入选高中赛道 Spotlight
NeurIPS 2024 放榜,人大附中有高中生一作入选。今年,NeurIPS 率先把 AI 顶会卷到了高中里,正式面向高中生征集论文,还为此专门设置了高中生赛道(High School Projects Track)。现在结果终于出炉,北京大学计算机学院的张铭教授分享了一则入围消息:人大附中吴悠,有一篇一作论文入选该赛道,还被选为了 Spotlight Project。论文题为《Vision-Braille:An End-to-End Tool for Chinese Braille Image-to-Text
9/29/2024 12:45:39 PM
汪淼
最受欢迎开源大模型,为什么是通义?
开源与闭源之争早已非新奇的话题,但毋庸置疑的是,开源极大地促进了大模型技术发展和生态繁荣。 大模型被认为是最烧钱的技术,训练一个大模型往往需要大量的数据、计算资源,导致训练成本巨大,众所周知GPT-3的训练费用据说超过 4600万美元,在大模型开源之前,大模型一直是那些有大量资金加持的大厂和明星创业公司才有资格碰的事情。 随着如 llama、Mistral、Falcon 这些开源先锋搅动了整个大模型竞争浪潮,那些没有AI积累的企业、大量中小公司团队,今天个人开发者,都能基于开源底座模型,用很低的成本训练、部署自己的专属模型,llama 这样的开源先锋也因此拥有一众拥趸。
9/29/2024 11:15:00 AM
张进
用一篇文章,帮你掌握 Midjourney 的人物风格迁移功能!
大家好,这里是 BananaStudio,上一篇介绍了如何用提示词描述画面中的多个人物,其中提到了 cref,今天详细带大家搞清楚 MJ 人物风格化迁移功能 Character Reference,也就是—cref 命令。如何仿照目标图来生成一样的图?
现在 MJ 中有三种方式可以达成:
① 垫图(最常用的手法)将构图、主题和一些风格大致应用到你生图中。操作说明:参考图片需要上传到 Discord,复制图片的 URL 添加到提示词中。在随后的生图中将会参照你写的提示词和参考垫图中的信息,通过添加“--iw”(图片权
9/29/2024 8:24:22 AM
BananaStudio
国际机器人联合会:2023 年我国新安装工业机器人 27.63 万台,超全球半数
综合新华社、央视财经今日报道,总部位于德国法兰克福的国际机器人联合会报告显示,2023 年,中国新安装的工业机器人数量达到 27.63 万台,占全球新安装量的 51%。总量上,我国 2023 年工业机器人总保有量为近 180 万台,位居全球第一,并将继续保持全球最大工业机器人市场的地位,今年下半年中国机器人市场也将加速扩大。从长远来看,中国制造业领域对机器人需求仍有很大增长潜力,预计到 2027 年,年均增长率将达到 5% 至 10%。全球 2023 年工业机器人总保有量约 428.2 万台,比前一年增加 10%。
9/28/2024 9:52:24 PM
清源
苏黎世联邦理工学院研究:AI 可 100% 绕过谷歌 reCAPTCHA V2 验证
据 Ars Technica 今日报道,苏黎世联邦理工学院博士生 Andreas Plesner 及其同事发表了一项新研究,研究重点放在了谷歌的验证码系统 reCAPTCHA V2 上。该研究声称,使用经过专门训练的图像识别模型运行的本地机器人在应对这类图片验证码时的表现,可以与人类相媲美,成功率达到了 100%。AI在线注:谷歌 reCAPTCHA V2 验证码通常会向用户提供一组图片,要求识别出图中的哪些部分包含自行车、巴士、人行道、楼梯或红绿灯等项目。根据谷歌的说法,该系统已在几年前逐步进入淘汰阶段,新的 r
9/28/2024 7:37:45 PM
清源
中国电信 AI 研究院完成首个全国产化万卡万参大模型训练,TeleChat2-115B 对外开源
“中国电信人工智能研究院”官方公众号今天宣布,中国电信人工智能研究院(AI在线注:下文称 TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型,并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型 —— 星辰语义大模型 TeleChat2-115B。官方表示,这项科研成果标志着国产大模型训练真正实现全国产化替代,正式进入全国产自主创新、安全可控的新阶段。TeleChat2-115B 基于中国电信自研的天翼云“息壤一体化智算服务平台”和人工智能公司“星海 AI 平台”训练完成
9/28/2024 6:38:22 PM
清源
美 FTC 宣布将打击“虚假宣传 AI 能力”公司,首批起诉五家企业
美国联邦贸易委员会(FTC)在 9 月 25 日宣布将向虚假宣传 AI 技术或销售劣质 AI 技术的公司展开法律行动,首批被 FTC 起诉的五家公司包括 DoNotPay、Ascend Ecom、Ecommerce Empire Builders、Rytr 和 FBA Machine。据悉,其中 DoNotPay 提供机器人律师服务,该 AI 主力由斯坦福大学学生 Joshua Browder 于 2016 年推出,号称能够替代人类律师,季订阅费为 36 美元(AI在线备注:当前约 252 元人民币)。▲ DoNo
9/28/2024 5:00:05 PM
漾仔
OpenAI:计划五年内将 ChatGPT 每月订阅费用提高到最高 44 美元
感谢据 Engadget 当地时间 27 日报道,OpenAI 告诉投资者,该公司计划在今年年底前收取 ChatGPT 每月 22 美元(IT 之家备注:当前约 154 元人民币)的费用,并计划在未来五年内积极提高月费,最高将提升至 44 美元(当前约 308 元人民币)。图源 Pexels报道提到,OpenAI 正在从非营利公司向盈利公司的转变迈步,这种商业模式可取消对投资者汇报的任何上限,因此公司将有更大的空间以潜在的更高价格与新投资者谈判。文件显示,OpenAI 今年 8 月的营收为 3 亿美元(当前约 21
9/28/2024 4:18:47 PM
清源
工信部:截至 2024 年 6 月底,我国算力总规模达 246EFLOPS
2024 中国算力大会“算力中国・创投活力”论坛昨日在郑州召开。作为以算力为主题的大会,工业和信息化部信息通信发展司副司长赵策在论坛上介绍了我国算力运营和使用的最新情况,AI在线整理如下(截至 2024 年 6 月底):我国在用数据中心机架数达到 830 万标准机架,算力总规模达到 246EFLOPS(2460 万亿次浮点运算)智能算力规模超过 76EFLOPS算力应用创新案例超过 13000 个,覆盖工业、金融、交通等生产生活领域人工智能企业数量超过 4500 家工业和信息化部总工程师赵志国表示,互联互通纵深推进
9/28/2024 3:25:32 PM
沛霖(实习)
Science 子刊封面:500 年前拉斐尔怎么作画,AI 看一眼就知道
AI 的跨界,只有想不到,没有办不到。艺术学家们用深度学习模型分析拉斐尔的画作,不仅能分析出用了什么颜料、怎么画的,还能知道 500 年前拿着画笔的是不是拉斐尔本人。DALL-E、MidJourney 等工具的诞生,让我们看到了 GenAI 高超的「创作技能」。但如果反过来,让 AI 去分析艺术大师的画作,它们又会有怎样的表现?最近,Science Advances 封面刊登了一篇来自意大利文化遗产科学研究所的论文。他们将两幅著名的拉斐尔画作进行了 MA-XRF 扫描,并使用深度学习模型进行分析。结果发现,AI 不
9/28/2024 3:21:09 PM
清源
o1 规划能力首测:已超越语言模型范畴,preview 终于赢 mini 一回
o1-preview 终于赢过了 mini 一次!亚利桑那州立大学的最新研究表明,o1-preview 在规划任务上,表现显著优于 o1-mini。相比于传统模型的优势更是碾压级别,在超难任务上的准确率比 Llama3.1-405B 高了 11 倍。要知道之前,OpenAI 自己人也发了一张图,显示 preview 论性能比不过满血版,论经济性又不如 mini,处于一个十分尴尬的地位。作者在推文中表示,尽管存在可保证性和成本问题,但仅针对 CoT 而言,o1 已经超越了大模型的“近似检索”性质,提升到了“近似推理”
9/28/2024 3:09:17 PM
清源
三星预言 2025 年将掀起 AI 普及浪潮,重塑消费者日常生活方式
科技媒体 techradar 今天(9 月 28 日)发布博文,报道称三星 Galaxy AI 项目负责人 YoungJip Kim 表示:“2025 年将是 AI 普及元年,未来 AI 将出现在生活的每个角落”。Kim 在采访中表示:“消费者对于 AI 技术的期望不断拔高,而大多数科技公司都在这方面非常努力。AI 技术的蓬勃发展,将会进一步扩充聊天互动之外的方式,用更多元化的方式、更先进的技术变革我们的日常生活”。他举了例子说明即使是最普通的 AI 应用也能改变生活,如 AI 翻译功能消除了语言障碍。AI在线援引
9/28/2024 2:48:44 PM
故渊
苹果反水:OpenAI的1500亿「史上最大」融资轮,难了
有金主已经决定收手。在 OpenAI,高层变动正在成为一种传统。在不到两年的时间里,OpenAI 从一个 AI 圈内领先的实验室,发展成为一家全球知名的企业。在首席执行官山姆・奥特曼(Sam Altman)被罢免并迅速复职不到一年后,今年 9 月,三位高层领导突然宣布辞职。一个摆在台面上的问题是:这次宫斗的时间点,就在 OpenAI 即将完成可能是硅谷史上最大一轮融资的同一周。本周,OpenAI 首席技术官 Mira Murati、首席研究官 Bob McGrew 和 Post Training 研究副总裁 Bar
9/28/2024 2:26:00 PM
机器之心
长短大小样样精通!原始分辨率、超长视频输入:更灵活的全开源多模态架构Oryx
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文的主要作者来自清华大学智能视觉实验室(i-Vision Group)、腾讯公司和南洋理工大学 S-Lab。本文的共同第一作者为清华大学自动化系博士生刘祖炎和南洋理工大学博士生董宇昊,主
9/28/2024 1:59:00 PM
机器之心
Voyage-3 系列嵌入式 AI 模型登场:1/2.2 成本、1/3 嵌入维度下性能超 OpenAI v3 Large 模型 7.55%
科技媒体 marktechpost 昨日(9 月 27 日)发布博文,报道称 Voyage AI 公司推出了 Voyage-3 和 Voyage-3-Lite 两个嵌入式(Embedding)模型。这两个模型在技术、法律、金融、多语言应用和长文本理解等方面,均表现出超出同类模型的优势,在保持较小模型规模和较低的资源消耗情况下,为开发者提供更高效、更易于集成的解决方案。AI在线援引 Voyage AI 官方数据,在技术文档、代码、法律、金融、网页内容、多语言数据集、长文档和对话数据等方面,Voyage-3 以 1/2
9/28/2024 1:55:54 PM
故渊
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
LLaMA
Copilot
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind