应用
剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器
PreFLMR模型是一个通用的预训练多模态知识检索器,可用于搭建多模态RAG应用。模型基于发表于 NeurIPS 2023 的 Fine-grained Late-interaction Multi-modal Retriever (FLMR) 并进行了模型改进和 M2KR 上的大规模预训练。论文链接: 链接:::PreFLMR: Scaling Up Fine-Grained Late-Interaction Multi-modal Retrievers背景尽管多模态大模型(例如 GPT4-Vision、Gemi
3/25/2024 2:36:00 PM
机器之心
通用文档理解新SOTA,多模态大模型TextMonkey来了
最近,华中科技大学和金山的研究人员在多模态大模型 Monkey [1](Li et al., CVPR2024)工作的基础上提出 TextMonkey。在多个场景文本和文档的测试基准中,TextMonkey 处于国际领先地位,有潜力带来办公自动化、智慧教育、智慧金融等行业应用领域的技术变革。论文链接:: 是一个专注于文本相关任务(包括文档问答和场景文本问答)的多模态大模型(LMM)。相比于 Monkey,TextMonkey 在多个方面进行改进:通过采用零初始化的 Shifted Window Attention,
3/25/2024 2:30:00 PM
机器之心
32K上下文,Mistral 7B v0.2 基模型突然开源了
刚刚,Mistral AI 的模型又更新了。这次开源一如既往地「突然」,是在一个叫做 Cerebral Valley 的黑客松活动上公布的。PPT 一翻页,全场都举起了手机拍照:这次开源的 Mistral 7B v0.2 Base Model ,是 Mistral-7B-Instruct-v0.2 背后的原始预训练模型,后者属于该公司的「Mistral Tiny」系列。此次更新主要包括三个方面:将 8K 上下文提到了 32K;Rope Theta = 1e6;取消滑动窗口。下载链接::场外观众迅速跟进。有人评价说:
3/25/2024 11:23:00 AM
机器之心
突发!Stability AI的CEO,跑路了
2024 年才第一季度,生成式 AI 明星公司就倒了俩:Inflection 和 Stability AI。生成式 AI 的明星创业公司 Stability AI,现在是风雨飘摇的状态。周六上午,Stability AI 突然发布一项公告,宣布公司 CEO Emad Mostaque 辞职。公告全文内容如下:今天早些时候,Emad Mostaque 辞去了 Stability AI 首席执行官的职务以及公司董事会的职务,以追求去中心化人工智能。董事会已任命首席运营官 Shan Shan Wong 和首席技术官 Ch
3/25/2024 11:06:00 AM
机器之心
成为网红,马斯克Neuralink脑机接口植入者上线表演意念发帖
他的故事给很多人带来了希望。「推特封了我的号,因为他们认为我是机器人,现在马斯克帮我解封了,因为我就是一个机器人。」这是有史以来第一次,「人类以外的智慧生物」在社交网络上用意念发了推:他是 Noland Arbaugh,一名因潜水事故导致肩部以下瘫痪已八年的 29 岁美国男子,本周刚刚公开亮相。利用马斯克旗下脑机接口公司 Neuralink 的技术,他现在已经能做到下国际象棋、通宵玩《文明 6》等等很多事。Noland 现在已是一个「半机械人」了。科技改变了他的生活。实验细节首次公开Noland 近期参观了 Neu
3/25/2024 11:03:00 AM
机器之心
OpenAI进军好莱坞:电影制作用Sora指日可待
OpenAI 的野心可不仅限于在 TikTok 上发短视屏。自从 OpenAI 推出自动生成视频的 Sora 以后,很多人预测好莱坞可能要被 AI 代替了。现在,这家公司可能真的要走上这条路了。彭博社本周五报道,有知情人士透露,OpenAI 计划下周在洛杉矶与好莱坞电影公司、媒体高管和人才机构举行会议,以在娱乐行业建立合作伙伴关系,并鼓励电影制作人将其新的人工智能视频生成器整合到他们的工作中。一些不愿透露姓名的人士表示,即将举行的会议是 OpenAI 最近几周新一轮外展活动的组成部分。2 月底,OpenAI 安排在
3/25/2024 10:58:00 AM
机器之心
电比油低,荣耀出击!比亚迪海豹荣耀版上市,官方指导价17.98万元-24.98万元
3月25日,比亚迪海豹荣耀版正式上市,官方指导价格为17.98万元-24.98万元。作为比亚迪e平台 3.0技术的集大成之作,海豹荣耀版以更具诚意的售价,进一步强化了产品价值,成为纯电中级细分市场的标杆级车型,彰显比亚迪全面践行“电比油低”、推动新能源车迭代合资燃油车的决心。即日起至3月31日,订购海豹荣耀版的用户可享包括金融补贴、维修保养、车机流量等在内的多重超值好礼。“闭眼买,放心开”,以更低门槛引领高价值出行比亚迪海豹荣耀版延续了海豹车型的优秀产品力:CTB电池车身一体化技术、iTAC智能扭矩控制技术、后驱/
3/25/2024 10:56:00 AM
新闻助手
复刻Sora的通用视频生成能力,开源多智能体框架Mora来了
何恺明的目标是:探索面向复杂世界的智能。Sora 是首个引起社会广泛关注的大规模通用视频生成模型。自 OpenAI 在 2024 年 2 月推出以来,没有其他视频生成模型能够在性能或支持广泛视频生成任务的能力上与 Sora 匹敌。此外,完全公开的视频生成模型寥寥无几,大多数都是闭源的。为了弥补这一差距,来自理海大学、微软研究院的研究者提出了一种多智能体框架 Mora,该框架整合了几种先进的视觉 AI 智能体,以复制 Sora 所展示的通用视频生成能力。特别是,Mora 能够利用多个视觉智能体,在各种任务中成功模仿
3/25/2024 10:56:00 AM
机器之心
AnimateDiff-Lightning 来了!让文生视频生成速度提升 8 倍!
大家好,这里是和你们一起探索 AI 的花生~
之前为大家介绍了字节的 SDXL-Lightning 模型,能在几秒内生成一张 1024*1024px 的图像。最近字节又推出了一款新的文生成视频模型 AnimateDiff-Lightning,也是在几秒钟内生成一段 3s 的视频,比原本的 AnimateDiff 模型快了 6-8 倍,有效提升了 AI 视频生成的效率。今天就为大家介绍一下 AnimateDiff-Lightning 的相关内容。
相关推荐:一、AnimateDiff-Lightning 简介
项目主
3/25/2024 8:06:27 AM
夏花生
超全整理!8个好用的图像放大神器推荐
欢迎浏览“这个基础不基础”系列,本系列不定期更新~
给到的图像素材尺寸太小,图像不清晰怎么办?
立即发疯?找对接算账!
不急,本文会推荐一些好用的方法,帮大家解决工作中的素材问题~
本期首先介绍 AI 图像放大的一些工具图片,效果展示(分辨率:355x355→1420x1420)一、Upscayl
免费开源的 AI 图像放大工具
推荐:☆☆☆
Upscayl 是一个免费且开源的 AI 图像放大工具,支持 Linux、macOS 和 Windows 操作系统,并且遵循 Linux 优先的原则。使用先进的 AI 算法放
3/25/2024 6:31:54 AM
团队ASAK设计
“AI 教父”杰弗里・辛顿:超越人类智慧的 AI 可用语言操纵我们
感谢人工智能领域的开创者之一,被誉为“AI 教父”的杰弗里・辛顿(Geoffrey Hinton)近日接受日本经济新闻采访,讲述了 AI 与人类的未来。IT之家注:去年 5 月,杰弗里・辛顿宣布离开他工作了十年的谷歌公司,原因是他对人工智能技术的发展越来越担忧。谈到当初从谷歌离职的原因时,辛顿称希望自己离职后能够“自由地传播”自己相信的东西。去年 4 月,他曾与自己的上司 —— 首席科学家杰夫・迪恩(Jeff Dean)交谈,自己提出了 AI 有可能带来事关人类生存危机的看法。迪恩试图挽留辛顿,并提议留在谷歌研究
3/24/2024 3:20:14 PM
清源
乐坛 ChatGPT?作曲编曲工具 Suno V3 亮相:可免费创作多种风格歌曲还能唱
一家 AI 初创公司 Suno 近日发布了首款能够生成“广播级”歌曲的工具,能够在数秒之内创作出两分钟的完整歌曲,所有用户均可免费访问。IT之家附链接:,就是在用户给出指定歌词之后能够生成不同曲风、流派的歌曲,甚至可以指定 AI 歌手的音色。官方还表示,V4 已经在开发中,“我们正在夜以继日地开发一些令人兴奋的新功能”。该平台宣称,Suno 专为创作原创音乐而设计,模型无法识别其他艺术家的作品,Suno 不是为了制作更多的 Fake Drakes(AI 生成的德雷克“演唱”作品《Heart On My Sleeve
3/24/2024 1:27:02 PM
清源
OpenAI 前高管评“AI 复活亲人”:需分清人类与机器的界限
感谢2024 年全球开发者先锋大会于 3 月 23 日-24 日期间在上海徐汇滨江举行。据澎湃新闻报道,OpenAI 前全球商业化负责人 Zack Kass 上台演讲,谈到了时下热门的通用人工智能(AGI)、AI 对人类生活的影响等一系列话题。Zack Kass 认为,AI 技术发展可分为应用增强(功能日渐强大,如 ChatGPT 的出现)、AI 自动化阶段(未来两年内实现,AI 可自动执行任务)、AI 赋能操作系统(例如人们可通过戴眼镜来操作电器)三阶段,到 2030 年,AGI 时代即将到来。同时,他也呼吁要警
3/24/2024 11:18:24 AM
清源
口袋 AI 设备 Rabbit R1 月底向首批美国买家发货:无需配对手机,堪称万能应用控制器
曾在今年 CES 大展期间引起轰动的口袋 AI 设备 ——Rabbit R1 将要发货了。Rabbit 官方周六宣布,正在按计划于 3 月 31 日复活节当天将首批美国用户订购的产品运出工厂。由于订单需通过海关,预计发货时间超过 3 周,首批订单将于 4 月 24 日左右到达当地客户手中。“我们迫不及待,想要让您亲身体验 R1!”IT之家附事件背景:初创公司 Rabbit 推出的口袋 AI 设备 Rabbit R1,自 CES 2024 亮相后就引发热潮,首批 1 万台竟在短短一天内就被抢购一空,其售价为 199
3/24/2024 10:02:05 AM
清源
女子早癌病变被漏诊,AI 医生在 X 光中发现!谷歌最新 AI 听咳嗽就能检测新冠 / 结核
【新智元导读】被人类医生遗漏的癌症早期迹象,被 AI 及时发现了!这名英国女子现已康复。同时,AI 算法在美国一家诊所近 1/4 的眼科检查中,发现了患者的视网膜病变。AI 帮助人类诊病的未来,真的不远了。最近,越来越多的研究让我们意识到:AI 帮人类诊断疾病,真的有希望了!AI 在 11 名女性的乳腺 X 光检查中,成功地发现了被人类医生遗漏的乳腺癌早期迹象。其中一名被 AI 救下的女性,已经做完手术开始康复了。▲ AI 工具 Mia 在乳腺 X 光检查扫描中,圈出了两个关键区域而谷歌的研究团队,最近刚刚开发了一
3/24/2024 9:42:57 AM
清源
东莞市与百度签署战略合作协议,涉及人工智能、新能源汽车等领域
感谢据百度官方消息,3 月 22 日,东莞市人民政府与百度签署战略合作协议,双方将围绕人工智能产业发展,推动人工智能的全场景应用落地。根据合作协议,双方将聚焦东莞市电子信息、高端装备、新能源汽车等重点产业,提升企业研发、生产环节的人工智能水平。据介绍,东莞地处粤港澳大湾区的核心腹地,是广东第四座“万亿”城市。当下,东莞正聚焦“科技创新 先进制造”的城市特色,推动人工智能与下一代移动通信、算力网络、合成生物、氢能、纳米材料、数字空间、低空经济、量子计算、人形机器人等前沿产业的融合,打造影响全球、引领全国的人工智能
3/24/2024 7:23:26 AM
浩渺
2024全球开发者先锋大会首日顺利召开
3月23日,“2024全球开发者先锋大会”(GDC)在上海徐汇盛大开幕。大会以“模速空间——开发者的模力之源”为主题,促进全球范围内最尖端技术、最热门议题和最先锋人才的深入交流与对话,以上海模速空间创新生态社区为抓手,不断优化生态环境,引导全球顶尖人才向上海汇聚,助推上海成为高科技产业高地。从GAIDC到GDC,今年“开发者”的范畴从AI扩展到整个技术领域,涵盖数字孪生、人工智能、5G、机器人、区块链、VR/AR、边缘计算、仿真等一系列新一代信息技术。通过开发者生态持续运营,让人才引领科技创新,让科技吸引金融助力,
3/23/2024 11:00:00 PM
新闻助手
人大 Sora 思辩:Sora 到底懂不懂物理世界?
Sora 发布至今,虽然仍未正式对外开放,但对其技术细节、切实影响的讨论从未停歇。 讨论的背后,是为了探索人工智能的更本质问题。 对旧有视觉生成思路的检验和校正,是 Sora 带来的直观影响。
3/23/2024 6:39:00 PM
王悦
资讯热榜
标签云
人工智能
OpenAI
AI
AIGC
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
Sora
3D
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind