AI在线 AI在线

资讯列表

字节整活!1.58比特FLUX:手机也能流畅运行的顶尖AI画图神器来了

自字节跳动和POSTECH的研究团队发布了一项名为“1.58-bit FLUX”的突破性研究成果,该成果成功将最先进的文本到图像(T2I)生成模型FLUX.1-dev的权重参数量化至1.58比特,同时保持了生成1024x1024图像的质量,为在资源受限的移动设备上部署大型T2I模型开辟了新的道路,这项研究成果已发布在arXiv上,并配有开源代码库(代码目前还没有上传)AI画图模型也能“减肥”? 简单来说,就是把 FLUX(由Stable Diffusion作者团队成立的黑森林实验室Black Forest Lab推出) 的超强AI画图模型进行了“压缩”。 大家都知道,现在的AI画图模型,像DALLE 3、Stable Diffusion 3、Midjourney等,展现出强大的图像生成能力,在现实应用中潜力巨大。
1/2/2025 1:50:00 PM
AI寒武纪

比人类神经元快10亿倍!港中文、中科院「超级大脑」:1秒识图3479万张

人工神经元,比人类大脑快10亿倍,将会是怎样的景象? 如今,这一科幻般的场景,早已成为了现实。 来自香港中文大学、中国科学院物理研究所等机构科学家,成功开发出了一种基于「激光」的人工神经元。
1/2/2025 1:30:00 PM
新智元

全面打破GPT-4垄断、DeepSeek打下训练成本...2024年大模型领域进展全复盘

刚刚过去的 2024 年是生成式 AI 大发展的一年,我们见证了 OpenAI Sora 的崛起,大模型服务价格的飞速下降,以及国内开源大模型的奋起直追。 这全方位的快速发展让我们对下一波 AI 的新技术大规模应用充满了信心。 对于身在 AI 领域的工程师和学者们来说,他们看待这一年的观点会有不同吗?
1/2/2025 1:15:00 PM
机器之心

2024年AI安全五大热点回顾

在ChatGPT推出两年后,生成式AI已成为网络安全领域的重要力量。 2024年生成式AI技术的影响无处不在,从深伪欺诈到“影子AI”的风险,再到AI安全法规的出现和AI驱动的漏洞研究潜力。 以下,我们将盘点过去一年AI与网络安全的五大热点话题。
1/2/2025 1:10:56 PM
佚名

微软论文意外「走光」,OpenAI参数全泄密!GPT-4o仅200B,o1 300B

谁能想到,微软在一篇医学领域的论文里,竟然把OpenAI模型的参数全「曝光」了! GPT-4参数约1.76万亿GPT-4o参数约2000亿GPT-4o mini参数约80亿o1-preview参数约3000亿o1-mini参数约1000亿Claude 3.5 Sonnet参数约1750亿研究人员:参数均为估算值让所有人难以置信的是,GPT-4o系列的参数如此少,mini版甚至只有8B。 有网友猜测,4o mini是一个大约有40B参数的MoE模型,其中激活参数为8B。
1/2/2025 1:00:00 PM
新智元

大规模3D场景2分钟生成,效率提升30倍!中科院发布空间智能新框架

「空间智能」和「世界模型」是最近学术界和产业界非常火热的研究方向,走向虚实结合、模拟世界机理的关键一步,就是创造出一个生动的虚拟世界。 然而,想要打造丰富多样、充满细节,同时具备高度可编辑性和物理真实性的3D虚拟世界,仍然困难重重。 为了解决这些难题,来自中国科学院自动化研究所和北京科技大学的联合团队,首次提出了一种全新的3D场景生成框架SceneX,只需简单的文字描述,就能快速生成高质量的3D虚拟场景。
1/2/2025 12:22:09 PM
新智元

2024 Github 十大最佳 RAG 框架

检索增强生成(RAG)已成为增强大型语言模型能力的一项强大技术。 RAG 框架结合了基于检索的系统和生成模型的优势,可以做出更准确、更能感知上下文和更及时的响应。 随着对复杂人工智能解决方案需求的增长,GitHub 上出现了许多开源 RAG 框架,每个框架都具有独特的特性和功能。
1/2/2025 11:54:01 AM
云朵君

我国首台空间站智能助手“小航”进驻空间站:哈工大研制,可协助拍照、情感互动

其目前可以完成拍照、运动等操作,航天员王浩泽通过语音指令让“小航”完成了在空间站内飞行,根据口令上升下降等操作。后续通过升级,“小航”还能实现舱内巡检、物资管理、产品状态检查、答疑解惑等功能。
1/2/2025 11:51:01 AM
清源

2024年人工智能的发展趋势

回顾2024年的人工智能领域,我们可以观察到一系列显著的趋势,特别是人工智能助手的广泛应用、人工智能代理的兴起,以及企业在选择人工智能解决方案时所面临的挑战与考量。 以下是对行业专家Derek Topp关于这些趋势的深入解读。 一、人工智能助手的快速发展在2024年,我们见证了无数供应商竞相发布新产品,旨在创建、部署和维护基于通用人工智能(GenAI)的代理。
1/2/2025 11:39:32 AM
Harris编译

10秒极速出片!还有超多特效模版,国产视频模型又整新活了

2025刚开年,没想到国产AI视频模型PixVerse又给咱们整了一波新活! 继上次席卷全网的万物皆可毒液之后,它们又火速更新了3.5版本。 新模型不仅能10秒光速生成高清视频,而且复杂运动、各种二次元风格也都轻松拿捏——提示:尼克和朱迪(《疯狂动物城》)在森林里一起骑车这次他们还内置了更多有趣的模版:成为肌肉猛男、圣诞礼物盲盒等等,非常适合快速生成短视频。
1/2/2025 11:26:55 AM

华为昇腾 AI 处理器等 151 个上榜,人工智能赋能新型工业化典型应用案例名单公布

据工信部今日公告,根据《关于组织开展人工智能赋能新型工业化典型应用案例征集工作的通知》(工信厅科函〔2024〕301 号),经单位推荐、专家评审和网上公示等环节,确定了 151 项人工智能赋能新型工业化典型应用案例。
1/2/2025 11:20:44 AM
汪淼

4o-mini 只有 8B、o1 也才 300B,微软论文意外曝光 GPT 核心机密

英伟达 2024 年初发布 B200 时,就摊牌了 GPT-4 是 1.8T MoE 也就是 1800B,这里微软的数字更精确,为 1.76T。
1/2/2025 11:14:46 AM
汪淼

多模态长文档新基准来了!20多项任务覆盖理解推理定位,GPT-4o也就刚及格

GPT-4o仅得分64.5,其余模型均未及格! 全面、细粒度评估模型多模态长文档理解能力的评测集来了~名为LongDocURL,集成了长文档理解、数值推理和跨元素定位三个主任务,并包含20个细分子任务。 LongDocURL主打多模态、长上下文,专注于篇幅在50~150页的英文文档,平均页数和文档标记数分别为85.6和43622.6。
1/2/2025 11:01:45 AM

4o-mini只有8B,o1也才300B!微软论文意外曝光GPT核心机密

微软又把OpenAI的机密泄露了? ? 在论文中明晃晃写着:o1-preview约300B参数,GPT-4o约200B,GPT-4o-mini约8B……英伟达2024年初发布B200时,就摊牌了GPT-4是1.8T MoE也就是1800B,这里微软的数字更精确,为1.76T。
1/2/2025 11:00:34 AM

Drone-YOLO:一种有效的无人机图像目标检测

01 前景概要今天分享中,我们提出了Drone-YOLO,这是一系列基于YOLOv8模型的多尺度无人机图像目标检测算法,旨在克服与无人机图像目标检测相关的特定挑战。 为了解决大场景大小和小检测对象的问题,我们对YOLOv8模型的颈部组件进行了改进。 具体而言,我们采用了三层PAFPN结构,并结合了一个使用大规模特征图为小型目标量身定制的检测头,显著增强了算法检测小型目标的能力。
1/2/2025 10:30:00 AM
计算机视觉研究院

艾维·维格森、杰弗里·辛顿、汤晓鸥……盘点2024那些站在AI背后的科学家

2024年,人工智能的发展势头异常迅猛。 这一年,GPT-4o、Sora、o1以及最近的DeepSeek V3等广为大众所知的重大突破相继发布,每一次都引发了广泛的讨论热潮,也让Sam Altman、黄仁勋、马斯克等业界领袖频频登上媒体热搜榜。 但在科研领域,还有一群鲜为大众所知、但在业内享有极高赞誉,却一直默默耕耘为AI进步贡献力量的科学家,同样值得铭记。
1/2/2025 10:23:00 AM
新闻助手

优于FCOS:在One-Stage和Anchor-Free目标检测中以最小的成本实现最小的错位

一、前言Non keypoint-based的目标检测模型由分类和回归分支组成,由于不同的任务驱动因素,这两个分支对来自相同尺度级别和相同空间位置的特征具有不同的敏感性。 point-based的预测方法,在基于高分类置信点具有高回归质量的假设上,导致错位问题。 我们的分析表明,该问题进一步具体由尺度错位和空间错位组成。
1/2/2025 10:00:00 AM
计算机视觉研究院

OpenAI o1-preview操纵游戏文件,战胜国际象棋引擎Stockfish

12月31日消息,据外媒报道,OpenAI的“推理”模型o1-preview能够在规则之外的游戏中获胜。 o1-preview并没有与专门的国际象棋引擎Stockfish进行一场正式的国际象棋比赛,而是想出了如何破解其测试环境以强制获胜的方法。 根据人工智能安全研究公司Palisade Research的说法,该系统在所有五次测试中都做到了这一点——没有人告诉它这样做。
1/2/2025 9:53:17 AM
Yu