资讯列表
新注意力让大模型上下文内存占用砍半!精度不减还能加速2倍
大模型同样的上下文窗口,只需一半内存就能实现,而且精度无损? 前苹果ASIC架构师Nils Graef,和一名UC伯克利在读本科生一起提出了新的注意力机制Slim Attention。 它以标准多头注意力(MHA)为基准,对其中的value缓存处理过程进行了调整,实现了更少的内存占用。
数据:2024年假日季节,AI 搜索流量比2023年激增1300%
随着科技的不断发展,人工智能(AI)搜索正逐渐改变消费者的在线搜索习惯。 根据 Adobe 公司最新发布的研究报告,AI 搜索正在成为零售行业的重要流量渠道。 该报告分析了超过1万亿美国零售网站的访问数据,并对5000多名美国用户进行了调查,以了解他们对 AI 搜索的使用情况。
8张GPU训出近SOTA模型,超低成本图像生成预训练方案开源
超低成本图像生成预训练方案来了——仅需8张GPU训练,就能实现近SOTA的高质量图像生成效果。 划重点:开源。 模型名为LightGen,由港科大Harry Yang团队联合Everlyn AI等机构打造,借助知识蒸馏(KD)和直接偏好优化(DPO)策略,有效压缩了大规模图像生成模型的训练流程。
OpenAI 高管离职创立材料科学 AI 初创公司
在最新的行业动态中,OpenAI 的研究副总裁 Liam Fedus 宣布将离开公司,创立一家专注于材料科学的人工智能初创企业。 此消息最早由The Information网站报道,Fedus 在社交平台 X 上对此进行了确认,并分享了一些他的未来计划。 图源备注:图片由AI生成,图片授权服务商MidjourneyFedus 在声明中提到,他的本科专业是物理学,因此他希望能够将人工智能技术应用到这一领域。
陶哲轩:o3-mini纠正了我一个数学错误,十分钟解决原本一小时才能完成的题目
大模型持续震惊科学家! 以往一小时才能完成的代码,现在十分钟就能实现「生成、测试到得出结果」。 “大模型推广大神”陶哲轩又来分享他的亲测体验了。
xAI收购AI视频生成初创公司Hotshot,加强与OpenAI Sora竞争
近日,埃隆·马斯克的人工智能公司xAI已收购了视频生成初创公司Hotshot,这标志着马斯克在AI视频生成领域的重要布局。 Hotshot首席执行官兼联合创始人Aakash Sastry周一在社交平台X上正式宣布了这一消息。 Sastry在公告中表示:"过去2年中,我们作为一个小团队建立了3个视频基础模型——Hotshot-XL、Hotshot Act One和Hotshot。
一文读懂:模型上下文协议(MCP)
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的模型上下文协议(MCP)。 随着人工智能迈向更复杂的应用场景,单一模型的局限性逐渐显现,而多模型协同与上下文感知的需求日益迫切。 从对话系统需要理解用户的历史语境,到跨模态任务要求无缝整合文本、图像等多源数据,AI 的发展正呼唤一种全新的协作范式。
技术领导者如何利用AI克服十大采购挑战
然而,软件采购决策通常需要三到六个月——甚至更长时间——才能最终确定。 在科技领域,这简直是漫长无比;等到交易签署时,市场条件可能已经改变,新的竞争对手已经出现,或者解决方案本身已经升级。 难怪北美90%的IT高管认为软件采购和供应商选择是一个痛点。
消息称阿里巴巴全面推进“AI化”,2025年绩效聚焦AI增长
据英国《金融时报》报道,阿里巴巴CEO吴泳铭推动公司业务全面“AI化”。 知情人士透露,阿里所有部门2025年绩效将以AI驱动增长为考核核心。 淘宝、天猫等电商业务被要求加速应用AI技术,与“通义千问”团队合作开发提升效率和用户体验的功能。
刚刚,o1/o3后训练掌门人出走创业,OpenAI鼎力支持押注AI材料!曾师从Bengio
OpenAI又痛失一员大将。 刚刚,后训练副总William Fedus官宣离职OpenAI,将创办一家AI发现材料创业公司。 对此OpenAI表示:「OpenAI将会对Fedus新公司进行投资并建立合作伙伴关系」。
生数科技Vidu将打造首部海外AI原创科幻动漫剧集
3月17日,北京生数科技有限公司宣布其旗下视频大模型产品Vidu与美国知名动漫制作工作室Aura Productions达成战略合作,共同打造首部海外AI原创科幻动漫剧集。 这一合作标志着AI技术正式深入动漫生产工作流,开启了AI视频生成平台介入动漫短剧创作的行业先河,推动动漫行业迈入AI驱动的新时代。 根据合作协议,双方将推出50集短篇科幻动漫系列作品,计划于今年在全球主流社交媒体平台发布。
CAIO正在脱颖而出 不再在CIO帐下听令
2016年,AI领域最著名的研究者之一安德鲁·吴(Andrew Ng)撰写了关于在公司中设立首席AI官角色的好处,以及这一角色应具备的特点和职责的文章。 当时,这一想法似乎有些牵强,认为除了少数特定行业之外,其他企业也需要设立CAIO。 但近年来,随着GenAI的兴起,智能工具的使用量增加,CAIO角色已逐渐成为众多行业关键的技术高管职位。
速通BOSS需求!零基础AI Agent高效工作流设计指南
此次会连载一套 AI-Agent 构建的系列,主要分为三部分,首先是速通 AI-Agent 构建的工作流基础,然后是通过 ComfyUI 作为案例来复盘如何快速上手工作流平台,最后则是借助 Agent 平台构建一个 AI Agent 案例,本系列意图主要是帮助大家贯通工作流的搭建形式,并尝试思考为自己的工作搭建一些可用的 AI 助手,或是提供构建的方法指引。 无论你是产品经理还是设计师,你会发现商业场景的 AIGC,几乎都没有办法通过一段需求描述或是简单的 Agent 对话就搞定的,你需要更专业更复杂的 AIGC 过程,那么如何理解复杂? 实现专业?
豆包文生图技术报告发布!数据处理、预训练、RLHF全流程公开
今天,豆包大模型团队正式发布文生图技术报告,首次公开 Seedream 2.0 图像生成模型技术细节,覆盖数据构建、预训练框架、 后训练 RLHF 全流程。 该报告针对 Seedream 2.0 原生中英双语理解、文字渲染、高美感、分辨率与画幅变换等特性的实现,进行了具体介绍。 本文将呈现其中精华内容,报告完整版可通过下方链接获取:技术展示页:: Seedream 2.0 于 2024 年 12 月初在豆包 APP 和即梦上线,已服务上亿 C 端用户,并成为国内许多专业设计师辅助创作的首选模型。
实战攻略:使用KubeMQ简化多LLM集成流程
译者 | 核子可乐审校 | 重楼将多个大语言模型集成至应用程序当中往往是项艰巨的挑战,各类不同API及通信协议的协同处理,以及如何确保请求路由的复杂性难题往往令人望而生畏。 好在可以使用消息代理与路由机制更优雅地解决此类问题,在解决痛点的同时实现多个关键优势。 本文将向大家介绍具体操作步骤。
DeepSeek 开源 3FS,一个文件系统而已,有啥值得吹的?
有人说,deepseek一个搞AI的公司,不干正事,开源一个文件系统,有啥值得吹的。 今天来简单聊聊3FS,包懂。 3FS是什么?3FS,Fire-Flyer File System,是一个用C 写的高性能分布式文件系统。
AAAI 2025|Portcullis —— 面向第三方大型语言模型的可信隐私保护网关
在大模型浪潮的推动下,企业和个人的数据安全面临前所未有的挑战。 抖音集团安全研究团队推出Portcullis ——针对大模型的隐私保护网关,旨在为第三方大型语言模型(LLM)推理服务提供可控可信的隐私防护。 该工作成果 《Portcullis : A Scalable and Verifiable Privacy Gateway for Third-Party LLM Inference》已被人工智能领域的顶级会议AAAI 2025以Oral报告的形式接收。
AI时代的产品如何做?IBM都在用的3大设计系统终于公开了!
编者按:UI/UX 设计师的本职工作之一,是为数字产品和服务匹配上合理的界面和交互。 那么随着 AI 在各个领域产品的深入,让我不由得想问一个问题,那么 AI 时代的 UI 设计要怎么做? 有没有可靠的设计系统?