应用
蚂蚁集团开源新算法,可助大模型推理提速2-6倍
近日,蚂蚁集团开源了一套新算法,可帮助大模型在推理时,提速2至6倍,引起业内关注。图:新算法在不同开源大模型上的提速表现。这套新算法名为Lookahead推理加速框架,能做到效果无损,即插即用,该算法已在蚂蚁大量场景进行了落地,大幅降低了推理耗时。以Llama2-7B-chat模型与Dolly数据集为例,实测token生成速度可由48.2个/秒,升至112.9个/秒,提速2.34倍。而在蚂蚁内部的RAG(检索增强生成)数据集上,百灵大模型AntGLM 10B版本的加速比达到5.36,与此同时,显存增加和内存消耗几乎
1/17/2024 7:41:00 PM
新闻助手
AI PC热再现CES2024,行业求解落地路线
机器之能报道作者:Sia过去一年,我们见证了 ChatGPT 引爆生成式 AI。既然可以在云端花近百亿人民币创建一个万亿参数的模型,那么,如何让无数消费者使用它呢?作为全球最大的科技硬件博览会,塞进大模型的终端设备成为本届 CES 一大亮点。 一、AI PC 之热 生成式人工智能(AI)在个人电脑(PC)领域的应用成为新一轮角力之处,芯片领域竞争也在白热化。英伟达、AMD、英特尔和高通均在本次博览会上展示了其在集成 AI 技术方面的最新进展,这些技术旨在提升个人电脑的性能和用户体验,特别是在生成式 AI 上。 英伟
1/17/2024 5:46:00 PM
机器之能
最接近GPT-4的国产大模型诞生了
2024 年,国产大模型的第一个重磅消息,来自智谱 AI。在 1 月 16 日举办的 2024 智谱 AI 技术开放日 Zhipu DevDay 上,智谱 AI 正式发布新一代基座大模型「GLM-4」。经历了三个月的技术迭代,GLM-4 相比上一代基座模型 GLM-3 实现了 60% 的性能全面提升,直接逼近 GPT-4。一方面,GLM-4 支持更长的上下文、更强的多模态能力;另一方面,GLM-4 支持更快的推理、更多并发,大大降低了推理成本。同时,GLM-4 也增强了智能体能力,智谱 AI 正式上线了「GLM-4
1/17/2024 3:02:00 PM
机器之心
ICLR 2024接收率31%,清华LCM论文作者:讲个笑话,被拒了
你被拒了吗?ICLR 2024 国际学习表征会议已经来到了第十二届,将于今年 5 月 7 日 - 11 日在奥地利维也纳会展中心举行。在机器学习社区中,ICLR 是较为「年轻」的学术顶会,它由深度学习巨头、图灵奖获得者 Yoshua Bengio 和 Yann LeCun 牵头举办,2013 年才举办了第一届。不过 ICLR 很快获得学术研究者们的广泛认可,被认为是深度学习顶会。在 Google Scholar 的学术会议 / 杂志排名中,ICLR 目前排名第十位,要高于 NeurIPS。今日,ICLR 2024
1/17/2024 2:55:00 PM
机器之心
终于,NLP顶会ACL投稿不用匿名了
再也不怕大会投稿被占坑了?对于自然语言处理领域的研究人员,最近有一条好消息。近日,计算语言学协会年会(ACL)正式宣布,该系列会议论文投稿已取消匿名期,同时允许作者在投稿期间宣传自身工作。新规定直接适用于下一个审稿周期。今年的 ACL 是第 62 届,将于 2024 年 8 月 11 日至 16 日在泰国曼谷举行。自 2022 年起,ACL 启用了滚动审稿机制(ACL Rolling Review,ARR),每月设 deadline。需要注意的是,在上一个截止日期之前提交给评审流程的论文仍受旧匿名政策的约束。大会声
1/17/2024 2:46:00 PM
机器之心
Stability AI发布Stable Code 3B模型,没有GPU也能本地运行
Stable Code 3B 的性能优于类似大小的代码模型,并且与 CodeLLaMA 7B 的性能相当,尽管其大小只有 CodeLLaMA 7B 的 40%。在文生图领域大火的 Stability AI,今天宣布了其 2024 年的第一个新 AI 模型:Stable Code 3B。顾名思义,Stable Code 3B 是一个拥有 30 亿参数的模型,专注于辅助代码任务。 无需专用 GPU 即可在笔记本电脑上本地运行,同时仍可提供与 Meta 的 CodeLLaMA 7B 等大型模型具有竞争力的性能。2023
1/17/2024 2:41:00 PM
机器之心
机器人领域首个开源视觉-语言操作大模型,RoboFlamingo框架激发开源VLMs更大潜能
还在苦苦寻找开源的机器人大模型?试试RoboFlamingo!近年来,大模型的研究正在加速推进,它逐渐在各类任务上展现出多模态的理解和时间空间上的推理能力。机器人的各类具身操作任务天然就对语言指令理解、场景感知和时空规划等能力有着很高的要求,这自然引申出一个问题:能不能充分利用大模型能力,将其迁移到机器人领域,直接规划底层动作序列呢?对此,ByteDance Research 基于开源的多模态语言视觉大模型 OpenFlamingo 开发了开源、易用的 RoboFlamingo 机器人操作模型,只用单机就可以训练。
1/17/2024 2:37:00 PM
机器之心
Stable Diffusion ComfyUI 基础教程(七)如何使用三大微调模型:Embeddings、Lora、Hypernetwork
前言:
在我们绘图过程中我们用到了 Checkpoint 模型和 VAE 模型,但是还有另外三种可以辅助我们出图的模型没有给大家介绍,他们分别是 Embeddings(嵌入)、Lora(低秩适应模型)、Hypernetwork(超网络)这三种模型;
在开始讲解这三个模型之前我们一定要记住不止 Checkpoint(大模型)分 SD1.4、SD1.5、SDXL1.0 等基础算法型号,这三个模型同样也分,我们在使用时要选择对应基础算法型号才能正常使用。
今天我们就讲讲这三种模型分别是什么原理、有什么作用和怎么使 用。
1/17/2024 8:16:46 AM
搞设计的花生仁
上海人工智能实验室团队开发具有多核光纤单元旋转功能的AI驱动投影断层扫描
编辑 | 白菜叶光学断层扫描已成为一种非侵入性成像方法,可提供对亚细胞结构的三维洞察,从而能够更深入地了解细胞功能、相互作用和过程。传统的光学断层扫描方法受到有限的照明扫描范围的限制,导致分辨率各向异性和细胞结构的不完整成像。为了克服这个问题,上海人工智能实验室、德国德累斯顿工业大学(Technische Universität Dresden)以及马克斯·普朗克学会(Max Planck Society)的研究人员采用了紧凑的多核光纤细胞旋转器系统,该系统有助于对微流控芯片内的细胞进行精确的光学操纵,从而实现具有
1/16/2024 6:51:00 PM
ScienceAI
在24项场景中优于人类医生,Google团队开发基于自博弈的诊断对话大模型
编辑 | 白菜叶医学的核心在于医患对话,熟练的病史采集为准确的诊断、有效的管理和持久的信任铺平了道路。能够进行诊断对话的人工智能(AI)系统可以提高护理的可及性、一致性和质量。然而,学习临床医生的专业知识是一个巨大的挑战。Google Research 和 Google DeepMind 的 AI 团队开发了 AMIE(Articulate Medical Intelligence Explorer),这是一种基于大型语言模型(LLM)的人工智能系统,针对诊断对话进行了优化。AMIE 使用一种新颖的基于自博弈(se
1/16/2024 6:44:00 PM
ScienceAI
全球最长开源!元象开源大模型XVERSE-Long-256K,无条件免费商用!
元象发布全球首个上下文窗口长度256K的开源大模型XVERSE-Long-256K,支持输入25万汉字,让大模型应用进入“长文本时代”。该模型全开源,无条件免费商用,且附带手把手训练教程,让海量中小企业、研究者和开发者更早一步实现“大模型自由”。全球主流长文本大模型图谱 参数量和高质量数据量决定了大模型的计算复杂度,而长文本技术(Long Context)是大模型应用发展“杀手锏”,因技术新、研发难度高,目前多为闭源付费提供。 XVERSE-Long-256K支持超长文本输入,可用于大规模数据分析、多文档阅读理解
1/16/2024 3:52:00 PM
李亚洲
微软Copilot大会员来了:每月20刀,人人都能用
覆盖 Office 全家桶,免费的移动版 App 也同期上线。去年 9 月,微软宣布了大模型 Copilot 能力加入 Office 和 Windows 11 的新计划。今天,该能力终于覆盖到了全体用户。1 月 15 日,微软正式发布 Copilot Pro,其每月订阅费用为 20 美元,可解锁访问 Word、Excel 和 PowerPoint 等 Office 常用办公软件中的大模型能力,同时优先访问最新的 OpenAI 模型。在其之上,你也可以基于需求构建起属于自己的 Copilot GPT。Copilot
1/16/2024 2:55:00 PM
机器之心
Yann LeCun发来肯定:腾讯人像照片生成可以随便玩了
AI 帮你成为百变星君。这一次,Yann LeCun 首次跻身「百变大咖」。身穿钢铁侠的衣服、戴着酷酷的墨镜面无表情地注视着你,一身古装在故宫门前打卡留念……就连本人也出来转发并喊话,「左下角这幅文艺复兴时期的画,是我的最爱。」性感女神寡姐身穿紫色巫师服注视着远方,还可以戴着圣诞帽和你对视:身穿太空服的奥特曼看起来萌萌的,把头发染成红色也毫无违和感上述研究便是来自南开大学、腾讯等机构提出 PhotoMaker,这是一种高效的个性化文本到图像生成方法。相关论文《PhotoMaker:Customizing Reali
1/16/2024 2:51:00 PM
机器之心
开源模型新纪录:超越Mixtral 8x7B Instruct的模型来了
又有新的开源模型可以用了。从 Llama、Llama 2 到 Mixtral 8x7B,开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5,因此它也被认为是一种「非常接近 GPT-4」的开源选项。在前段时间的一篇论文中,该模型背后的公司 Mistral AI 公布了 Mixtral 8x7B 的一些技术细节,并推出了 Mixtral 8x7B – Instruct 聊天模型。该模型性能在人类评估基准上明显超过了 GPT-3.5 Tur
1/16/2024 2:44:00 PM
机器之心
微软TaskWeaver开源框架:携手数据分析与行业定制,打造顶级Agent解决方案
数据分析一直是现代社会中的重要工具,它帮助我们洞察本质、发现规律并指导决策。然而,数据分析过程往往复杂且费时,因此我们期望存在一个智能助手助力用户直接 “与数据对话 “。得益于大语言模型(LLM)的发展,虚拟助手和 Copilot 等智能 Agent 纷纷涌现,它们在自然语言理解和生成方面的表现令人叹为观止。但遗憾的是,在处理复杂数据结构(如 DataFrame, ndarray 等)和引入领域知识方面,现有的 Agent 框架仍然举步维艰,而这恰恰是数据分析和专业领域中的核心需求。为了突破这一瓶颈,微软推出了 T
1/16/2024 2:38:00 PM
机器之心
第三波!2024年1月精选实用设计工具合集
大家好,这是 2024 年 1 月的第三波干货合集!这一期干货合集打头的一个免费的在线 AI 壁纸生成工具,之后是字体海报灵感设计网站和类似 Pinterest 的在线灵感搜集网站,此外还有无代码网站设计和生成工具 ReadyMag 以及特别有自己一套风格的免费图库 KaboomPics ,最后是一组免费矢量涂鸦素材。
当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、在线 AI 壁纸生成工具
AI 大模型到底是哪个,但是总体上来看有很大概率是一个基于 Stable Dif
1/16/2024 7:01:33 AM
陈子木
龙年春节专题!7 款高质量 Stable Diffusion WebUI 模型推荐
大家好我是花生~
上次推荐了 15 组春节主题的 Midjourney 提示词,不知道大家用起来了没有?今天继续推荐 7 款龙年春节主题的 Stable Diffusion 模型,在 WebUI 或 ComyfyUI 可以用它们免费出图,还可以结合控制插件 ControlNet 让生成的图像更符合设计需求。
相关推荐:一、年货街 | 新年电商营销场景
这是一个专门生成电商年货促销场景的 Lora,以中式建筑 街道为画面主元素,整体的 3D 质感非常不错,很适合作为 Banner 或者长图的背景素材。
1. 模型网址
1/16/2024 5:26:58 AM
夏花生
完蛋,CES 2024被机器人包围了
机器之能报道编辑:佳琪2024 年国际消费电子展(CES)这一科技界的风向标活动刚刚落幕。作为全球备受瞩目的科技盛会,CES 吸引了来自 150 多个国家和地区的 4000 多家尖端科技企业。各家品牌纷纷秀出了最先进的技术和产品。英伟达的 AI PC 布局、英特尔最新的第 14 代处理器、发布 3 天即售罄 3 万台的 Rabbit R1...... 今年的 CES 见证了亿点点新变革的发生。超过 13 万名参会者亲临现场,体验了一把「黑科技照进现实」的震撼。在 CES 的展厅里,机器人总是最引人注目的焦点,其中有
1/15/2024 5:46:00 PM
机器之能
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
腾讯
Agent
Claude
芯片
Stable Diffusion
蛋白质
具身智能
xAI
开发者
生成式
人形机器人
神经网络
机器学习
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
字节跳动
华为
AGI
计算
大型语言模型
AI设计
搜索
生成式AI
视频生成
亚马逊
DeepMind
AI模型
特斯拉
场景
深度学习
Transformer
架构
MCP
Copilot
编程
视觉