应用
摩尔线程开源音频理解大模型 MooER:基于国产全功能 GPU 训练和推理
摩尔线程开源了音频理解大模型 —MooER(摩耳),是业界首个基于国产全功能 GPU 进行训练和推理的大型开源语音模型。基于摩尔线程夸娥(KUAE)智算平台,MooER 大模型用 38 小时完成了 5000 小时音频数据和伪标签的训练。MooER 不仅支持中文和英文的语音识别,还具备中译英的语音翻译能力。在 Covost2 中译英测试集中,MooER-5K 取得了 25.2 的 BLEU 分数,接近工业级效果。摩尔线程 AI 团队在该工作中开源了推理代码和 5000 小时数据训练的模型,并计划进一步开源训练代码和基
8/23/2024 6:21:35 PM
沛霖(实习)
AI在用 | 发现一个AI调色板,还真整出了「五彩斑斓的黑」
机器之能原创作者:sia以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。投稿邮箱:[email protected]无论用哪种模型生成精美图片,提示语都会包含对调色板的要求。想要营造日落的氛围感觉?一定要提示,使用温暖、明亮的日落色调。还要强调色调给人的感受,如一种壮丽、瑰丽的感觉。提示语:Po
8/23/2024 4:16:00 PM
机器之能
搭载三星电子 HBM3E 12H 内存,韩 Rebellions 有望今年内发布下代 AI 芯片
据韩媒 ZDNet Korea 报道,韩国无厂 AI 芯片设计企业 Rebellions 首席技术官 Oh Jin-wook 在接受采访时表示其下一代 AI NPU 芯片 REBEL 有望于 2024 年内发布。▲ Rebellions 此前推出的 Atom NPUREBEL 专为加速大语言模型和多模态模型而设计,其采用三星 三星的制程与内存组合:三星 4nm 工艺搭配三星 HBM3E 12H 内存。此外 REBEL 芯片还将支持 800Gb 以太网。REBEL 家族包含两款产品,即基于单个芯粒的 REBEL-
8/23/2024 4:15:05 PM
溯波(实习)
AI首次解决量子物理学难题,DeepMind精确计算量子激发态,登Science
编辑 | KX此前,Google DeepMind 研究人员开发的费米子神经网络 (FermiNet) 非常适合对大量电子的量子基态进行建模。FermiNet 最初专注于分子的基态。但是,当分子和材料受到大量能量的刺激时,例如暴露在光或高温下,电子可能会被踢入更高的能量状态——激发态。激发态在物理学和化学等领域都很重要;然而,从第一原理出发对激发态特性进行可扩展、准确且稳健的计算仍然面临重要的理论挑战。现在,DeepMind 研究人员开发了一种计算激发态的新方法,它比以前的方法更强大、更通用。该方法可以应用于任何
8/23/2024 4:11:00 PM
ScienceAI
一句话生成《黑神话:悟空》3D资产,胡渊鸣创业项目Meshy上新,免费试用
几何更干净、细致,工作流更合理,Meshy的3D生成能力又进化了,所有人都可以免费试用。天命人,你现在已经到哪儿了?毫无疑问,不论是朋友圈还是各个网络平台,这两天最火的是《黑神话:悟空》。哪怕你平时根本不玩游戏,也可能因为破纪录的销售额,或者全网刷屏的「自来水」,而关注到这个被誉为「创造了中国游戏历史」的超级大作。不过《黑神话:悟空》首次出圈,是因为一支实机演示视频。这支拥有近六千万播放量的预告片,宣告着在西方文化主导的游戏行业,中国玩家即将迎来他们梦寐以求的根植于中国文化的英雄主角。而预告片中直击人心的视觉效果,
8/23/2024 3:00:00 PM
机器之心
终于,Claude上线LaTeX公式渲染功能,评论区网友沸腾了
当 ChatGPT 老早就支持使用 LaTeX 语言输入和显示数学公式时,Claude 现在终于补上了这一功能。在论文、书籍、报告或幻灯片中,我们有时需要插入数学公式或符号。其中使用 LaTeX 语言来生成数学公式或符号是主要方式之一,这就是所谓的 LaTeX 公式渲染,通过简单的命令来实现复杂的数学表达式。对于大语言模型来说,它们在解答一些数学相关的问题时有时也需要输出数学方程式或表达式。这时如果能够使用 LaTeX 输出标准的公式,答案自然会更加清晰明了。以大模型初创公司 Anthropic 的 Claude
8/23/2024 2:53:00 PM
机器之心
重返谷歌的Transformer作者,开始掌管Gemini AI
Noam Shazeer 2021 年离职谷歌,3 年后又以特殊方式重回谷歌。本月初,初创公司 Character.AI 宣布了一则重磅消息,约 25 亿美元「卖身」谷歌,并授予谷歌获得 Character.AI 大型语言模型(LLM)技术的非独家许可。Character.AI 的联合创始人 Noam Shazeer 和 Daniel De Freitas 也将重返谷歌。其中,Noam Shazeer 是 Character.AI 的创始人、CEO,也是 Transformer 论文作者之一,他曾在谷歌任首席软件工
8/23/2024 2:50:00 PM
机器之心
总说具身智能的数据太贵,鹏城实验室开源百万规模标准化数据集
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]该论文作者来自于鹏城实验室多智能体与具身智能研究所及南方科技大学、中山大学的师生团队,包括林倞教授(研究所所长,国家杰青,IEEE Fellow),郑锋教授,梁小丹教授,王志强(南科大),
8/23/2024 2:47:00 PM
机器之心
帕西尼发布第二代多维触觉人形机器人 TORA-ONE:双手集成近 2000 个自研 ITPU 传感单元
2024 世界机器人大会于 8 月 21 日在北京开幕,帕西尼感知科技发布了第二代人形机器人 TORA-ONE。第二代多维触觉人形机器人 TORA-ONE 双手集成近 2000 个自研的 ITPU 多维触觉传感单元,能捕捉并解析接触面上细微形变与多维度触感信息;本体自由度提升至 47 个,搭配 26 自由度的仿生灵巧手,支持自研的 VTLA-Model 视触觉多模态感知模型与 AI 视觉系统。▲ 第二代多维触觉人形机器人 TORA-ONEAI在线注意到,TORA-ONE 采用了高度模块化的设计理念,支持 1.46
8/23/2024 1:49:38 PM
沛霖(实习)
Meta 公司发布 Imagine Yourself:无需为特定对象微调的个性化图像生成 AI 模型
从社交媒体到虚拟现实,个性化图像生成因其在各种应用中的潜力而日益受到关注。传统方法通常需要针对每位用户进行大量调整,从而限制了效率和可扩展性,为此 Meta 公司创新提出了“Imagine Yourself” AI 模型。传统个性化图像生成方法挑战目前的个性化图像生成方法通常依赖于为每个用户调整模型,这种方法效率低下,而且缺乏通用性。虽然较新的方法试图在不进行调整的情况下实现个性化,但它们往往过度拟合,导致复制粘贴效应。Imagine Yourself 创新Imagine Yourself 模型不需要针对特定用户微
8/23/2024 1:41:31 PM
故渊
快手可灵 AI 推出会员订阅计划:支持 AI 图片 / 视频,首月 19 元起
感谢快手可灵 AI 推出会员订阅计划,其中连续包月首月最低价 19 元、次月 58 元,可生成约 66 个视频或 3300 张图片,还可享受高表现视频生成、视频延长、大师运镜等多项会员专属功能。与此同时,可灵 AI 针对 B 端同步开启 OpenAPI 企业用户招募,首批加入企业将拥有优先接入和专属技术支持。快手刚发布的 2024 年二季度财报显示,可灵 AI 已有超百万用户,累计生成了超千万视频。快手联合创始人、董事长兼 CEO 程一笑表示,未来将进一步升级可灵大模型,同时力争尽快实现可观的商业化变现规模。可灵大
8/23/2024 1:19:00 PM
汪淼
在 AI 最火热的时候,AI 大牛田渊栋写了本小说《破晓之钟》
“在 AI 最火热的时候,我写了本小说。”这话不是别人说的,这话是 AI 大牛田渊栋说的。这个名字可能不彰显于大众媒体,但在计算机和 AI 领域,几乎是判别式一样的存在。至少在华人科学家面孔中,盘点谷歌无人车时绕不过他,盘点围棋 AI 时绕不过他,梳理巨头 Meta 的 AI 人才时也遗漏不了他。田渊栋现在是 Meta AI Research(FAIR)研究科学家总监,正在带队研究,如何让 AI 在推理和规划问题上,产生现有的大模型产生不了的能力。他是上海交大校友,在计算机系获得了本科和硕士学位,其后又进一步到了
8/23/2024 12:06:20 PM
清源
浪潮信息发布源 2.0-M32 大模型 4bit / 8bit 量化版:运行显存仅需 23GB,号称性能媲美 LLaMA3
浪潮信息今日发布源 2.0-M32 大模型 4bit 和 8bit 量化版,性能号称“比肩 700 亿参数的 LLaMA3 开源大模型”。4bit 量化版推理运行显存仅需 23.27GB,处理每 token 所需算力约为 1.9 GFLOPs,算力消耗仅为同等当量大模型 LLaMA3-70B 的 1/80。而 LLaMA3-70B 运行显存为 160GB,所需算力为 140GFLOPs。据浪潮信息介绍,源 2.0-M32 量化版是“源”大模型团队为进一步提高模算效率,降低大模型部署运行的计算资源要求而推出的版本,将
8/23/2024 11:44:52 AM
汪淼
讲座预约丨四位专家大论道 :大模型时代的强化学习丨GAIR live
站在科技创新的浪潮之巅,我们见证了人工智能领域的巨大飞跃,尤其是大模型技术与强化学习中的结合和突破性应用,正在引领我们进入一个全新的智能时代。 在过去几年中,强化学习作为人工智能的一个重要分支,已经从理论研究的深奥殿堂走向了实践应用的广阔天地,从实验室的封闭空间走向了我们日常生活的各个角落。 在自动驾驶、游戏AI、机器人控制等领域,强化学习的身影无处不在,它们正逐步成为我们生活中不可分割的一部分。
8/23/2024 11:43:00 AM
岑大师
文生图 AI 工具 Midjourney 开放网页版,新用户附赠 25 张免费试用额度
感谢Midjourney 官方账号在 X 平台发布推文,宣布向所有用户开放网页界面,并重新推出免费试用图像生成功能。Midjourney 此前因其文生图 AI 工具被滥用而暂停免费使用,现在重新向用户开放。科技媒体 The Decoder 认为 Midjourney 此举可能是针对最新上线的 Ideogram 2.0 工具。AI在线附上官方宣传视频如下: 用户无需使用 Discord 即可注册网页版并在网页版中生成图片,Midjourney 还准备了一些常见的提示词帮助以及图片示例,用户可以根据浏览其他用户生成的图
8/23/2024 11:34:25 AM
故渊
威刚联手研华推出第三代 C-Rob 自走机器人,搭载英伟达 Nova Orin 平台
据研华本月 21 日新闻稿,威刚联合该企业成功打造了第三代 C-Rob AMR(AI在线注:自走机器人,Autonomous Mobile Robot),可减少 70% 导入时间。威刚与研华此前在机器人领域即有合作:威刚的第二代 C-Rob AMR 就在上位机系统应用了研华的 MIC-710AIX 自走机器人应用 AI 推理系统。而威刚第三代 C-Rob AMR 搭载则搭载研华 MIC-732-AO 系统;MIC-732-AO 建立在英伟达 2022 年推出的 Isaac Nova Orin 计算和传感器参考平台上
8/23/2024 10:53:24 AM
溯波(实习)
开源公司 Grafana Labs 融资 2.7 亿美元;a16z 发布全球 Top100 AI 应用:字节美图上榜丨AI情报局
今日融资快报开源软件提供商 Grafana Labs 以 60 亿美元估值筹集 2.7 亿美元Grafana Labs 正式名称为 Raintank Inc.,是 Grafana Cloud 的创造者,这是一个广泛使用的开源 IT 基础设施监控平台。 该平台通过从客户的基础设施中抓取遥信数据和运营数据,并将这些数据绘制成图表,帮助管理员更容易地识别模式和趋势。 Grafana 还提供针对不同 IT 基础设施平台的工具,例如 Grafana Cloud 中的 Kubernetes Monitoring 模块,以及利用 AI 减少云基础设施成本的 Adaptive Metrics 功能。
8/23/2024 10:25:00 AM
我在思考中
硅基向左,潞晨向右
如果将大模型应用开发比做“淘金”,那么构建大模型基座所必需的算力和工具体系,则是不可或缺的“铲子”。 俗话说,淘金先富卖铲人,谁都想在这场 AI 浪潮中“分一杯羹”,不光巨头在争当“卖铲人”,也有不少创业公司从中发现了新的机遇。 其中,在加速计算赛道,袁进辉带领的硅基流动与尤洋创办的潞晨科技可谓典型代表,在他们之外,国内早期能做出分布式系统的团队并不多。
8/23/2024 9:50:00 AM
朱可轩
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
模态
字节跳动
Claude
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
科技
亚马逊
智能体
DeepMind
特斯拉