应用
消息称 OpenAI 正与博通、台积电联手,共同打造自研芯片
感谢北京时间今天凌晨,据路透社援引知情人士消息称,OpenAI 正携手 Broadcom 和台积电开发首款自研 AI 芯片,并在英伟达芯片的基础上增添 AMD 芯片,以应对急剧扩张的基础设施需求。 成长势头正猛的 OpenAI 是 ChatGPT 背后的公司,其正在多方探索多样化芯片供应渠道,降低成本,曾考虑自行生产,并为一项建造“晶圆厂”网络的高昂计划筹资,全面掌控芯片制造。 不过,由于该计划耗资巨大且时间漫长,OpenAI 已暂时搁置建厂计划,转向内部设计芯片。
10/30/2024 7:34:34 AM
清源
谷歌 CEO 桑达尔・皮查伊:努力在明年推出具有可视化功能的 AI 助理
北京时间今天凌晨,谷歌 CEO 桑达尔・皮查伊在公司第三季度财报电话会议上透露了“Project Astra”计划的最新进展。 他表示,谷歌正在构建能够识别和推理用户周围环境的 AI 体验,“‘Project Astra’代表了这种未来的初步探索。 我们正力争在 2025 年尽早推出类似体验。
10/30/2024 7:24:46 AM
清源
第四波!2024年10月精选实用设计工具合集
大家好,这是 2024 年 10 月的第 4 波干货合集! 没想到这次在搜集设计和 AI 工具的过程中,还能找到之前一个 AI 设计工具同个开发者的另一个工具,两者技术路线相似但是相得益彰,是那种真正能解决设计问题的好东西,尤其是它还免费。 此外,今天的合集当中,还有最新的最佳 AI 工具导航,Figma 网站和 UI 模板网站,以及 AI 混图的平台,都是不错的好东西。
10/30/2024 6:34:22 AM
陈子木
同一组提示词,你觉得哪个AI绘画工具效果更好?
AI 电商设计新思路! Midjourney 一站搞定 N 种不同风格的场景素材大家好,我是花生。 阅读文章 .
10/30/2024 12:21:31 AM
Infinite AI
养猪、插秧、搬货……这才是机器人该干的活儿
AI好好用报道编辑:杨文开心的活儿还是留给人类吧。 近两年,AI 发展得如火如荼,不少人却在抱怨:AI 真不是个好东西。 理由很简单。
10/29/2024 6:31:00 PM
AI好好用
探秘全球最大 AI 集群 xAI Colossus:122 天建成,10 万张英伟达 H100 构筑马斯克 AI 愿景
科技媒体 servethehome 昨日(10 月 28 日)发布博文,应 xAI 公司邀请,参观了 Colossus 全球最大 AI 训练集群。 AI在线曾于今年 9 月报道,xAI 在 Supermicro 的帮助下,在短短 122 天时间内搭建 10 万张英伟达 H100,而该公司计划未来将再翻倍增加 10 万张 GPU,其中 5 万张为更先进的 H200。 xAI Colossus 配备了英伟达 HGX H100 服务器,每台服务器内含 8 张 H100 GPU,所有服务器都在 Supermicro 的 4U 水冷系统中运行,确保高效散热。
10/29/2024 4:50:52 PM
故渊
全国首批人形机器人具身智能标准发布:按下肢运动、上肢作业等分 4 个等级
据浦东发布消息,人形机器人及具身智能创新论坛昨日在上海召开,国家地方共建人形机器人创新中心联合行业内头部企业和机构,共同发布全国首批人形机器人具身智能标准 ——《人形机器人分类分级应用指南》《具身智能智能化等级分级指南》。 ▲ 图源浦东发布公众号《人形机器人分类分级应用指南》定义了人形机器人通用、结构、智能相关的术语名词,从结构外观、移动方式、智能模型等方面进行指导分类,按照具身智能、下肢运动、上肢作业、应用环境等作为分级要素,将人形机器人划分为 L1-L4 四个技术等级(详细标准暂未公开,下同)。 《具身智能智能化等级分级指南》规定了具身智能技术领域的智能化等级划分依据,采用系统功能性、自主性、泛化性的分级原则,按照感知、认知、决策、自主等核心能力作为分级要素,将智能化等级从基础到高级智能化水平划分为 G1-G5 五个阶段。
10/29/2024 4:26:39 PM
沛霖(实习)
智源推出全能视觉生成模型 OmniGen:支持文生图、图像编辑等
北京智源人工智能研究院(BAAI)推出了新的扩散模型架构 OmniGen,这是一种用于统一图像生成的多模态模型。 ▲ 文本生成图像,编辑生成图像的部分元素,根据生成图像的人体姿态生成重绘图像,从另一图像中提取所需对象与新图像融合官方表示,OmniGen 具有以下特点:统一性:OmniGen 天然地支持各种图像生成任务,例如文生图、图像编辑、主题驱动生成和视觉条件生成等。 此外,OmniGen 可以处理经典的计算机视觉任务,将其转换为图像生成任务。
10/29/2024 4:11:56 PM
沛霖(实习)
Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者Julian Schrittwieser
从 AlphaGo、AlphaZero 、MuZero 到 AlphaCode、AlphaTensor,再到最近的 Gemini 和 AlphaProof,Julian Schrittwieser 的工作成果似乎比他的名字更广为人知。 今天的 AI 社区,再次被一则大佬转会消息吸引了目光。 在谷歌工作十年后,大名鼎鼎的谷歌 DeepMind Alpha 系列核心作者 Julian Schrittwieser,宣布加入 Anthropic。
10/29/2024 2:25:00 PM
机器之心
丹麦首台AI超级计算机,NVIDIA技术加持,服务于量子计算、清洁能源、生物技术等领域
编辑 | 萝卜皮2024 年 10 月 23 日 NVIDIA 创始人兼首席执行官黄仁勋携手丹麦国王启动该国最大 AI 超级计算机,旨在实现量子计算、清洁能源、生物技术等领域的突破,服务丹麦社会乃至全球。 丹麦首台 AI 超级计算机以丹麦神话中的女神命名为 Gefion。 Gefion 由丹麦人工智能创新中心 (DCAI) 运营,该公司由全球最富有的慈善基金会 Novo Nordisk 基金会和丹麦出口与投资基金资助成立。
10/29/2024 2:24:00 PM
ScienceAI
神秘模型“小熊猫”一夜刷屏:排名超 Flux、Midjourney
一夜之间,名为“red_panda” (小熊猫)的神秘文生图模型狠狠火了! ! 登顶文生图竞技场,直接将 Flux、Midjourney 等一众顶尖模型踩在脚下 ——其 ELO 得分比 Flux 1.1 Pro 高出 100 多,胜率高达 79%,每 7 秒就能生成一张图像。
10/29/2024 1:35:35 PM
汪淼
古早费曼论文手写公式也能转LaTeX,还能看懂梗图,马斯克Grok新功能上线就火了
Grok 大模型终于能看懂图像了。 设想一下,如果我们能够将所有 LaTeX 时代之前的文本资料输入到先进的大型语言模型(LLM)中,并从中获得格式规范的 LaTeX 文档库,这无疑将极大地推动科学文献的数字化进程和标准化工作。 对于科研工作者而言,这不仅仅是技术层面的飞跃,它更标志着知识管理和信息传播方式的一次重大变革。
10/29/2024 1:29:00 PM
机器之心
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
大型语言模型(LLM)的出现统一了语言生成任务,并彻底改变了人机交互。 然而,在图像生成领域,能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。 近日,智源推出了新的扩散模型架构 OmniGen,一种新的用于统一图像生成的多模态模型。
10/29/2024 1:24:00 PM
机器之心
强化学习训练一两个小时,100%自主完成任务:机器人ChatGPT时刻真来了?
把平均成功率从 50% 拉到了 100%。 最近,AI 的进步有目共睹,现在这些进步已经开始传递到机器人领域。 强大的 AI 技术也能帮助机器人更好地理解其所处的物理世界并采取更合理的行动。
10/29/2024 1:21:00 PM
机器之心
权威AI开源标准1.0版发布:Llama也不算开源
大模型开源的口号,不是随便说说的。 该来的终于来了。 本周,人工智能领域迎来了对于「开源」的官方定义。
10/29/2024 1:17:00 PM
机器之心
国庆期间被 AI 雷军“骂了 7 天”,雷军本人呼吁网友不要再玩
感谢在今年国庆假期期间,一些网友利用 AI 技术克隆雷军的声音,借此吐槽不文明行为或表达对他人的不满,有网友戏称“被 AI 雷军追着骂了整个假期”。 对此,雷军本人今日发布视频回应称,的确让自己挺困扰,也挺不舒服。 雷军表示希望大家不要再玩了,觉得这个事情不太好,不过他还是觉得 AI 是很好的技术,也非常实用。
10/29/2024 12:56:24 PM
汪淼
华为云董理斌:解难题做难事,AI重塑千行万业
10 月 28 日,新浪新闻・2024 探索大会在北京召开,邀请专家学者、行业领袖,以及数字技术领域的探索者和从业者们,就新质生产力赋能产业、企业数字化转型、数字生态构建等热点话题展开深入探讨。 华为云 Marketing 部部长董理斌发表题为 “解难题做难事,AI 重塑千行万业” 的主题演讲,分享华为云在 AI for Science 领域的最新进展,以及盘古大模型、昇腾 AI 云服务等创新技术。 华为云 Marketing 部部长董理斌发表主题演讲人工智能正在改变我们进行科学研究的方式,增强人类探索以前难以解决的问题的能力。
10/29/2024 11:42:00 AM
新闻助手
微软开源 OmniParser 纯视觉 GUI 智能体:让 GPT-4V 秒懂屏幕截图,可操控手机 / 电脑
科技媒体 marktechpost 于 10 月 24 日发布博文,报道称微软公司宣布开源 OmniParser,是一款解析和识别屏幕上可交互图标的 AI 工具。 项目背景传统的自动化方法通常依赖于解析 HTML 或视图层次结构,从而限制了其在非网络环境中的适用性。 而包括 GPT-4V 在内的现有的视觉语言模型(VLMs),并不擅长解读复杂 GUI 元素,导致动作定位不准确。
10/29/2024 10:01:35 AM
故渊
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
Sora
3D
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind