应用
如何用AI工具快速制作红包封面?教程来了!
红包封面制作简易教程来啦!
更多教程:微信红包封面开发平台:
WHEE-AI 绘画工具:
RUNWAY-AI 视频工具:
美图抠图-抠图工具:
熊猫压缩-图片压缩工具:
2/10/2024 8:58:50 AM
宇
13页PPT融到1亿后,1X的这批机器人可能要醒了......
机器之能报道编辑:吴昕如果这批 EVE(轮足)机器人大军即将醒来,你会作何感想?上个月刚官宣 B 轮 1 亿美元融资后,OpenAI 领投的挪威机器人公司 1X 又放出消息,明天要有令人兴奋的事情发生。公司 AI 部门负责人、机器人科学家 Eric Jang 今天公开表示,明天将发布有关 AI 和自主性方面的更新。至于具体内容,他卖了个关子,只给了一些提示——线索就在过去一年多他们分享的视频里,与数据引擎的规模化有关。看似神秘,答案并非无迹可寻。上个月 1 亿美元 B 轮融资完成后,1 月 19 日,1X 创始人&
2/8/2024 8:16:00 PM
机器之能
斯坦福最强家务机器人ALOHA 2来了,成本不到20万,联手谷歌DeepMind,完全开源
可以想象,不断进化的双臂机器人未来将最大程度地「解放」人的双手。2023 年,斯坦福大学等机构推出了一个用于双机械手远程操作的低成本开源硬件系统 ALOHA,它可以远程操作并完成组装链条、托举乒乓球等复杂、丰富的任务。今年 1 月,谷歌 DeepMind 与斯坦福又联合推出了 Mobile ALOHA,同样可以进行远程操作并模仿双手操作,通过移动底座在大的空间范围内实现远程操作。这样一来,备菜、翻炒、出锅,洗衣、逗猫、浇花它是样样精通,名副其实的家务机器人火出了圈。今天,谷歌 DeepMind 联合斯坦福推出了 A
2/8/2024 5:00:00 PM
机器之心
系统Prompt长达1700个token,ChatGPT变「懒」的原因找到了?
ChatGPT:我不是不会,就是不想干活。现阶段,ChatGPT 已经成为很多人的得力助手,写文档、编代码、生成图片…… 但看似无所不能的 ChatGPT,也有其懒惰的一面。不知大家是否还记得去年年底 GPT-4 开始变「懒」的事实,比如对于用户提出的要求,ChatGPT 的响应会变得非常缓慢且敷衍,甚至还会单方面中断对话;又比如用户要求 ChatGPT 编写一段代码,它会建议用户自己去写。当时,OpenAI 给出的解释是模型行为是不可预测的,他们也在研究如何修复。一种看似无解的问题,现在另一种解释似乎正在被广大网
2/8/2024 4:54:00 PM
机器之心
开源大模型正在重塑企业AI应用,16个案例看看它们如何落地
企业运作新引擎:开源大模型。各种性能优异的大模型横空出世,开源大型语言模型在企业界的应用也逐渐引起广泛关注。不过,这也使新的问题浮出水面,企业应该怎样有效地部署和应用这些模型来发挥它们最大的价值呢?图灵奖得主 Yann LeCun 在 X 上向大家分享了一篇 VentureBeat 的文章。其探讨了开源 LLM 在商业环境中的潜力、挑战以及它们在不同行业中的实际应用案例。原文链接: 和其他专家认为,开源 LLM 可能会对企业中的生成式人工智能产生更强大的影响。这种影响力可能超过了像 OpenAI 的 ChatGPT
2/8/2024 4:48:00 PM
机器之心
大语言模型的可信之路:TrustLLM全面揭秘
TrustLLM 是一个统一的框架,用于对 LLM 的可信度进行全面分析,包括现有工作的全面综述、可信 LLM 的不同维度的原则、一个新的测试基准,以及对主流 LLM 的全面可信度评估。大型语言模型(LLMs)在 NLP 方面的卓越能力已引起广泛关注,影响了我们生活各个方面的应用。LLMs 的出色能力归因于多个因素,例如使用来自 Web 的大规模原始文本作为训练数据,使用具有大量参数的 transformer 架构设计,以及先进的模型训练方案等。 然而,LLMs 的兴起也引入了关于它们可信度的担忧。与传统语言模型不
2/8/2024 4:45:00 PM
机器之心
黄仁勋:从此之后,请叫我黄院士
I am AI.北京时间 2 月 7 日凌晨,美国国家工程院(National Academy of Engineering, NAE)公布了今年的新增院士名单。院长约翰・L・安德森(John L. Anderson) 表示,美国国家工程院本次已选出 114 名新院士和 21 名国际院士,这使得美国会员总数达到 2310 名,国际会员数量达到 332 名。值得关注的是,在新院士名单中,英伟达创始人、CEO 黄仁勋赫然在列。当前,全球科技公司和机构正在加速建立 AI 基础设施,不断推高对于英伟达芯片的需求。而黄仁勋的
2/8/2024 4:42:00 PM
机器之心
吉他摇滚、电子音乐都能搞定,Meta开源音频生成新模型MAGNeT,非自回归7倍提速
MAGNeT 有望改变我们体验音乐的方式。在文本生成音频(或音乐)这个 AIGC 赛道,Meta 最近又有了新研究成果,而且开源了。前几日,在论文《Masked Audio Generation using a Single Non-Autoregressive Transformer》中,Meta FAIR 团队、Kyutai 和希伯来大学推出了 MAGNeT,一种在掩码生成序列建模方法,可以直接在多个音频 tokens 流上直接运行。与以往工作最大的不同是,MAGNeT 是由单阶段、非自回归 transform
2/8/2024 3:59:00 PM
机器之心
传苹果VisionPro 4或5月登陆中国,大厂应用火速跟进
机器之能报道编辑:SiaApple Vision Pro 目前仅在美国推出,但从一开始就有报道称它将很快在国际上推广。《华尔街新闻》快讯报道,供应链预计该产品最早可能于 4 月份在中国发布。它明确表示“最早四月(但不晚于五月)”。目前还没有更多细节,但供应链还声称“工信部的注册程序已接近完成”。消息预计,首批 Apple Vision Pro 在中国供应“将会紧张”。据南华早报报道,国内已有数十家商家愿意以官方价格的两倍将该产品从美国运送到中国。目前社交媒体已经在流传国内海关扣留 4 台入境 Vision Pro
2/8/2024 11:04:00 AM
机器之能
5000字干货!盘点2023年Stable Diffusion GUI工具及其创作生态
正文开始之前,这里先用一句话概括性的介绍一下 Stable Diffusion:它是一种基于深度学习的文本到图像的生成模型。能够根据文本描述创造出丰富多样且具有高质量和细节的图像。它的生成模型是通过大规模图像及其描述的数据集训练而成,所以生成的图像在保持高创造性的同时,还具有较高的高分辨率。另外因其开源性质和强大的功能在 AI 绘画领域具有重要的地位。具体的原理这里就不展开讲了,我们只需要知道它是一种能够通过文本描述生成图像的 AI 绘画工具就够了。2023 年是 AI 相关技术井喷式爆发的一年,在 AI 绘画领域
2/7/2024 8:37:17 AM
五幺六
ML Blocks!全新的节点式 AI 图像处理神器
大家好,我是花生~
之前为大家介绍过不少 AI 图像处理神器,比如 Clipdrop、Pixian、Upscayl 等,可以帮我们便捷地完成抠图、修图、高清放大等任务。最近又发现了一个新的 AI 图像处理工具 ML Blocks,非常有意思,今天推荐给大家~
相关推荐:ML Blocks
官网直达:
官方教程:
与我们常用的图像处理工具不同,ML Blocks 的工作界面是一块白板,它的各种图像处理功能则被分为一个个独立的模块,当我们想实现某种图像处理效果时,可以自己将对应的模块连接到一起形成的工作流(work
2/7/2024 8:23:11 AM
夏花生
俄罗斯小哥ChatGPT找女友:聊了5239个女生,现在订婚了
有事 AI 它是真上啊。「我向一位女生求婚,ChatGPT 已经和她交流了一年。为了走到这一步,AI 已经尝试了和 5239 名女生进行过沟通……」 来源:,社交网络上人们正在轮番向一位俄罗斯小哥送去祝福。23 岁的 Aleksandr Zhadan 是一名 AI 开发者,也是社交平台 TenChat 的一名产品经理。故事是这样开始的:GPT 除了搜索之外,还可以在配对后写入。这样在 50 次自动执行中,他可以获得 18 次配对。GPT 在没有 Aleksa
2/6/2024 9:08:00 PM
机器之心
徒手搬汽车配件,波士顿动力Atlas再进化:兄弟们,准备进厂了
在如今颇为火热的人形机器人赛道,波士顿动力是较早入局的一位选手。过去几年,Atlas 人形机器人的动态跑酷能力已经让全世界的关注,后来我们还看到 Atlas 在模拟建筑工地上搬搬扛扛。Atlas 目前仍然是一个开发平台,尚不能在现实世界中工作,一部分原因是它的液压驱动设计。不过,波士顿动力最新公布的一个演示视频表明了 Atlas 和其他人形机器人一样能够完成高难度的操纵任务,包括在装备适当的情况下操纵重物。在视频中,Atlas 稳稳抓起一个比自己手臂还粗的汽车配件,搬运到目标位置:实际上,Atlas 在很长一段时间
2/6/2024 9:00:00 PM
机器之心
胡渊鸣创业公司Meshy产品升级:文本转3D,25秒就能出预览
Meshy-2 的文本转 3D、图像转 3D、文本到纹理效果均有所提升。刚刚,胡渊鸣创业公司 Meshy 官宣了他们的第二代产品 ——Meshy-2。Meshy 是一款 3D 内容生成工具,只需一分钟,即可使用 Al 生成 3D 内容(模型)。公司联合创始人兼 CEO 胡渊鸣是计算机图形学知名学者,毕业于清华大学姚班,是 MIT 博士,也是「太极」(TaiChi)编程语言作者。具体来说,Meshy 提供三种很容易上手的使用方式,包括文本转 3D(输入文字 —— 输出 3D 模型)、图像转 3D(提供图片 —— 生成
2/6/2024 8:50:00 PM
机器之心
通义千问再开源,Qwen1.5带来六种体量模型,性能超越GPT3.5
超越 Claude、GPT-3.5,提升了多语言支持能力。赶在春节前,通义千问大模型(Qwen)的 1.5 版上线了。今天上午,新版本的消息引发了 AI 社区关注。新版大模型包括六个型号尺寸:0.5B、1.8B、4B、7B、14B 和 72B,其中最强版本的性能超越了 GPT 3.5、Mistral-Medium,包括 Base 模型和 Chat 模型,且有多语言支持。阿里通义千问团队表示,相关技术也已经上线到了通义千问官网和通义千问 App。除此以外,今天 Qwen 1.5 的发布还有如下一些重点:支持 32K
2/6/2024 8:41:00 PM
机器之心
向完全自主性更进一步,清华、港大全新跨任务自我进化策略让智能体学会「以经验为鉴」
「以史为鉴,可以知兴替。」 人类的进步史,可以看作是一个不断吸取过去经验、不断推进能力边界的自我演化过程。在这个过程中,我们吸取过去失败的教训以纠正错误,借鉴成功的经验以提升效率和效果。这种自我进化的过程在我们的生活中无所不在:从如何总结经验以更好地解决工作中的问题,到如何利用规律更精确地预测天气,我们都在不断地从过去的经验中学习和进化。成功从过去的经验中提取知识并将其应用于未来的挑战,这是人类进化之路上重要的里程碑。那么在人工智能时代,AI 智能体是否也可以做到同样的事情呢?近年来,GPT 和 LLaMA 等语言
2/6/2024 8:36:00 PM
机器之心
摧毁房价的,可能是Apple Vision Pro
机器之能报道编辑:吴昕公共场合,“演技”趋于浮夸的人越来越多......辛普森一家早就预言了 Apple Vision Pro:)视频链接: Vision Pro 以来不到 48 小时,人们开始为之疯狂。一些大城市中心已经出现佩戴 Vision pro 逛街的人,甚至有人戴着它开车、上飞机旅行。有意思的是,在此之前,Meta Quest 已售出超 2000 万台(去年 11 月份的媒体数据,其中 1800 万台是 Quest 2 ),我们几乎看不到类似场景,没人戴着它出街。据媒体披露,早在苹果发布第一代苹果手机
2/6/2024 5:50:00 PM
机器之能
夸克大模型应用为先加持夸克网盘深挖相册使用场景
2024年将是大模型应用落地的爆发年,这已经成为业界共识。夸克大模型自去年11月份发布以来,结合自身业务小步快跑,在夸克App上已经落地了多个应用。最近,夸克网盘结合春节场景和大模型技术,升级几项图片处理智能工具。夸克网盘即将上线的“春节图片故事”,是为用户春节期间拍摄上传的图片自动智能筛选生成合辑。该功能除了基于时间、地点两个维度筛选,还会基于人物智能筛选,并剔除掉过亮或过暗等不符合要求的图片。夸克网盘还会利用AI算法为图片合辑智能生成文案,比如鲜花影集的文案是“花与美妙人间”。此前,AI技术还被应用在夸克网盘相
2/6/2024 5:24:00 PM
新闻助手
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
Meta
GPT
学习
图像
技术
Gemini
AI创作
马斯克
论文
代码
Anthropic
英伟达
算法
Stable Diffusion
芯片
智能体
训练
开发者
生成式
腾讯
蛋白质
苹果
AI新词
神经网络
3D
研究
生成
Claude
机器学习
LLM
计算
Sora
AI设计
AI for Science
AI视频
GPU
xAI
人形机器人
百度
华为
搜索
大语言模型
场景
Agent
字节跳动
预测
深度学习
伟达
工具
大型语言模型
Transformer
RAG
视觉
神器推荐
模态
Copilot
亚马逊
具身智能
LLaMA
文本
算力
驾驶
DeepMind