应用
Meta 公司发布 Imagine Yourself:无需为特定对象微调的个性化图像生成 AI 模型
从社交媒体到虚拟现实,个性化图像生成因其在各种应用中的潜力而日益受到关注。传统方法通常需要针对每位用户进行大量调整,从而限制了效率和可扩展性,为此 Meta 公司创新提出了“Imagine Yourself” AI 模型。传统个性化图像生成方法挑战目前的个性化图像生成方法通常依赖于为每个用户调整模型,这种方法效率低下,而且缺乏通用性。虽然较新的方法试图在不进行调整的情况下实现个性化,但它们往往过度拟合,导致复制粘贴效应。Imagine Yourself 创新Imagine Yourself 模型不需要针对特定用户微
8/23/2024 1:41:31 PM
故渊
快手可灵 AI 推出会员订阅计划:支持 AI 图片 / 视频,首月 19 元起
感谢快手可灵 AI 推出会员订阅计划,其中连续包月首月最低价 19 元、次月 58 元,可生成约 66 个视频或 3300 张图片,还可享受高表现视频生成、视频延长、大师运镜等多项会员专属功能。与此同时,可灵 AI 针对 B 端同步开启 OpenAPI 企业用户招募,首批加入企业将拥有优先接入和专属技术支持。快手刚发布的 2024 年二季度财报显示,可灵 AI 已有超百万用户,累计生成了超千万视频。快手联合创始人、董事长兼 CEO 程一笑表示,未来将进一步升级可灵大模型,同时力争尽快实现可观的商业化变现规模。可灵大
8/23/2024 1:19:00 PM
汪淼
在 AI 最火热的时候,AI 大牛田渊栋写了本小说《破晓之钟》
“在 AI 最火热的时候,我写了本小说。”这话不是别人说的,这话是 AI 大牛田渊栋说的。这个名字可能不彰显于大众媒体,但在计算机和 AI 领域,几乎是判别式一样的存在。至少在华人科学家面孔中,盘点谷歌无人车时绕不过他,盘点围棋 AI 时绕不过他,梳理巨头 Meta 的 AI 人才时也遗漏不了他。田渊栋现在是 Meta AI Research(FAIR)研究科学家总监,正在带队研究,如何让 AI 在推理和规划问题上,产生现有的大模型产生不了的能力。他是上海交大校友,在计算机系获得了本科和硕士学位,其后又进一步到了
8/23/2024 12:06:20 PM
清源
浪潮信息发布源 2.0-M32 大模型 4bit / 8bit 量化版:运行显存仅需 23GB,号称性能媲美 LLaMA3
浪潮信息今日发布源 2.0-M32 大模型 4bit 和 8bit 量化版,性能号称“比肩 700 亿参数的 LLaMA3 开源大模型”。4bit 量化版推理运行显存仅需 23.27GB,处理每 token 所需算力约为 1.9 GFLOPs,算力消耗仅为同等当量大模型 LLaMA3-70B 的 1/80。而 LLaMA3-70B 运行显存为 160GB,所需算力为 140GFLOPs。据浪潮信息介绍,源 2.0-M32 量化版是“源”大模型团队为进一步提高模算效率,降低大模型部署运行的计算资源要求而推出的版本,将
8/23/2024 11:44:52 AM
汪淼
讲座预约丨四位专家大论道 :大模型时代的强化学习丨GAIR live
站在科技创新的浪潮之巅,我们见证了人工智能领域的巨大飞跃,尤其是大模型技术与强化学习中的结合和突破性应用,正在引领我们进入一个全新的智能时代。 在过去几年中,强化学习作为人工智能的一个重要分支,已经从理论研究的深奥殿堂走向了实践应用的广阔天地,从实验室的封闭空间走向了我们日常生活的各个角落。 在自动驾驶、游戏AI、机器人控制等领域,强化学习的身影无处不在,它们正逐步成为我们生活中不可分割的一部分。
8/23/2024 11:43:00 AM
岑大师
文生图 AI 工具 Midjourney 开放网页版,新用户附赠 25 张免费试用额度
感谢Midjourney 官方账号在 X 平台发布推文,宣布向所有用户开放网页界面,并重新推出免费试用图像生成功能。Midjourney 此前因其文生图 AI 工具被滥用而暂停免费使用,现在重新向用户开放。科技媒体 The Decoder 认为 Midjourney 此举可能是针对最新上线的 Ideogram 2.0 工具。AI在线附上官方宣传视频如下: 用户无需使用 Discord 即可注册网页版并在网页版中生成图片,Midjourney 还准备了一些常见的提示词帮助以及图片示例,用户可以根据浏览其他用户生成的图
8/23/2024 11:34:25 AM
故渊
威刚联手研华推出第三代 C-Rob 自走机器人,搭载英伟达 Nova Orin 平台
据研华本月 21 日新闻稿,威刚联合该企业成功打造了第三代 C-Rob AMR(AI在线注:自走机器人,Autonomous Mobile Robot),可减少 70% 导入时间。威刚与研华此前在机器人领域即有合作:威刚的第二代 C-Rob AMR 就在上位机系统应用了研华的 MIC-710AIX 自走机器人应用 AI 推理系统。而威刚第三代 C-Rob AMR 搭载则搭载研华 MIC-732-AO 系统;MIC-732-AO 建立在英伟达 2022 年推出的 Isaac Nova Orin 计算和传感器参考平台上
8/23/2024 10:53:24 AM
溯波(实习)
开源公司 Grafana Labs 融资 2.7 亿美元;a16z 发布全球 Top100 AI 应用:字节美图上榜丨AI情报局
今日融资快报开源软件提供商 Grafana Labs 以 60 亿美元估值筹集 2.7 亿美元Grafana Labs 正式名称为 Raintank Inc.,是 Grafana Cloud 的创造者,这是一个广泛使用的开源 IT 基础设施监控平台。 该平台通过从客户的基础设施中抓取遥信数据和运营数据,并将这些数据绘制成图表,帮助管理员更容易地识别模式和趋势。 Grafana 还提供针对不同 IT 基础设施平台的工具,例如 Grafana Cloud 中的 Kubernetes Monitoring 模块,以及利用 AI 减少云基础设施成本的 Adaptive Metrics 功能。
8/23/2024 10:25:00 AM
我在思考中
硅基向左,潞晨向右
如果将大模型应用开发比做“淘金”,那么构建大模型基座所必需的算力和工具体系,则是不可或缺的“铲子”。 俗话说,淘金先富卖铲人,谁都想在这场 AI 浪潮中“分一杯羹”,不光巨头在争当“卖铲人”,也有不少创业公司从中发现了新的机遇。 其中,在加速计算赛道,袁进辉带领的硅基流动与尤洋创办的潞晨科技可谓典型代表,在他们之外,国内早期能做出分布式系统的团队并不多。
8/23/2024 9:50:00 AM
朱可轩
数字华夏展示“夏澜”人形机器人:高仿外观、百变人脸、自然语音交互
2024 世界机器人大会(WRC)于 8 月 21 日在北京开幕,数字华夏(深圳)科技有限公司(下文简称数字华夏)展示了全新的交互型人形机器人“夏澜”。首创“人形交互机器人”概念,目标打造“有温度的人形机器人”AI在线从报道中获悉,数字华夏公司首创“人形交互机器人”概念,其核心目标是打造“有温度的人形机器人”,希望能突破传统机器人的冰冷界限,创造真正能与人类产生情感共鸣的智能伙伴。 强大 AI 系统数字华夏的夏系列人形机器人最大的亮点在于强大的 AI 系统,官方将其称为“智慧大脑”,能展现丰富表情的“百变人脸”、接
8/23/2024 8:52:15 AM
故渊
全球消费级 AI 移动应用 TOP 50 榜单:美图秀秀挤进前十,字节跳动豆包首次上榜排 26 位
风投公司安德里森・霍罗威茨(Andreessen Horowitz,又名 a16z)于 8 月 21 日发布博文,公布了最新《Top 100 消费级生成式 AI 应用》榜单。a16z 公司简介安德里森・霍罗威茨,又名 a16z,是一家美国私人风险投资公司,由马克・安德里森和本・霍罗威茨于 2009 年创立。该公司总部位于美国加利福尼亚州门洛帕克,从 2006 年到 2010 年,安德里森和霍罗威茨都是科技公司的积极投资者,他们共同投资了 8000 万美元在 Twitter 等 45 家初创公司。报告简介报告每隔 6
8/23/2024 7:54:49 AM
故渊
原 Character.AI CEO 诺姆・沙泽尔“回家”后履新,消息称将任谷歌 Gemini 联合技术负责人
据 The Information 北京时间今天晨间报道,谷歌发送给员工的消息显示,本月重返谷歌的 Character.AI 联合创始人兼原 CEO 诺姆・沙泽尔(Noam Shazeer)将担任谷歌 AI 项目 Gemini 的联合技术负责人。沙泽尔将与谷歌长期从事人工智能研究的杰夫・迪恩(Jeff Dean)和奥里奥尔・维尼亚尔斯(Oriol Vinyals)一起开发 Gemini,其目标是与 OpenAI 的大语言模型 GPT 竞争。本月初,初创公司 Character.AI 宣布,该公司已与谷歌母公司 Al
8/23/2024 7:50:59 AM
清源
英伟达发布 80 亿参数新 AI 模型:精度、效率高,可在 RTX 工作站上部署
英伟达于 8 月 21 日发布博文,发布了 Mistral-NeMo-Minitron 8B 小语言 AI 模型,具备精度高、计算效率高等优点,可在 GPU 加速的数据中心、云和工作站上运行模型。英伟达携手 Mistral AI 上月发布开源 Mistral NeMo 12B 模型,在此基础上英伟达再次推出更小的 Mistral-NeMo-Minitron 8B 模型,共 80 亿个参数,可以在搭载英伟达 RTX 显卡的工作站上运行。英伟达表示通过宽度剪枝(width-pruning)Mistral NeMo 12
8/23/2024 7:32:00 AM
故渊
微软 Azure AI 语音服务推出虚拟人形象,支持文本转视频
微软 Azure AI 语音服务允许开发者构建多语言生成式 AI 语音应用,Azure AI 语音服务最新推出了文本到语音虚拟人功能,可以将简单的文本转换为人类自然说话视频。今天,微软宣布全面推出 Text to Speech Avatar 功能。这项新功能使开发者能够为其用户创建个性化虚拟人。该服务的输出视频分辨率为 1920 x 1080,每秒 25 帧。AI在线附示例如下:Text to Speech Avatar 具有以下功能:将文本转换为由 Azure AI 文本转语音提供支持的人类说话视频,该视频具有自
8/23/2024 7:29:09 AM
汪淼
McAfee 携手联想推出“全球首款自动 Deepfake 检测器”,遏制 AI 诈骗
网络安全公司 McAfee 和联想公司合作,推出了全新的 Deepfake Detector,声称是全球首款自动 Deepfake 检测器,可以遏制网络钓鱼。McAfee 表示该工具基于自家 AI 算法,能够帮助用户识别可能的 Deepfake 诈骗以及其它 AI 骗局,目前已经邀请美国、英国、澳大利亚的部分联想 AI PC 用户测试,初期仅限于英语情境。McAfee 表示 Deepfake Detector 已使用超过 20 万个样本进行训练,并非依赖云网络,而是利用联想 AI PC 中的 NPU,直接从 PC
8/23/2024 7:15:34 AM
故渊
AI 视频哪家强?7款AI视频生成工具详细测评
国内外AI视频生成工具那么多,各自有哪些优缺点,该如何选择?这篇文章帮你总结好了!一、可灵 AI-内测完全免费
支持文生图/视频、图生图/视频、支持首尾帧、支持运镜调整,内测完全免费
网站链接: 、Dreamina(即梦)
支持文生图/视频、图生图/视频、支持首尾帧、支持运镜调整,每天 88 积分(预计 9 个视频)
网站链接: 、Luma-图转视频稳定
支持文生视频、图生视频、支持首尾帧、每月可免费生成 30 个视频
网站链接: 、Pika-支持语音视频同步生成
支持文生视频、图生视频、支持首尾帧、支持运镜,支持
8/23/2024 12:44:16 AM
DataGrand UED
Midjourney 官宣网页版免费用,前谷歌大佬祭出 AI 生图 Ideogram 2.0
Midjourney 一度稳居 AI 生图的第一梯队,甚至是很多人心中的 Top1。但是 Ideogram 2.0 的发布,抢夺了 Midjourney 的荣光,不仅一举拉高了图像生成质量,还打起了价格战。曾经在 AI 图像生成领域无可匹敌的领导者 Midjourney,终于听劝了,上周五推出了网页版图像编辑器。新编辑器巧妙集成了重绘、缩放等核心功能。不仅提高了操作效率,而且使整体交互逻辑更加清晰,对于高频使用 Midjourney 的用户来说,绝对欣喜!今天,Midjourney 宣布,将升级后的新工具向所有人免
8/22/2024 11:27:13 PM
问舟
实测四款AI生图神器,Midjourney「霸主」地位难撼动
机器之能报道编辑:杨文MJ、Ideogram 2.0、Flux、Imagen 3,谁能坐上AI生图第一把交椅?AI 圈,卷完视频卷图像。继 FLUX 生成的各种恶搞图像满天飞后,其他 AI 生图玩家也坐不住了,纷纷迎战:就在今天,Midjourney 一改往日「高冷范」,宣布所有用户可免费使用一个月(暗藏小心思:只能免费生成 25 张图像);同时,Ideogram 也正式推出 2.0 版本,声称文本渲染能力更强;谷歌曾多次「剧透」的 AI 生图模型 Imagen 3 前几天也终于亮相。更有趣的是,Ideogram和
8/22/2024 7:13:00 PM
机器之能
资讯热榜
OpenAI 开源模型被 Meta 研究员“逆改”!只动0.3%参数,gpt-oss-20B 解锁无约束基座
奥特曼:我承认GPT-5发布搞砸了
OpenAI突然"背叛"自己:推理与创作分家,万能AI时代终结?
大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷
谷歌最新「0.27B」Gemma 3开源!身板小却猛如虎,开发者直呼救命稻草
GPT 4o-mini华人领队离开OpenAI:真正推动AI进步不是模型架构,而是互联网
小红书发布DynamicFace人脸生成技术,实现高质量图像视频人脸融合
阿里千问踢馆子了!Qwen3新作秒杀ChatGPT,侧脸杀切换第一人称视角,表情包绝绝子,小编:再也不用美图秀秀去水印了
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
Anthropic
英伟达
代码
训练
算法
Stable Diffusion
芯片
LLM
AI新词
蛋白质
开发者
腾讯
生成式
Claude
苹果
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
人形机器人
xAI
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
场景
大型语言模型
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
特斯拉
应用