应用
文生图 AI Midjourney 雄心:7.0 版未来 1-2 月登场、开发新图像编辑器、探索 3D 系统、踏足硬件领域
科技媒体 The Decoder 昨日(9 月 12 日)发布博文,报道称在最近的“Office Hours”活动中,Midjourney 创始人兼首席执行官 David Holz 在 Discord 分享了当前项目的最新进展,并回答了社区的提问。Midjourney 7.0 版本Holz 更新了 Midjourney 7.0 版本时间表,表示将会在未来 1-2 月内发布。让更多人体验 MidjourneyHolz 表示公司并不急于推出新的 AI 模型,而是提高现有技术的易用性,让工具深入融入到专业人士的日常工作中
9/13/2024 7:36:39 AM
故渊
安卓和 iOS 版谷歌 Gemini AI 应用新增 Gems 及管理器
科技媒体 testingcatalog 昨日(9 月 12 日)发布博文,报道称 iOS 和安卓版 Gemini 应用新增支持 Gem 和 Gem 管理器。用户现可在主屏幕上查看常规聊天及与 Gems 相关的聊天,此外用户可进入 Gem 管理器,界面采用标签式布局,首屏展示所有 Gems,分为用户自定义 Gems 和谷歌预制的 Gems 两部分。用户如果要编辑或创建新 Gems,用户会被引导打开网页版,该网页版会在同一应用内的网页视图中打开。Gemini 简介AI在线附上官方介绍如下:Gemini 应用是一款实验性
9/13/2024 7:24:34 AM
故渊
效率暴涨!100万人都在关注的多合一 AI 搜索神器 SeekAll!
大家好我是花生~
随着 AI 技术的发展成熟,我现在查资料基本都在用 AI 搜索引擎,比如 KimiChat、 腾讯元宝、Perplexity AI 等,它们真的极大提高了我的信息获取效率。不过现在各种 AI 搜索引擎太多了,为了获得更全面的信息,我常常不得不在多个引擎之间来回切换使用,有时也会觉得麻烦。
但最近我发现了一款宝藏工具刚好可以解决我的这个烦恼,它将多个 AI 搜索引擎及知识平台都聚合到了一起,我只需要发送一次提问,就能同时获得多个网站的答案,简直不要太方便!今天就为大家详细介绍这款多合一的 AI 搜索
9/13/2024 7:19:03 AM
夏花生
谷歌推出 DataGemma:基于可信数据源提高 AI 准确度,减少幻觉
科技媒体 maginative 昨日(9 月 12 日)发布博文,报道谷歌公司基于谷歌数据共享(Data Commons)中的真实世界统计数据,推出了开放权重 Gemma 模型的新版本 DataGemma。语言模型当前面临的一大难题就是幻觉(Hallucinations),尤其是大语言模型(LLMs)在处理数值或统计数据时,这一问题变得尤为棘手,因此精确性至关重要。谷歌的 Data Commons 是一个存储库,汇集了来自联合国和疾病控制与预防中心等可信组织收集的超过 2400 亿个数据点。通过利用这一庞大的统计
9/13/2024 7:11:53 AM
故渊
OpenAI o1 模型登场:开启 AI 通用复杂推理新篇章,国际奥数正确率 83%
感谢OpenAI 传闻中的“草莓”(Strawberry)AI 模型现已面世,正式名称为“o1”,是该公司首款具备“推理”能力的模型。o1 和 o1-miniOpenAI 表示对该模型进行特殊训练,能够比人类更快地回答更复杂的问题。与之同时发布的还有 o1-mini,一个更小、成本更低的版本。OpenAI 表示 o1 模型的发布,是其迈向类人 AI 宏伟目标的关键一步。AI在线注:o1 模型目前处于“预览”阶段,官方强调该模型相关开发尚处于初期阶段,相比较 GPT-4o 模型,使用成本更高且速度更慢,但在编写代码和
9/13/2024 6:56:28 AM
故渊
产品+AI如何设计?大厂高手总结了这3种方案!
一、前言
当我们一次次被 AI 技术带来的变革所惊艳,当 ChatGPT 一次次宣布其能力已经突破了人类的想象,你是否注意到现有产品与 AI 融合的新趋势?值得注意的是,新技术的出现也一定带来了新的交互体验。本文将以多种产品场景为例,梳理 PC 端多种主流的 AI 融合形态,希望能给大家带来启发。二、多元场景下的主流 AI 形态
目前主流 AI 产品有如下 3 种主要形态,分别为沉浸式的 AI 智能体(Agent)、伴随式的 AI 副驾驶(Co-pilot)、嵌入式的 AI 场景化嵌入(Embedding)。这 3
9/13/2024 1:19:22 AM
团队百度MEUX
全球人形机器人约 38% 供应链企业在中国,北上广等地已成立具身智能机器人创新中心
据央视财经报道,9 月 12 日至 16 日,2024 年中国国际服务贸易交易会将在北京举办。报道提到,目前,全球人形机器人约 38% 的供应链企业在中国,北京、上海、广东等地都成立了具身智能机器人创新中心。当前,人形机器人正从“炫技”向“服务”加速转变,逐步进入百姓生活。报道称,在“硬件创新”和“大模型技术”的双重助力下,我国机器人产业蓬勃发展。本届服贸会展现了人形机器人给人类生产生活带来的多种可能性,同时在现实生活中,以人形机器人为代表的智能产品也开始尝试落地应用。据AI在线此前报道,在今年 8 月 21 日开
9/12/2024 10:38:08 PM
清源
AI 模型数据处理方式引疑虑,欧洲隐私监管机构对谷歌展开调查
感谢欧洲隐私监管机构正在调查谷歌在开发其人工智能模型过程中处理个人数据的方式,此举标志着监管机构对大型科技公司的 AI 野心的审查力度不断加大。爱尔兰的数据保护委员会(DPC)负责执行欧盟的《通用数据保护条例》(GDPR),该委员会表示,已经对谷歌的 PaLM 2 语言模型启动了一项法定调查。PaLM 2 于 2023 年 5 月推出,早于谷歌最新的 Gemini 模型。Gemini 于同年 12 月推出,现在是其文本和图像生成产品的核心模型。该调查将评估谷歌是否违反了 GDPR 关于处理欧盟和欧洲经济区公民个人数
9/12/2024 10:12:30 PM
远洋
谷歌联合创始人布林:工程师们用 AI 编程还不够积极
谷歌联合创始人谢尔盖・布林(Sergey Brin)表示,谷歌工程师并没有像他认为的那样经常使用人工智能。图源 Pexels布林本周在洛杉矶举行的“All-In”峰会上与企业家大卫・弗里德伯格(David Friedberg)进行了在线对话时发表了上述言论。布林在峰会现场罕见露面,讨论了 AI 的“令人兴奋”的进步。“作为一名计算机科学家,我从未见过像过去几年所取得的进展一样令人兴奋的事情,”布林说。布林表示,他目前几乎每天都在谷歌。他还称赞了 AI 的多方面能力,特别是在编程方面。布林称:“从头开始编写代码感觉非
9/12/2024 9:58:59 PM
远洋
华为盘古预测大模型首次投入宝钢生产控制
AI在线从宝钢股份获悉,9 月 6 日,宝钢股份与华为公司合作的基于华为盘古预测大模型开发的热轧自然宽展预测模型,正式投入热轧 1880 产线实现在线控制,完成了华为预测大模型在钢铁制造领域首发闭环控制技术验证。图源:宝钢股份据悉,由华为公司、数据 AI 部、设备部、热轧厂、中央研究院、宝信软件等多部门组成的项目专家团队,对大模型投入后的带钢宽度控制进行了跟踪和验证。专家团队一致认为,在 348 块带钢轧制过程中,华为大模型的预测精度、时延响应均满足目标要求,带钢宽度实时控制正常,验证取得圆满成功。这是基于华为平台
9/12/2024 9:33:23 PM
远洋
苹果首次分享 Image Playground 生成的图片,由高管为其爱犬制作
苹果公司首次公开展示了即将推出的 Apple Intelligence 功能之一 ——Image Playground 的实际应用示例,这项功能能够根据文本提示生成卡通风格的插图。这个示例图片是由苹果软件工程高级副总裁 Craig Federighi 制作的,以庆祝他的爱犬 Bailey 的生日。苹果公司与《连线》杂志分享了这张照片,该杂志在图片上加上了水印,以表明这张图片是由 AI 生成的。AI在线注意到,图片中是一只可爱的狗狗,戴着生日帽,在生日蛋糕后面微笑。使用 Image Playground 生成的图片文
9/12/2024 8:55:23 PM
远洋
中昊芯英与深圳联通携手共建广东首个国产 TPU 智算中心
9月9日,在第五届深圳国际人工智能展(GAIE)第二届智能算力发展论坛上,中昊芯英(杭州)科技有限公司(以下简称“中昊芯英”)与中国联合网络通信有限公司深圳市分公司(以下筒称“深圳联通”)联合举办了“智算基建,加速未来”高性能 AI 智算中心项目启动仪式,标志着双方将携手合作共同建设广东地区首个采用国产 TPU 技术的智算中心。 据深圳联通副总经理赵桂标介绍,“项目一期由32个算力节点通过高效互联构建而成,整体算力不低于50P,后期将扩容至千卡规模,形成训推一体化的枢纽,成为中国联通在深圳的核心智算高地的重要组成部分。 ”谈及合作共建智算中心的具体布局,他进一步表示,“中国联通以国家智算能力布局要求和市场实际需求为牵引,根据‘规划先行、市场驱动、适度超前、小步快跑’原则统筹规划构建中国联通智算体系,构建形成‘1 N X’智算能梯次布局。
9/12/2024 8:11:00 PM
朱可轩
刚刚,GPT-4o关键人物离职创业!曾在OpenAI最早提出构建「Her」
OpenAI 最早提出构建「Her」的那个人,刚刚宣布离职创业了。今年 5 月份,OpenAI 发布了震惊世界的 GPT-4o。这个模型可以跨越文本、视觉和音频,以一种非常自然的形式和人类语音对话,延迟低到与人类在对话中的响应时间相似。而且,它允许用户随时打断,并能感知和回应用户的情绪。因此,该模型发布后,很多人说科幻电影《Her》中的场景照进了现实。此次离职的 Alexis Conneau 就是 GPT-4o 项目的关键人物之一。离职前,他是 OpenAI 音频 AGI 研究负责人,也是 OpenAI 最早提出
9/12/2024 6:55:00 PM
机器之心
中国信通院何宝宏:到 2026 年,生成式 AI 计算市场规模将突破百亿美元
据贝壳财经报道,中国国际服务贸易交易会今天在北京举行。中国信息通信研究院云计算与大数据研究所所长何宝宏出席 2024 通用人工智能算力论坛并以“智算产业新发展”进行演讲。何宝宏认为,2018 年至 2023 年,全球算力市场平稳增长,但智算赛道爆发。据清华大学全球产业研究院测算,生成式 AI 计算和其他 AI 计算市场将达成如下规模:将在 2024 年分别达到约 54.66 亿美元(AI在线备注:当前约 389.44 亿元人民币)和约 231.52 美元(当前约 1650 元人民币),将在 2025 年分别达到约
9/12/2024 6:01:53 PM
清源
厉害了!Adobe新出Firefly视频模型,2分钟速成高清大片
在 Sora 加入 Adobe 全家桶数月后,Adobe 终于推出了自己的视频生成模型。随着大家对新鲜、短视频内容的需求不断增长,编辑、电影制作人和内容创作者被要求在更短的时间内创作出更好的作品。如今,编辑不仅要剪辑图片,还要进行色彩校正、动画渲染、音频混合等,这些内容大大增加了工作时间。刚刚,Adobe 宣布推出 Firefly 视频模型。Adobe 旨在利用 AI 强大的功能帮助视频内容创作者扩展他们的创意,在客户要求的时间内提供高质量的成果。在官方博客中,Adobe 进行了一系列 Demo 展示,从提示到成片
9/12/2024 3:44:00 PM
机器之心
AI 能「看懂」你的唇语,悄悄话不再安全
小心悄悄话被 AI 听见!(嘘)最近国外一款可以读唇语的 AI 软件火了!具体效果如下:红毯上布莱克・莱弗利小声说:“好紧张”,笑着说话时肉眼很难分辨唇语,但 AI 可以。乍一看只能看见一排白牙(bushi)的侃爷,唇语也能被轻松破解。看完后网友们开始纷纷评论,大开脑洞:求“联名”型网友:快把它和 Siri 结合一下吧!这样我就不用像小傻子一样对着电脑大喊了!测评型网友:我想用它试试“座机画质”的视频!担心安全型网友:我有点害怕,我想戴口罩了。(呜呜)实测 Readtheirlips 效果如何量子位整理了一些视频,
9/12/2024 3:10:59 PM
清源
谢尔盖布林:谷歌不敢用Transformer,作者全跑路了,现在我每天都在写代码
坐拥世界最大的搜索业务,谷歌一直独步于硅谷。搜索所带来的丰厚广告收入,让两位创始人谢尔盖・布林 (Sergey Brin) 和拉里・(Larry Page)可以退居二线,安心享受生活。 1997 年 9 月 15 日,谢尔盖・布林和拉里·佩吉注册了一个名为「谷歌」的网站。直到 2022 年底,ChatGPT 火遍全球,原本 AI 浪潮的引领者谷歌似乎才意识到地位发生了翻转。最近一年以来,我们似乎习惯了这家科技巨头作为「追赶者」出现。从去年开始,就有媒体爆料,称谢
9/12/2024 2:39:00 PM
机器之心
音频驱动人像视频模型:字节Loopy、CyberHost研究成果揭秘
近期,来自字节跳动的视频生成模型 Loopy,一经发布就在 X 上引起了广泛的讨论。Loopy 可以仅仅通过一张图片和一段音频生成逼真的肖像视频,对声音中呼吸,叹气,挑眉等细节都能生成的非常自然,让网友直呼哈利波特的魔法也不过如此。Loopy 模型采用了 Diffusion 视频生成框架。输入一张图片和一段音频,就可以生成相应的视频。不但可以实现准确的音频和口型同步,还可以生成细微自然的表情动作,例如人物跟随情绪节奏做出抬眉、吸气、憋嘴停顿、叹气、肩膀运动等非语言类动作也能很好地被捕捉到;在唱歌时也能表现得活灵活现
9/12/2024 2:32:00 PM
机器之心
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
Anthropic
英伟达
代码
训练
算法
Stable Diffusion
芯片
LLM
AI新词
蛋白质
开发者
腾讯
生成式
Claude
苹果
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
场景
大型语言模型
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
特斯拉
应用