应用
AI 模型数据处理方式引疑虑,欧洲隐私监管机构对谷歌展开调查
感谢欧洲隐私监管机构正在调查谷歌在开发其人工智能模型过程中处理个人数据的方式,此举标志着监管机构对大型科技公司的 AI 野心的审查力度不断加大。爱尔兰的数据保护委员会(DPC)负责执行欧盟的《通用数据保护条例》(GDPR),该委员会表示,已经对谷歌的 PaLM 2 语言模型启动了一项法定调查。PaLM 2 于 2023 年 5 月推出,早于谷歌最新的 Gemini 模型。Gemini 于同年 12 月推出,现在是其文本和图像生成产品的核心模型。该调查将评估谷歌是否违反了 GDPR 关于处理欧盟和欧洲经济区公民个人数
9/12/2024 10:12:30 PM
远洋
谷歌联合创始人布林:工程师们用 AI 编程还不够积极
谷歌联合创始人谢尔盖・布林(Sergey Brin)表示,谷歌工程师并没有像他认为的那样经常使用人工智能。图源 Pexels布林本周在洛杉矶举行的“All-In”峰会上与企业家大卫・弗里德伯格(David Friedberg)进行了在线对话时发表了上述言论。布林在峰会现场罕见露面,讨论了 AI 的“令人兴奋”的进步。“作为一名计算机科学家,我从未见过像过去几年所取得的进展一样令人兴奋的事情,”布林说。布林表示,他目前几乎每天都在谷歌。他还称赞了 AI 的多方面能力,特别是在编程方面。布林称:“从头开始编写代码感觉非
9/12/2024 9:58:59 PM
远洋
华为盘古预测大模型首次投入宝钢生产控制
AI在线从宝钢股份获悉,9 月 6 日,宝钢股份与华为公司合作的基于华为盘古预测大模型开发的热轧自然宽展预测模型,正式投入热轧 1880 产线实现在线控制,完成了华为预测大模型在钢铁制造领域首发闭环控制技术验证。图源:宝钢股份据悉,由华为公司、数据 AI 部、设备部、热轧厂、中央研究院、宝信软件等多部门组成的项目专家团队,对大模型投入后的带钢宽度控制进行了跟踪和验证。专家团队一致认为,在 348 块带钢轧制过程中,华为大模型的预测精度、时延响应均满足目标要求,带钢宽度实时控制正常,验证取得圆满成功。这是基于华为平台
9/12/2024 9:33:23 PM
远洋
苹果首次分享 Image Playground 生成的图片,由高管为其爱犬制作
苹果公司首次公开展示了即将推出的 Apple Intelligence 功能之一 ——Image Playground 的实际应用示例,这项功能能够根据文本提示生成卡通风格的插图。这个示例图片是由苹果软件工程高级副总裁 Craig Federighi 制作的,以庆祝他的爱犬 Bailey 的生日。苹果公司与《连线》杂志分享了这张照片,该杂志在图片上加上了水印,以表明这张图片是由 AI 生成的。AI在线注意到,图片中是一只可爱的狗狗,戴着生日帽,在生日蛋糕后面微笑。使用 Image Playground 生成的图片文
9/12/2024 8:55:23 PM
远洋
中昊芯英与深圳联通携手共建广东首个国产 TPU 智算中心
9月9日,在第五届深圳国际人工智能展(GAIE)第二届智能算力发展论坛上,中昊芯英(杭州)科技有限公司(以下简称“中昊芯英”)与中国联合网络通信有限公司深圳市分公司(以下筒称“深圳联通”)联合举办了“智算基建,加速未来”高性能 AI 智算中心项目启动仪式,标志着双方将携手合作共同建设广东地区首个采用国产 TPU 技术的智算中心。 据深圳联通副总经理赵桂标介绍,“项目一期由32个算力节点通过高效互联构建而成,整体算力不低于50P,后期将扩容至千卡规模,形成训推一体化的枢纽,成为中国联通在深圳的核心智算高地的重要组成部分。 ”谈及合作共建智算中心的具体布局,他进一步表示,“中国联通以国家智算能力布局要求和市场实际需求为牵引,根据‘规划先行、市场驱动、适度超前、小步快跑’原则统筹规划构建中国联通智算体系,构建形成‘1 N X’智算能梯次布局。
9/12/2024 8:11:00 PM
朱可轩
刚刚,GPT-4o关键人物离职创业!曾在OpenAI最早提出构建「Her」
OpenAI 最早提出构建「Her」的那个人,刚刚宣布离职创业了。今年 5 月份,OpenAI 发布了震惊世界的 GPT-4o。这个模型可以跨越文本、视觉和音频,以一种非常自然的形式和人类语音对话,延迟低到与人类在对话中的响应时间相似。而且,它允许用户随时打断,并能感知和回应用户的情绪。因此,该模型发布后,很多人说科幻电影《Her》中的场景照进了现实。此次离职的 Alexis Conneau 就是 GPT-4o 项目的关键人物之一。离职前,他是 OpenAI 音频 AGI 研究负责人,也是 OpenAI 最早提出
9/12/2024 6:55:00 PM
机器之心
中国信通院何宝宏:到 2026 年,生成式 AI 计算市场规模将突破百亿美元
据贝壳财经报道,中国国际服务贸易交易会今天在北京举行。中国信息通信研究院云计算与大数据研究所所长何宝宏出席 2024 通用人工智能算力论坛并以“智算产业新发展”进行演讲。何宝宏认为,2018 年至 2023 年,全球算力市场平稳增长,但智算赛道爆发。据清华大学全球产业研究院测算,生成式 AI 计算和其他 AI 计算市场将达成如下规模:将在 2024 年分别达到约 54.66 亿美元(AI在线备注:当前约 389.44 亿元人民币)和约 231.52 美元(当前约 1650 元人民币),将在 2025 年分别达到约
9/12/2024 6:01:53 PM
清源
厉害了!Adobe新出Firefly视频模型,2分钟速成高清大片
在 Sora 加入 Adobe 全家桶数月后,Adobe 终于推出了自己的视频生成模型。随着大家对新鲜、短视频内容的需求不断增长,编辑、电影制作人和内容创作者被要求在更短的时间内创作出更好的作品。如今,编辑不仅要剪辑图片,还要进行色彩校正、动画渲染、音频混合等,这些内容大大增加了工作时间。刚刚,Adobe 宣布推出 Firefly 视频模型。Adobe 旨在利用 AI 强大的功能帮助视频内容创作者扩展他们的创意,在客户要求的时间内提供高质量的成果。在官方博客中,Adobe 进行了一系列 Demo 展示,从提示到成片
9/12/2024 3:44:00 PM
机器之心
AI 能「看懂」你的唇语,悄悄话不再安全
小心悄悄话被 AI 听见!(嘘)最近国外一款可以读唇语的 AI 软件火了!具体效果如下:红毯上布莱克・莱弗利小声说:“好紧张”,笑着说话时肉眼很难分辨唇语,但 AI 可以。乍一看只能看见一排白牙(bushi)的侃爷,唇语也能被轻松破解。看完后网友们开始纷纷评论,大开脑洞:求“联名”型网友:快把它和 Siri 结合一下吧!这样我就不用像小傻子一样对着电脑大喊了!测评型网友:我想用它试试“座机画质”的视频!担心安全型网友:我有点害怕,我想戴口罩了。(呜呜)实测 Readtheirlips 效果如何量子位整理了一些视频,
9/12/2024 3:10:59 PM
清源
谢尔盖布林:谷歌不敢用Transformer,作者全跑路了,现在我每天都在写代码
坐拥世界最大的搜索业务,谷歌一直独步于硅谷。搜索所带来的丰厚广告收入,让两位创始人谢尔盖・布林 (Sergey Brin) 和拉里・(Larry Page)可以退居二线,安心享受生活。 1997 年 9 月 15 日,谢尔盖・布林和拉里·佩吉注册了一个名为「谷歌」的网站。直到 2022 年底,ChatGPT 火遍全球,原本 AI 浪潮的引领者谷歌似乎才意识到地位发生了翻转。最近一年以来,我们似乎习惯了这家科技巨头作为「追赶者」出现。从去年开始,就有媒体爆料,称谢
9/12/2024 2:39:00 PM
机器之心
音频驱动人像视频模型:字节Loopy、CyberHost研究成果揭秘
近期,来自字节跳动的视频生成模型 Loopy,一经发布就在 X 上引起了广泛的讨论。Loopy 可以仅仅通过一张图片和一段音频生成逼真的肖像视频,对声音中呼吸,叹气,挑眉等细节都能生成的非常自然,让网友直呼哈利波特的魔法也不过如此。Loopy 模型采用了 Diffusion 视频生成框架。输入一张图片和一段音频,就可以生成相应的视频。不但可以实现准确的音频和口型同步,还可以生成细微自然的表情动作,例如人物跟随情绪节奏做出抬眉、吸气、憋嘴停顿、叹气、肩膀运动等非语言类动作也能很好地被捕捉到;在唱歌时也能表现得活灵活现
9/12/2024 2:32:00 PM
机器之心
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
近日,在 2024 Inclusion・外滩大会 “超越平面思维,图计算让 AI 洞悉复杂世界” 见解论坛上,蚂蚁集团知识图谱负责人梁磊分享了 “构建知识增强的专业智能体” 相关工作,并带来了知识图谱与大模型结合最新研发成果 —— 知识增强大模型服务框架 KAG。梁磊介绍,专业领域增强大模型服务框架 KAG 通过图谱逻辑符号引导决策和检索,显著提升了垂直领域决策的精准性和逻辑严谨性;通过信息检索可补全知识图谱的稀疏性和知识覆盖的不足,同时充分利用大语言模型的理解和生成能力降低领域知识图谱的构造门槛。KAG 框架在垂
9/12/2024 2:23:00 PM
机器之心
检索总结能力超博士后,首个大模型科研智能体PaperQA2开源了
这是 AI 智能体在大部分科学研究中超越人类的第一个案例,或许会彻底改变人类与科学文献互动的方式。最近一段时间,有关 AI 科学家的研究越来越多。大语言模型(LLM)有望帮助科学家检索、综合和总结文献,提升人们的工作效率,但在研究工作中使用仍然有很多限制。对于科研来说,事实性至关重要,而大模型会产生幻觉,有时会自信地陈述没有任何现有来源或证据的信息。另外,科学需要极其注重细节,而大模型在面对具有挑战性的推理问题时可能会忽略或误用细节。最后,目前科学文献的检索和推理基准尚不完善。AI 无法参考整篇文献,而是局限于摘要
9/12/2024 2:16:00 PM
机器之心
Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接
训练完就直接上模型。我们都知道,Mistral 团队向来「人狠话不多」。昨天下午,他们又又又丢出了一个不带任何注解的磁力链接。解析一下这个链接,可以看到大小共 23.64 GB,其中包含 4 个文件,其中最大的文件是一个封装的多模态大模型。动作快的非官方 Mistral 社区已经将该模型上传到了 Hugging Face。磁力链接:magnet:?xt=urn:btih:7278e625de2b1da598b23954c13933047126238a&dn=pixtral-12b-240910Hugging Fac
9/12/2024 2:10:00 PM
机器之心
谷歌 NotebookLM 新增 Audio Overview 功能:生成 2 位 AI 主播,围绕用户文档展开播客式交流
科技媒体 maginative 昨日(9 月 11 日)报道,谷歌公司升级旗下笔记应用 NotebookLM,新增 Audio Overview 功能,可以围绕着用户上传的文档,生成两位 AI 主持人,并通过播客方式展开讨论。NotebookLM 简介NotebookLM 基于谷歌 Gemini 1.5 Pro AI 模型,是一款个性化人工智能研究助手。用户可以上传 Google Docs、Google Slides、PDF 文件以及网页 URL 地址,该应用能够研究这些文档内容,为用户提供更有洞察力的回答。Aud
9/12/2024 1:41:55 PM
故渊
Andrej Karpathy:自动驾驶已经实现AGI,汽车其实就是机器人
自己称赞自己千句,不如别人称赞你一句。 例如马斯克在播客、推特上经常自称特斯拉的自动驾驶和机器人“天下第一”,但这样的话看多了,难免也有些审美疲劳。 不过,前几天,Andrej Karpathy在No Priors播客中现身,透露了特斯拉在Optimus人形机器人和自动驾驶领域的一些鲜为人知的进展。
9/12/2024 10:42:00 AM
刘洁
帕萨特发布会语音助手翻车 ,知情人士爆料:PPT多切了一页
9月11号消息,上汽大众正式推出了帕萨特 380TSI 家族,共计五款车型。然而在发布会上发生了一段意外插曲。帕萨特 Pro 在演示其搭载的智能AI语音系统时翻车,出现了问题和回答对不上的情况。据有关知情人士透露,该演示内容为提前录制,但高管在现场打乱了提问顺序,操作人员一时跟不上节奏,ppt多切了一页,事先准备好的语音没有及时同步,从而导致“翻车”。
9/12/2024 10:18:00 AM
新闻助手
夸克发布全新 CueMe 智能对话助手,支持上千种体裁、2 万字长文
今日,夸克发布全新智能对话助手 CueMe,用户现可通过 cueme.cn 或夸克 App 使用。AI在线从官方获悉,CueMe 是基于夸克大模型自主研发,AI 写作能力突出,支持不同体裁、不同篇幅的内容生成,最长可生成 2 万字的内容。夸克表示,CueMe 针对不同细分体裁进行了充分的语料预训练,可支持上千种不同体裁的写作需求,包括研究报告、日常写作、课程论文、新媒体文案等等,并且还在持续扩展中。此外,CueMe 还支持文风定制,用户可选择根据平台风格、语言风格或个人文章风格生成符合其个性化需求的内容。据夸克官方
9/12/2024 10:17:24 AM
问舟
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
蛋白质
xAI
开发者
生成式
人形机器人
神经网络
机器学习
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
字节跳动
工具
华为
AGI
计算
大型语言模型
AI设计
搜索
生成式AI
视频生成
亚马逊
DeepMind
AI模型
特斯拉
场景
深度学习
Transformer
架构
MCP
Copilot
编程
视觉