AI在线 AI在线

应用

微软 Recall 功能灵感来自 29 岁的比尔・盖茨的预言?早年节目录音流出

微软备受争议的 Windows Recall(回顾)功能是否出自 29 岁的比尔・盖茨的构想?近日,一档来自上世纪 80 年代中期广播节目的录音浮出水面,让人们不禁产生遐想。微软联合创始人盖茨当时只有 29 岁,他受邀参加了名为“知名电脑俱乐部”(The Famous Computer Cafe)的电台访谈节目。谈话中,盖茨阐述了他将个人电脑带入千家万户的愿景,以及赋予计算机学习能力的可能性。盖茨表示,随着用户的使用,计算机将能够学习并记住用户之前做过的操作,从而减少重复输入指令的麻烦。盖茨当时的设想与微软当前备受
7/16/2024 4:42:57 PM
远洋

谷歌 AI 概览多次产生错误内容后,现仅在 7% 的搜索中展示

Search Engine Land 报道称,5 月份 AI Overview(AI 概览)刚发布时,约有 80% 的搜索结果会出现 AI 概览,而现在 AI 概览仅在 7% 的搜索中展示。谷歌 5 月份在搜索中增加了 AI 概览功能,用户搜索问题时谷歌 AI 自动抓取网页内容生成总结,用户不需要点击每个搜索结果即可获得答案。据AI在线此前报道,有网友在谷歌搜索寻找“芝士和披萨粘不到一块”的解决办法时,谷歌 AI 提供的建议里却提到“你可以把 1/8 杯的无毒胶水加到酱料里,让其更黏”。随后谷歌发布相关声明,表示会
7/16/2024 4:30:16 PM
沛霖(实习)

抛弃视觉编码器,这个「原生版」多模态大模型也能媲美主流方法

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]一作刁海文,是大连理工大学博士生,导师是卢湖川教授。目前在北京智源人工智能研究院实习,指导老师是王鑫龙博士。他的研究兴趣是视觉与语言,大模型高效迁移,多模态大模型等。共同一作崔玉峰,毕业于
7/16/2024 3:00:00 PM
机器之心

智能化软件开发2.0 | aiXcoder落地Agent技术,聚焦企业项目级代码生成场景

基于大模型的AI Agent,作为能够自主感知环境、形成记忆、规划行动、并调用各类工具执行复杂任务的新一代技术,正在重塑软件开发流程,引领智能化软件开发进入2.0阶段。北大aiXcoder团队早在2023年初就开始基于大模型的Agent在软件工程领域中的研究,先后发表了多篇相关论文【1,2,3,4】,是全球第一批研究通过大模型+工具调用去解决项目级代码生成问题的团队,为Agent技术在软件开发领域应用奠定了坚实的理论基础。基于系列领先的研究成果,结合多年来为各行业落地个性化企业代码大模型的实践经验,aiXcoder
7/16/2024 2:54:00 PM
新闻助手

大模型集体“失智”:9.11 和 9.9 哪个大,几乎全翻车了

没眼看……“9.11 和 9.9 哪个大”这样简单的问题,居然把主流大模型都难倒了??强如 GPT-4o,都坚定地认为 9.11 更大。谷歌 Gemini Advanced 付费版,同样的口径。新王 Claude 3.5 Sonnet,还一本正经的给出离谱的计算方法。9.11 = 9 1/10 1/1009.9 = 9 9/10到这一步还是对的,但下一步突然就不讲道理了如上所示,9.11 比 9.90 大 0.01。你想让我进一步详细解释小数的比较吗?这你还解释啥啊解释,简直要怀疑是全世界 AI 联合起
7/16/2024 12:30:09 PM
汪淼

阿里领投首家人形机器人:逐际动力完成亿元 A 轮融资;谷歌 Eureka AI 模型提前曝光丨AI情报局

今日融资快报通用机器人公司逐际动力完成亿元A轮融资:逐际动力是一家通用机器人公司,专注于具身智能与足式机器人的研发和制造,产品包括人形双足、四轮足机器人及相关软硬件解决方案。 创始人张巍是南方科技大学长聘教授,此前曾任美国俄亥俄州立大学电气与计算机工程系长聘教授。 本轮融资由阿里巴巴、招商局创投、上汽集团旗下尚颀资本领投,原始股东峰瑞资本、绿洲资本和明势资本跟投。
7/16/2024 10:14:00 AM
我在思考中

微软为 Excel 等研发新 AI 模型:性能较常规方案提高 25.6%,词元使用成本降低 96%

根据微软最新公布的研究论文,计划为 Excel、谷歌 Sheets 等电子表格应用程序,开发全新的 AI 大语言模型--SpreadsheetLLM。研究人员表示现有电子表格应用程序具备丰富的功能,在布局和格式方面为用户提供大量的选项,因此传统 AI 大语言模型很难胜任电子表格处理场景。而 SpreadsheetLLM 就是专门为电子表格应用而设计的 AI 模型,微软还研发了 SheetCompressor(压缩电子表格),让 SpreadsheetLLM 能够更好地理解、处理电子表格数据。AI在线援引论文摘要部分
7/16/2024 9:30:28 AM
故渊

效果超棒!9 款免费好用的老照片修复和上色 AI 神器

大家好,这里是和你们一起探索 AI 的花生~ 最近有关 “老照片动起来” AI 视频在互联网上爆火, 制作教程优设网上就有,大家可以点击这里学习。今天则为大家推荐 9 款免费的老照片处理工具,它们都用了 AI 技术,能让我们轻松实现破损照片修复、模糊人脸高清化、黑白照片上色等效果,点开即用非常方便,这样 AI 视频的生成效果也会更好,下面一起来看看吧~ 相关推荐:一、AI 老照片修复 网站直达: 「AI 老照片修复 」是 ModelScope 社区内的一个图片处理小工具,借助 AI 实现画质增强、智能上色等效果,
7/16/2024 8:12:02 AM
夏花生

AI设计必看指南!简析谷歌+微软的AI设计原则

在这个 AI 触手可及的时代,智能技术已经悄无声息地融入了我们的日常生活。但你知道吗?每一个让人惊叹的 AI 产品背后,都有一套精妙的设计原则在支撑。谷歌和微软这样的科技巨头,他们不仅是技术的先锋,更是体验设计的领航者。他们在丰富的产品实践中提炼出这些 AI 设计原则。学习它们,可以让我们用更理性、更科学的方法进行设计,创造出更智能且更有温度的用户体验。 下滑,让我们一起了解这些 AI 设计原则吧~一、谷歌AI设计指南 《The People AI Guidebook》由 Google 的 PAIR 团队发布,
7/16/2024 6:12:02 AM
团队58UXD

LG 新能源将使用 AI 为客户设计电池单元,一天就能搞定

韩国电池供应商 LG 新能源 (LG Energy Solution) 将采用人工智能 (AI) 技术为客户设计电池。得益于此,LG 新能源能够在一天之内设计出根据客户规格定制的电池单元。LG 新能源的 AI 电池设计系统基于该公司过去 30 年的数据,在 100,000 个设计案例中进行了训练。LG 新能源的一位代表表示,公司的人工智能电池设计系统可以确保客户快速且一致地获得高质量的电池设计方案,“这项技术的最大优势在于,无论设计人员的熟练程度如何,都能以一致的水平和速度完成电池设计。”据AI在线了解,电池设计通
7/15/2024 10:43:21 PM
远洋

YouTube 推出新规:用户可要求平台下架模仿自己面部、声音的 AI 合成内容

随着 AI 生成影音内容的普及,YouTube 也随之进行了一些政策调整。据 PhoneArena 当地时间 13 日报道,用户现可要求 YouTube 下架由 AI 生成的模仿自己面部、声音的视频。这一请求将根据 YouTube 的隐私请求流程提出,而不是像 deepfake 那样因为具有误导性而要求将其删除。YouTube 表示,申诉要求下架的主因是影片伤害当事人的“隐私权”,而且只有主要当事人才能要求删除,而不是因为深伪技术及误导性内容。图源 PixabayYouTube 方面称,平台将根据多种因素来决定是否
7/15/2024 8:56:58 PM
清源

PyTorch 团队首发技术路线图,近百页文档披露 2024 下半年发展方向

最近,PyTorch 团队首次公布了开发路线图,由内部技术文档直接修改而来,披露了这个经典开源库下一步的发展方向。如果你在 AI 领域用 Python 开发,想必 PyTorch 一定是你的老朋友之一。2017 年,Meta AI 发布了这个机器学习和深度学习领域的开源库,如今已经走到了第 7 个年头。根据 Assembly AI 2021 年的统计数据,HuggingFace 上最受欢迎的 top 30 模型都能在 PyTorch 上运行,有 92% 的模型是 PyTorch 专有的,这个占比让包括 Tensor
7/15/2024 7:13:07 PM
清源

商汤大模型的「5o」交互,普通人如何和 AI 过一天?

在商汤的演示下,日日新5o拥有像人一样的实时视觉能力,可以跟人进行流畅的视频交互——能听、能说、能看、无延时,它可以通过摄像头 语音实现和用户的实时交互,并获知用户所在的真实场景下的各种状态信息,打破了与AI交互的次元壁,实现了与AI的“视频通话”,已经具备真人聊天般的交互体验。 两个月前OpenAI推出了GPT-4o,以突破性的智能交互能力,彻底颠覆了我们对AI语音助手的认知,颠覆了过去的人机交互,给业界带来又一次震撼。 震撼之外,中国大模型界对GPT-4o的认知似乎并不如GPT-4那么统一,有人认为「在实现AGI的路上,GPT-4o并不重要」、有人评价「在技术突破上,GPT-4o没那么惊艳」;有人认为GPT-4o的发布是 AI 2.0 时代的标志性事件,会催生全新的应用平台和商业模式。
7/15/2024 6:42:00 PM
张进

百度推出仿真人 AI 社交 App“文小言”:可与虚拟角色互动并建立情感连接

据 Tech 星球上周末报道,百度近期上线了一款名为“文小言”的 AI 数字人社交 App,其基于文心大模型技术打造,是一款与 AI 虚拟角色进行实时沟通、互动并建立情感连接的人工智能应用服务。根据该媒体发布的使用体验来看,该 App 在玩法和功能上相比同类型 AI 聊天产品无较大区别,但由于采用仿真的数字人作为“AI 社交对象”,因此交互“更具真实感”。同时,该 App 内置的数字人在肢体语言动作上仍稍显不流畅。此外,该 App 不支持创建专属的数字人。用户可在该 App 的“发现”功能栏内寻找所需的数字人聊天对
7/15/2024 6:19:20 PM
清源

传 4050 亿参数版 Llama3 将在 23 日发布;机械臂公司获 6300 万美元融资丨AI情报局

今日融资快报机械臂公司 Standard Bots 获 6300 万美元融资,亚马逊、三星等参投Standard Bots Inc. 是一家为制造业和物流业开发机械臂的初创公司,该公司已获得 6300 万美元的 B 轮新资金。 本轮融资由 General Catalyst 领投,亚马逊工业创新基金、Samsung Next 和几家老投资者也参与了该公司的投资。
7/15/2024 6:09:00 PM
我在思考中

谷歌 Gemini 被曝今日起推出多项新功能:定制 GPT、记忆或个性化回复等

根据反向工程师 @testingcatalog 的发现,谷歌将在近期为其 Gemini 人工智能助手带来几项更新。从该工程师发布的截图来看,这一轮更新原计划在 7 月 11 日、7 月 18 日分批推送,但他又声称 7 月 11 日的更新已经推迟至 7 月 15 日(AI在线注:日期即今日,但以具体时区为准),预计当天将带来 1 项功能。而在 7 月 18 日,谷歌计划发布 4 项 Gemini 新功能。媒体 Testing Catalog 披露了近期即将发布的新功能,但未说明这些功能的具体上线日期。文生图工具 I
7/15/2024 6:02:35 PM
清源

AI告别鬼画符!快手可图和国外写字小能手Ideogram打擂台,谁更牛?

机器之能报道编辑:杨文快手AI,步履不停。最近,快手出尽风头。OpenAI 当家花旦 Sora 的公测还遥遥无期,快手就率先祭出了可灵。凭借其逼真、高清、不输 Sora 的视觉效果,一下子成了全球网友的新宠。据快手称,可灵申请用户数量已经接近 70 万,目前已开放给超 30 万用户使用。趁着热乎劲,快手又马不停蹄地上线了可灵网页版。老铁们拿它各种整活儿 ——蒙娜丽莎戴墨镜:容嬷嬷喂紫薇吃鸡腿:大胖橘端着高脚杯、翘着兰花指喝红酒:甚至还给肯德基来了一波广告植入:不过呢,今天我们不聊可灵,而是唠唠快手的另一款明星产品
7/15/2024 5:34:00 PM
机器之能

谷歌 Gemini AI 遭质疑:未经用户同意读取 Google Drive 文档

感谢据 X 用户 @Kevin Bankston 的报告,谷歌的人工智能服务 Gemini AI 似乎在未经用户明确许可的情况下读取 Google Drive 中的私人文档。AI在线注意到,Bankston 在其推文中详细描述了这一问题。最初,他发现 Gemini 似乎在阅读他的 Google Drive 文档,但相关设置中找不到禁用该功能的选项。经进一步调查,他发现这是 Google Drive 本身的问题,而非 Google Docs,但两者可能都存在类似的漏洞。而且,根据 Gemini 人工智能的说法,用于控
7/15/2024 5:09:08 PM
远洋