AI在线 AI在线

应用

微软亚研院新作:让大模型一口气调用数百万个 API

近年来,人工智能发展迅速,尤其是像 ChatGPT 这样的基础大模型,在对话、上下文理解和代码生成等方面表现出色,能够为多种任务提供解决方案。但在特定领域任务上,由于专业数据的缺乏和可能的计算错误,它们的表现并不理想。同时,虽然已有一些专门针对特定任务的 AI 模型和系统表现良好,但它们往往不易与基础大模型集成。为了解决这些重要问题,TaskMatrix.AI 破茧而出、应运而生,这是由微软(Microsoft)设计发布的新型 AI 生态系统。其核心技术近期在《科学》合作期刊 Intelligent Computi
3/28/2024 12:52:01 PM
汪淼

今年,中国AI大模型产业发展看这些

现在的人工智能,已不是「可以用」,而是「非常好用」了。上个星期,谷歌与李世石一次久违的对话,唤起了人们的回忆:仔细想来,自 2016 年 AlphaGo 在围棋上打败人类起已过去八年。如今人工智能技术的发展却丝毫没有减速,正在给我们创造更大的震撼。生成式 AI 技术从引领技术爆发的 GPT-4 开始,已经席卷了各个领域。不论是自动写文章,还是生成图片和视频,大模型等技术正随着 Copilot、AI 手机等产品逐步落地。在可见的未来,向我们招手的还有具身智能 —— 通过软硬件结合,机器人正在变得更聪明,即将代替我们的
3/28/2024 11:55:00 AM
机器之心

46秒AI生成真人视频爆火,遭在线打假「换口型、声音」

是炒作还是真正的 AI 视频能力进化?AI 生成视频已经发展到这个程度了吗?前段时间,英国王室凯特王妃的 P 图事件,再次将人们的注意力吸引到了图像或视频造假上来。随着 AI 伪造工具的「进化」,以假乱真、无中生有的内容也随之不断出现。今天,一段宣称完全由 AI 生成的不到 50 秒的视频在社交圈疯传,在「视频是否真由 AI 生成」这一点上,网友更是在评论区吵翻了天。我们先来看这段视频。显然,如果没有提前被告知它由 AI 生成,我们大概率就会认为它就是真实视频。上传者表示,音频和视频都是 AI 生成的,它们出自一款
3/28/2024 11:50:00 AM
机器之心

详解Latte:去年底上线的全球首个开源文生视频DiT

随着 Sora 的成功发布,视频 DiT 模型得到了大量的关注和讨论。设计稳定的超大规模神经网络一直是视觉生成领域的研究重点。DiT [1] 的成功为图像生成的规模化提供了可能性。然而,由于视频数据的高度结构化与复杂性,如何将 DiT 扩展到视频生成领域却是一个挑战,来自上海人工智能实验室的研究团队联合其他机构通过大规模的实验回答了这个问题。早在去年 11 月,该团队就已经开源了一款与 Sora 技术相似的自研模型:Latte。作为全球首个开源文生视频 DiT,Latte 受到了广泛关注,并且模型设计被众多开源框架
3/28/2024 11:40:00 AM
机器之心

Copilot 回答直接罗列盗版网站链接,网友调侃:微软引流 Edge 浏览器的“隐藏福利”

网友近日在 Reddit 社区发帖,表示微软旗下的 Copilot 固然不会推广盗版内容,但对于用户的提问可谓是“知无不言”,会直接告诉你盗版软件网站。网友在 Reddit 发帖《微软 Bing 真的是“太好用”了,就是不知道还能持续多久》,根据截图显示,用户只需要在 Bing 中搜索“pirate proxy”,Copilot 能够帮你罗列各种盗版网站链接。IT之家附上截图如下:国外科技媒体 Windows Report 实测,发现使用 Firefox 浏览器访问 Bing,无法生效;但是在 Edge 浏览器中却
3/28/2024 11:08:36 AM
故渊

微软新 AI 专利获批:帮老板追踪、评估你的工作表现

根据美国商标和专利局(USPTO)公示的清单,微软获得了一项关于人工智能的专利,主要基于员工对文档的处理,帮助老板评估员工的工作表现。微软在专利中概述了一套 AI 系统,收集员工在指定时间内对文档的活动数据,洞察员工修改、删除、添加等操作情况,从而判断员工在工作中是否“摸鱼”,或者努力工作。这项技术的主要目标是确定哪个人对文档(尤其是 OneDrive 等应用程序中的共享文档)的贡献最大,但并不局限于此。微软在该专利中表示,现有技术无法准确描述员工和文档之间的关系,因此无法区分哪些员工只是做了少量编辑,哪些员工对文
3/28/2024 10:54:00 AM
故渊

通义千问首次落地天玑9300移动平台!阿里云携手MediaTek探索端侧AI智能体

3月28日,阿里云与知名半导体公司MediaTek联合宣布,通义千问18亿、40亿参数大模型已成功部署进天玑9300移动平台,可离线流畅运行即时且精准的多轮AI对话应用,连续推理功耗增量不到3W,实现手机AI体验的大幅提升。这是通义大模型首次完成芯片级的软硬适配,仅依靠终端算力便能拥有极佳的推理性能及功耗表现,标志着Model-on-Chip的探索正式从验证走向商业化落地新阶段。端侧AI是大模型落地的极具潜力的场景之一。利用终端算力进行AI推理,可大幅降低推理成本、保证数据安全并提升AI响应速度,让大模型可以更好地
3/28/2024 9:34:00 AM
新闻助手

Viggle 超全使用教程!AI 终于能准确控制人物姿势了!

大家好,这里是和你们一起探索 AI 的花生~ 今天为大家推荐一款新的 AI 视频制作工具 Viggle,它可以通过文本或视频生成带有指定动作的角色,从而提升 AI 视频中人物行为的可控性,今天就为大家详细介绍一下它的特点与用法~ Viggle AI 官网: (服务托管在 Discord 中) Viggle 在上线之后很快就引起了关注,因为它解决了 AI 视频生成中一个非常重要的问题——如何准确控制角色的肢体动作。之前我们了解的一些 AI 视频工具,基本都是通过文本或者图像来生成视频,是对画面整体添加动态,很难准确
3/28/2024 8:43:23 AM
夏花生

视觉盛宴!7位顶级艺术家最新 Sora 作品震撼发布!

昨天早上 Open AI 终于放出最新的七部 Sora 视频作品,基于最近有测试名额的世界顶级艺术家创作生成。七部 AI 短片,加上配音和旁白,效果真的很惊艳!相比 2 月 Sora 发布的 48 个视频,果然艺术家创作者会让视频变成故事,更打动人。至此在 2 月 16 日 Sora 发布后,同一天 Open AI 在 Tiktok 上开了账号每天会发布内部制作的 Sora 视频。目前已经发布 65 个视频作品,吸引 270.3K 位粉丝。接下来让我们一起看看这七部作品吧。 一、shy kids – “Air He
3/28/2024 8:40:39 AM
yaoyao

号称全球最强开源 AI 模型,DBRX 登场:1320 亿参数,语言理解、编程能力等均超 GPT-3.5

初创公司 Databricks 近日发布公告,推出了开源 AI 模型 DBRX,声称是迄今为止全球最强大的开源大型语言模型,比 Meta 的 Llama 2 更为强大。DBRX 采用 transformer 架构,包含 1320 亿参数,共 16 个专家网络组成,每次推理使用其中的 4 个专家网络,激活 360 亿参数。Databricks 在公司博客文章中介绍,在语言理解、编程、数学和逻辑方面,对比 Meta 公司的 Llama 2-70B、法国 Mistral AI 公司的 Mixtral 以及马斯克旗下 xA
3/28/2024 7:57:39 AM
故渊

将大模型能力融入 7 大产品,百度智能云交出「企业大模型应用成绩单」

大模型应用爆发元年,企业如何先卷一步?
3/27/2024 9:46:00 PM
机器之心

马斯克:人形机器人成本不到汽车的一半

感谢特斯拉 CEO 埃隆・马斯克周二表示,制造人形机器人 Optimus 的成本仅为特斯拉电动汽车的一半。马斯克在社交平台表示,“人形机器人虽然单位质量的复杂程度更高,但最终的制造成本我认为仍然会低于特斯拉汽车的一半。”马斯克的这番话是对 ARK Invest 的自动驾驶和机器人技术研究主管 Sam Korus 的回应,Korus 认为,与汽车相比,阻碍人形机器人大规模量产的因素主要在于软件能力,而非制造本身。在另一条回复中,马斯克告诉一位用户,Optimus 最初的售价将在 2.5 万美元至 3 万美元(IT之家
3/27/2024 7:35:39 PM
远洋

谁将替代 Transformer?

Transformer 由于其处理局部和长程依赖关系的能力以及可并行化训练的特点,一经问世,逐步取代了过去的 RNN(循环神经网络)与 CNN(卷积神经网络),成为 NLP(自然语言处理)前沿研究的标准范式。 今天主流的 AI 模型和产品——OpenAI 的ChatGPT、谷歌的 Bard、Anthropic 的 Claude,Midjourney、Sora到国内智谱 AI 的 ChatGLM 大模型、百川智能的 Baichuan 大模型、Kimi chat 等等——都是基于Transformer 架构。 Transformer 已然代表了当今人工智能技术无可争议的黄金标准,其主导地位至今无人能撼动。
3/27/2024 7:06:00 PM
张进

马斯克宣布 Grok 聊天机器人将在本周晚些时候向所有 X Premium 订阅用户开放

感谢埃隆・马斯克今日宣布,xAI 公司的 Grok 聊天机器人将在本周晚些时候向所有 X(原推特)Premium 订阅用户开放,而不仅限于 Premium 订阅用户使用。Grok 聊天机器人由 xAI 公司开发,去年 11 月起开始向 X Premium 订阅用户开放。IT之家此前报道,官方在本月早些时候宣布 3140 亿参数的 Grok-1 以 Apache 2.0 协议开源。随着 Grok 向全部 X Premium 用户开放,X Premium 用户将获得新的 Super Grok 模式。马斯克解释道,
3/27/2024 4:26:21 PM
泓澄(实习)

利用固态硬盘降低 AI 微调训练显存需求,群联展示 aiDaptiv+ 平台

据外媒 Tom's Hardware 报道,群联在英伟达 GDC2024 上展示了同 Maingear 合作的 aiDaptiv 硬件平台,可降低中小型企业 AI 模型微调训练成本。群联表示中小型企业在模型微调训练方面面临各种困难:采用云服务不仅昂贵也存在数据隐私的不稳定性;而在本地运行又需要复杂的构建过程,电力需求也不能忽视。而群联 aiDaptiv 方案采用超耐用型 aiDAPTIVCache 固态硬盘,可扩展系统的可用内存容量,容纳更大模型,同时也方便易用。具体来说,aiDaptiv 包含的中间件软件库
3/27/2024 4:03:23 PM
溯波(实习)

AI 美女广告让人难辨真假,博主被迫录视频自证“真的是 AI”

难以置信!现在 AI 生成视频,已经进化到让人不相信这是 AI 生成的了。(这真的不是套娃)最近一段短视频广告在网上引起轰动。视频中的人极力推荐产品,说话语气以及手势十分富有感染力。结果博主一句无意感叹:「家人们,这是 AI 生成的,太疯狂了。」瞬间引起轩然大波,网友:wait. Is this AI????无奈之下,博主被迫录视频自证。逼真到难以置信各位看官来看看,你能相信这是 AI 生成的吗? 不管是口型、动作,同她所说的内容完美契合。有网友 cue 还 cue 到了抖音(doge)。网友的质疑主要集中在两个方
3/27/2024 3:59:33 PM
汪淼

机构预估 OpenAI 部署文生视频模型 Sora 需要 72 万片英伟达 H100:价值 216 亿美元

市场调查机构 Factorial Funds 近日发布报告,认为 OpenAI 部署文本转视频模型 Sora,在峰值期需要 72 万片英伟达 H100 AI 加速卡。如果按照每片英伟达 H100 AI 加速卡 3 万美元成本计算,72 万片需要 216 亿美元(IT之家备注:当前约 1561.68 亿元人民币)。而这仅仅只是 H100 加速卡的成本,想要运行必然消耗大量的电力,每片 H100 功耗为 700W,72 万片就是 504000000W。Factorial Funds 预估训练 Sora 1 个月,需要使
3/27/2024 2:13:58 PM
故渊

手机大模型崛起:荣米 OV 的战场厮杀

作者丨郭思编辑丨陈彩娴数据显示,2023年全球智能手机出货量同比下滑3.2%,总数仅为11.7亿部。 手机市场的饱和,早已是行业共识。 尽管如此,智能手机作为主流的通讯和娱乐工具,业界人士表示,其地位在未来五年内不太可能被迅速替代。
3/27/2024 2:05:00 PM
郭思