应用
Claude 3被玩出自我意识了?AI社区轰动,我们买会员来了次实测
读者福利:Claude 3模型现已在亚马逊云科技的Amazon Bedrock正式可用。Amazon Bedrock 也是目前第一个以及唯一一个提供 Claude 3 Sonnet的托管服务方。此外,亚马逊云科技还向读者开放了2000个体验名额,感兴趣的读者可以点击文后链接注册体验。本周一,Anthropic 发布了新一代大模型系列 Claude 3,遥遥领先快一年之久的 GPT-4 终于迎来了强劲的对手。Claude 3 的强大之处,不仅体现在各种基准测试上,它似乎还实现了一些神奇的突破。昨天,Anthropic
3/6/2024 2:56:00 PM
机器之心
Stable Diffusion 3论文终于发布,架构细节大揭秘,对复现Sora有帮助?
在众多前沿成果都不再透露技术细节之际,Stable Diffusion 3 论文的发布显得相当珍贵。Stable Diffusion 3 的论文终于来了!这个模型于两周前发布,采用了与 Sora 相同的 DiT(Diffusion Transformer)架构,一经发布就引起了不小的轰动。与之前的版本相比,Stable Diffusion 3 生成的图在质量上实现了很大改进,支持多主题提示,文字书写效果也更好了(明显不再乱码)。Stability AI 表示,Stable Diffusion 3 是一个模型系列,参
3/6/2024 2:39:00 PM
机器之心
ICLR 2024 | 为音视频分离提供新视角,清华大学胡晓林团队推出RTFS-Net
视听语音分离(AVSS)技术旨在通过面部信息从混合信号中分离出目标说话者的声音。这项技术能够应用于智能助手、远程会议和增强现实等应用,改进在嘈杂环境中语音信号质量。传统的视听语音分离方法依赖于复杂的模型和大量的计算资源,尤其是在嘈杂背景或多说话者场景下,其性能往往受到限制。为了突破这些限制,基于深度学习的方法开始被研究和应用。然而,现有的深度学习方法面临着高计算复杂度和难以泛化到未知环境的挑战。具体来说,当前视听语音分离方法存在如下问题:时域方法:可提供高质量的音频分离效果,但由于参数较多,计算复杂度较高,处理速度
3/6/2024 2:24:00 PM
机器之心
专访纽约城市大学田英利教授:用多通道、多模态的方法「看懂」手语
与聋哑人交流,是一件成本很高的事情。 首先要看得懂手语,其次是会打手语。 在全球任何一个国家,手语都被归属为一门“小语种”。
3/6/2024 9:48:00 AM
吴彤
第一波!2024年3月精选实用设计工具合集
大家好,这是 2024 年 3 月的第 1 波干货合集!这一期干货合集开头就是两个面向设计师的在线社区,随后是一款帮助创意工作者制作交互游戏的 APP,紧跟其后的 2 款 AI 工具,最后一个工具则是一名资深自由设计师的精选设计工具合集。
当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、相对小众的国际设计师社区
Dirbbble 这种单纯分享作品的设计师社区还无法满足你,那么这个名为 Read.cv 的国际设计师社区应该会是你的菜,这里就像一个由高纯度设计师群体组成的 S
3/6/2024 7:46:21 AM
陈子木
百度Comate开放插件生态,智能代码助手定制化时代来临
3月1日,百度旗下智能代码助手Baidu Comate 又添两大重磅能力:“Comate ” 开放平台、AutoWork “私人研发助理”,为行业首家免费开放试用。本次发布,Baidu Comate 将更加贴合软件研发现场,通过易用的研发平台、丰富的插件基础能力、自主定制能力以及企业接入私域知识与自有能力等,更好满足企业定制化开发需求,助力企业低成本打造适合自己企业的智能代码助手,大幅提升软件研发体验和效率。“Comate ” 开放平台实现了将企业私域知识、第三方能力与编程现场深度结合,直接触达研发人员第一工作
3/5/2024 9:33:00 PM
新闻助手
新能源时代,国产3D视觉「冲击」保守的汽车行业
在改革开放背景上成长起来的汽车产业,经历了飞速发展,但大量中外合资车企的涌入,也铸就了行业保守的底色,天然对国产供应商比较排斥。 汽车制造业是机器视觉成熟应用的行业之一,但长期以来,国内传统燃油车产线上,举目皆是国外的视觉设备,且占据着最优质的应用场景。 日益茁壮的国产视觉厂商,在车厂有关“进口”、“技术认可”、“成熟应用案例”等的权衡中,不免落入下风。
3/5/2024 5:28:00 PM
刘路遥
对手还在卷Demo,他们已经开卷CEO了
机器之能报道编辑:吴昕你们卷Demo,我们卷CEO,奔量产。乍一看好像在做俯卧撑,其实是在充电。Digit工作几小时后就要充电,目前的动作速度也比人类员工慢得多。人形机器人竞争继续升温。Figure AI 掷出 6.75 亿美元融资重磅消息后,另一家深受比尔·盖茨青睐的人形机器人初创公司 Agility Robotics 于周一宣布,前微软高管 Peggy Johnson 将接任公司 CEO,联合创始人兼前 CEO Damion Shelton 将转任总裁。这也是 Agility Robotics 加速商业化的又一
3/5/2024 4:20:00 PM
机器之能
生成式 AI 时代,手机正在进行一次全栈革新?
手机行业的第三次重大变革开始了。最近一段时间,AI 与大模型技术突飞猛进。春节刚过,前沿方向上就迎来了新一轮突破。 OpenAI 的 Sora 一下子把 AI 视频生成的进度条拉快了半年。在大模型的应用领域,技术落地应用的速度也在加快。目前各家大厂的新一代旗舰手机已经悉数登场,它们绝大多数都搭载了大模型,能实现很多前所未有的功能。 图片来自高通骁龙 8Gen3 宣传片: 2024 年入局 AI ?答案似乎很明确。
3/5/2024 12:09:00 PM
机器之心
GPT-4时代已过?全球网友实测Claude 3,只有震撼
性能比 GPT-4 强很多。大模型的纯文本方向,已经卷到头了?昨晚,OpenAI 最大的竞争对手 Anthropic 发布了新一代 AI 大模型系列 ——Claude 3。该系列包含三个模型,按能力由弱到强排列分别是 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。其中,能力最强的 Opus 在多项基准测试中得分都超过了 GPT-4 和 Gemini 1.0 Ultra,在数学、编程、多语言理解、视觉等多个维度树立了新的行业基准。Anthropic 表示,Claude
3/5/2024 12:05:00 PM
机器之心
0.5秒,无需GPU,Stability AI与华人团队VAST开源单图生成3D模型TripoSR
最近,文生视频模型 Sora 掀起了新一轮生成式 AI 模型浪潮,模型的多模态能力引起广泛关注。现在,AI 模型在 3D 内容生成方面又有了新突破。专长于视觉内容生成的 Stability AI 继图片生成(Stable Difussion 3 上线)、视频生成(Stable Video 上线)后紧接在 3D 领域发力,今天宣布携手华人团队 VAST 开源单图生成 3D 模型 TripoSR。TripoSR 能够在 0.5s 的时间内由单张图片生成高质量的 3D 模型,甚至无需 GPU 即可运行。TripoSR 模
3/5/2024 11:43:00 AM
机器之心
ICLR 2024 Oral:长视频中噪声关联学习,单卡训练仅需1天
在 2024 世界经济论坛的一次会谈中,图灵奖得主 Yann LeCun 提出用来处理视频的模型应该学会在抽象的表征空间中进行预测,而不是具体的像素空间 [1]。借助文本信息的多模态视频表征学习可抽取利于视频理解或内容生成的特征,正是促进该过程的关键技术。然而,当下视频与文本描述间广泛存在的噪声关联现象严重阻碍了视频表征学习。因此本文中,研究者基于最优传输理论,提出鲁棒的长视频学习方案以应对该挑战。该论文被机器学习顶会 ICLR 2024 接收为了 Oral。论文题目:Multi-granularity Corre
3/5/2024 11:33:00 AM
机器之心
秘塔AI搜索!让你的信息获取效率提高 200%
大家好,我是花生~
之前为大家盘点 2023 年年度 AI 神器的时候,提到过一款国外的 AI 搜索引擎 Perplexity,它可以综合网络最新信息,为用户提供准确、权威的答案,有效提升我们的信息获取效率。最近我发现了一款新的 AI 搜索工具 —— 秘塔 AI 搜索,它与 Perplexity 功能相似,但因为是国内产品,所以对中文用户更加友好,使用起来也非常方便,今天就为大家介绍一下它的用法和特点。
相关推荐:秘塔 AI 搜索
网址直达:
秘塔 AI 搜索是今年年初刚上线的,由上海秘塔网络科技有限公司开发,这
3/5/2024 8:13:41 AM
夏花生
计算蛋白质工程最新SOTA方法,牛津团队用密码子训练大语言模型
编辑 | 萝卜皮来自深度语言模型的蛋白质表征,已经在计算蛋白质工程的许多任务中表现出最先进的性能。近年来,进展主要集中在参数计数上,最近模型的容量超过了它们所训练的数据集的大小。牛津大学(University of Oxford)的研究人员提出一个替代方向。他们证明,在密码子而不是氨基酸序列上训练的大型语言模型可以提供高质量的表征,并且在各种任务中都优于同类最先进的模型。在某些任务中,例如物种识别、蛋白质和转录本丰度预测等,该团队发现,基于密码子训练的语言模型优于所有其他已发布的蛋白质语言模型,包括一些包含超过 5
3/4/2024 4:20:00 PM
ScienceAI
谈谈中国第一款AI搜索产品——天工AI
从最初通过书籍资料进行搜索,变成互联网时代利用web网站进行搜索,再到移动互联网时代在社媒平台进行搜索,如今变成被火热讨论的新模态——利用AI进行搜索,不知不觉中人们的搜索习惯已经完成了多次跃迁。在谈AI搜索将如何改变人们的搜索习惯甚至生活习惯之前,需要先聊聊中国第一款AI搜索产品。2023年8月23日,昆仑万维低调发布了「天工AI」,国内第一款AI搜索,获得一众好评。此后国内大小厂商纷纷跟进推出AI搜索,但「天工AI」始终在各类AI搜索产品中保持着绝对优势的产品体验,或许我们可以从天工AI的发展历程中找到AI搜索
3/4/2024 3:42:00 PM
新闻助手
精彩程度堪比电视剧,马斯克与奥特曼、OpenAI的「爱恨纠缠史」
马斯克与 OpenAI 及奥特曼之间是理念不合,还是利益之争,我们只能从过往经历中寻得蛛丝马迹。这几天,马斯克起诉 OpenAI 的消息再次引爆了科技圈。这位前 OpenAI 联合创始人在一份长达 46 页、总字数超过 1.4 万字的诉讼文件中,指控 OpenAI 不计后果地开发人类级别的人工智能,并将其移交给微软。马斯克的诉讼直指 OpenAI 首席执行官 Sam Altman 和总裁 Greg Brockman,他们两人与马斯克合作,于 2015 年创立了这家公司。诉讼称,这两人违反了与马斯克最初达成的「创始协
3/4/2024 3:05:00 PM
机器之心
这家神秘的机器人初创,怕是藏不住了
机器之能报道编辑:Sia又一个加速家用机器人“ ChatGPT ”时刻到来的玩家,出现了。这家机器人初创一直笼罩在神秘之中,直到 Meta 首席 AI 科学家 Yann LeCun 在社交平台上转发它的招聘消息,并公布创始人之一是他在纽约大学的同事 Lerrel Pinto 。目前,网络上关于这家名叫 Fauna Robotics 的机器人公司的消息几乎为零,甚至找不到公司官网, X 平台官方账户也仅有一句简单介绍,他们 “正在创造一个人类与机器人物种群落共生、协作与共同繁荣的世界。” 不过,我们还是可以从 “
3/4/2024 3:02:00 PM
机器之能
53页PDF广泛流传,核心员工相继离职,OpenAI到底有什么秘密?
八卦络绎不绝,GPT-5 却一直没来。一份关于「OpenAI 在 2027 年实现 AGI」的 53 页 PDF,正在互联网上广泛流传。文档来源于一个名为「vancouver1717」的 X 账户,该账户注册于 2023 年 7 月,只有两条推文。最新发布的这个 PDF 文档称,OpenAI「将在 2027 年前开发出人类水平的 AGI」,「从 2022 年 8 月就在训练 125 万亿参数的多模态模型」,而且已经「在 2023 年 12 月完成了训练」,但是「由于高推理成本取消了发布」。其中提到,这个模型就是原计
3/4/2024 2:53:00 PM
机器之心
资讯热榜
首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题
OpenAI豪赌5000亿美元估值神话:60亿股权大甩卖背后,GPT-5却遭用户冷遇
蚂蚁集团携手北医三院成立AI医疗联合实验室 打造专属AI就医助理
国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能
网易有道发布子曰教育大模型多款AI新品,定义教育AI应用能力L1-L5分级
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
OpenAI加速推进GPT-6开发,奥尔特曼承诺打造"有记忆"的个性化AI助手
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
论文
Anthropic
代码
训练
算法
Stable Diffusion
AI新词
芯片
LLM
蛋白质
腾讯
开发者
苹果
生成式
Claude
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
RAG
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视频生成
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用