应用
英伟达 CEO 黄仁勋预测:十年内 AI 将能实时生成游戏中的所有像素
在英伟达 GTC 2024 大会上发布了全新 Blackwell GPU 架构之后,黄仁勋在问答环节中对游戏领域的 AI 未来做出了大胆预测。据 Tom's Hardware 报道,这位 CEO 认为,仅需十年甚至更短的时间,AI 就能够实时生成游戏中的所有像素。“在我看来,科技领域的大部分进步都遵循着 S 曲线,一旦技术变得实用且更优秀,那么从萌芽到成熟往往只需要十年左右的时间。” 黄仁勋表示,“ChatGPT 就是一个很好的例子,它不仅实用,而且在很多方面还表现得更加出色。所以我认为这项技术距离我们不到十年。十
WorldGPT来了:打造类Sora视频AI智能体,「复活」图文
前Meta首席工程负责人胡鲁辉带领Seeking AI携手哈佛、斯坦福、北大等知名学府推出WorldGPT,实现静态内容与动态视频的高度融合
AI在用 | 用ChatGPT、Kimi克隆自己的写作风格
机器之能报道编辑:鹊鸲以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。 我们也欢迎读者投稿亲自实践的创新型用例。今天,我们分享 X 用户 @theresanaiforit 训练 ChatGPT 像自己一样写作的案例。只需几秒钟克隆另一个你,让“他(她)” 依循你的文笔和风格完成写作任务。案例地址:,进入 ChatGPT 页面( )或者透过移
苏姿丰亮相北京高喊 YES,AMD 展示 AI 笔记本实时简笔画生图
感谢在今日下午的 AMD AI PC 创新峰会上,AMD CEO 苏姿丰亮相北京的峰会现场,喊出“AMD AI PC YES!”▲ IT之家现场小编与“苏妈”苏姿丰合影本次峰会主要介绍 AMD 锐龙 8040 系列移动处理器的 AI 功能和 Ryzen AI Software 平台,苏姿丰表示数以百万计的锐龙 AI PC 已经出货。AMD 还晒出了不同的 AI 产品架构,包括 Zen CPU 的路线图和 RDNA GPU 的路线图。随后,AMD 展示了锐龙 7 8845HS 笔记本上的 AI 应用,包括实时画图、写
登Nature子刊,哈佛医学院发布迄今最大计算病理学基础模型,适用30+临床需求
编辑 | X基础模型有望为医学领域带来前所未有的进步。在计算病理学 (CPath) 中,基础模型在提高诊断准确性、预后以及预测治疗反应方面发挥着关键作用。近日,美国麻省总医院(Massachusetts General Hospital)、哈佛医学院等组成研究团队设计了迄今为止最大的两个 CPath 基础模型:UNI 和 CONCH。这些基础模型适用于 30 多种临床和诊断需求,包括疾病检测、疾病诊断、器官移植评估和罕见疾病分析。新模型克服了当前模型的局限性,不仅在研究人员测试的临床任务中表现良好,而且在识别新的、
马斯克:Neuralink 公司下个产品将是“盲视”,助视障人群恢复视力
感谢北京时间今日,马斯克在 X(推特)上发文宣布,继“心灵感应”(Telepathy)之后,其脑机接口公司 Neuralink 的下一个产品将是“盲视”(Blindsight)。在博主 DogeDesigner 分享的一段马斯克此前讲话视频片段下方,马斯克宣布了上述消息。在这段视频中,马斯克表示:“即使有人从未有过视力,就像天生失明一样,我们也会相信,我们仍然可以通过 Neuralink 来恢复视力。”据IT之家今日早些时候报道,马斯克旗下脑机接口公司 Neuralink 对其首位脑机芯片植入受试者的近况进行了直播
3D城市自动生成方案升级,腾讯GiiNEX游戏AI引擎正式亮相
3月20日,在2024全球游戏开发者大会(GDC)上,腾讯发布了自研游戏AI引擎——GiiNEX。基于生成式AI和决策AI技术,GiiNEX将为游戏全生命周期提供丰富的AI解决方案。借助大模型等生成式AI技术,GiiNEX面向AI NPC、场景制作、内容生成等场景,提供了包括2D图像、动画、3D城市、剧情、对话、关卡以及音乐等多样化的AIGC能力,帮助开发者提升高质量内容生成的效率。同时,GiiNEX也将决策AI技术用于游戏研发测试、模拟玩法等场景,加速游戏创新迭代,以快速适应玩家个性化需求和多变的市场趋势。在会上
瘫痪8年后,马斯克的首个脑机接口人类植入者,正在用念力玩文明6
一名因潜水事故导致肩部以下瘫痪八年的 29 岁男子,正在借助脑机接口设备重温在线国际象棋和杀时间大作游戏《文明 6》。这是脑机接口公司 Neuralink 最新一场直播的内容,迅速吸引了五百万多人围观。在九分钟的简短直播中,Neuralink 首位人体受试者 Noland Arbaugh 先是进行了自我介绍,并表示自己可以使用 Neuralink 设备玩在线国际象棋和视频游戏《文明》。Arbaugh 使用一把特制的椅子坐在笔记本电脑前。当他试图控制一盘棋时,双手仍然放在椅子的扶手上:「这并不完美。我想说我们遇到了一
72岁法国概率论大佬获阿贝尔奖,陶哲轩:他的知名度理应更高
从青少年时期饱受失明的恐惧,到之后求学、享誉学界并获得各类奖项和荣誉,2024 年阿贝尔奖得主 Michel Talagrand 一路走来诸多不易。今天,挪威科学与文学院公布了 2024 年阿贝尔奖获得者 —— 来自法国国家科学研究中心(CNRS)的前研究员、数学家 Michel Talagrand。他的获奖理由为「对概率论和泛函分析做出了突破性贡献,以及在数学物理和统计学领域的杰出应用。」在接到宣布自己获奖的视频来电时,72 岁的 Talagrand 还以为是老同事要与自己开个普通的会。他直呼难以置信,并喜极而泣
薪酬、人数上不封顶,这家互联网大厂正在疯抢超级毕业生
又是一年一度校园春招季。在生成式 AI 一路狂飙的时代浪潮下,人工智能、计算机领域的顶尖毕业生,成为各大厂热烈竞逐的对象。华为 “天才少年计划”、蚂蚁集团 “蚂蚁星”、腾讯 “技术大咖”、阿里巴巴 “阿里星”、百度 “AIDU 计划”、美团 “北斗计划”,均是为了网罗前沿科技顶尖人才而设。这些企业招揽的 “顶尖人才” 可谓百里挑一:他们基本都是海内外名校的应届博士生,获得过顶尖科研成果,在国际顶级会议和期刊发表过论文,在国际大学生程序设计竞赛(ICPC)等重要国际竞赛中拿过奖。为签下这些超级毕业生,各家大厂使尽浑身
CMU朱俊彦、Adobe新作:512x512图像推理,A100只用0.11秒
可玩性极强!简笔素描一键变身多风格画作,还能添加额外的描述,这在 CMU、Adobe 联合推出的一项研究中实现了。作者之一为 CMU 助理教授朱俊彦,其团队在 ICCV 2021 会议上发表过一项类似的研究:仅仅使用一个或数个手绘草图,即可以自定义一个现成的 GAN 模型,进而输出与草图匹配的图像。论文地址: 地址:::One-Step Image Translation with Text-to-Image Models效果如何?我们上手试玩了一番,得出的结论是:可玩性非常强。其中输出的图像风格多样化,包括电影风
CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE
近年来,LLM 已经一统所有文本任务,展现了基础模型的强大潜力。一些视觉基础模型如 CLIP 在多模态理解任务上同样展现出了强大的泛化能力,其统一的视觉语言空间带动了一系列多模态理解、生成、开放词表等任务的发展。然而针对更细粒度的目标级别的感知任务,目前依然缺乏一个强大的基础模型。为了解决这个问题,来自华中科技大学和字节跳动的研究团队提出了一个针对视觉目标的基础模型 GLEE,一次性解决图像和视频中的几乎所有目标感知任务。GLEE 支持根据任意开放词表、目标的外观位置描述、和多种交互方式进行目标检测、分割、跟踪,并
FG2024Workshop |花样滑冰人体动作识别挑战赛与研讨会启动!
作为计算机视觉的国际重要会议之一,CCF C类国际会议FG 2024 (International Conference on Automatic Face and Gesture Recognition)将于2024年5月28-31日举办。花样滑冰人体动作识别挑战赛将作为花样滑冰人体动作识别研讨会的一部分与FG2024一起举办。背景计算机视觉中的人体行为理解主要关注于在视频中定位、分类和评估人类行为。然而,目前的任务对于细粒度动作分割和评估等实际应用来说是不足够的。为了解决这个问题,我们构建了一个数据集Skati
GitHub 最新 AI 工具可帮助用户自动修复代码中的错误和漏洞
感谢GitHub 今天为所有 Advanced Security(GHAS)许可用户推出了全新的“代码扫描”功能(预览版),用于搜索 GitHub 代码中潜在的安全漏洞和编码错误。这项新功能可利用 Copilot 与 CodeQL(IT之家注:CodeQL 是 GitHub 开发的代码分析引擎,用于自动执行安全检查)发现你的代码中可能存在漏洞或错误,并且对其进行分类和确定修复的优先级。值得一提的是,“代码扫描”需要消耗 GitHub Actions 的分钟数。据介绍,“代码扫描”还可防止开发者引入新问题,还支持在特
可从单张图像创建多视图 3D 视频,Stability AI 发布 Stable Video 3D 模型
Stability AI 近日发布了 Stable Video 3D 模型,该模型可从单张图像创建多视图 3D 视频。▲ 图源 Stability AI,下同Stable Video 3D 包含两个变体,其中 SV3D_u 能基于单个图像输入生成轨道视频,无需相机调节;而 SV3D_p 扩展了 SVD3_u 的功能,其可容纳轨道视图,允许沿着指定的摄像机路径创建 3D 视频。相较之前的 Stable Zero123 模型或开源替代品 Zero123-XL,Stable Video 3D 在质量上有明显提高,并具有更
高层出走,Inflection 公司求变:授权技术给微软、Azure 上托管 Inflection-2.5
根据彭博社报道,Inflection AI 关键领导层加入微软之后,该公司计划将其技术授权给微软。Inflection AI 公司首席执行官穆斯塔法・苏莱曼(Mustafa Suleyman)和首席科学家卡伦・西蒙扬(Karén Simonyan)在内的几位重要领导层近日离职,加入微软公司。Inflection AI 公司随后发布公告,表示会在 Microsoft Azure 上托管 Inflection-2.5,帮助将其提供给世界各地的创作者,并承诺在可以预见的未来,在其他云平台上托管其模型和服务。Inflect
英特尔:AI PC 提升内存容量需求,32GB 将成为入门级标配
据证券时报报道,英特尔中国区技术部总经理高宇在 2024 中国闪存市场峰会上表示,未来 AI PC 入门级标配一定是 32GB 内存,而当前 16GB 内存一定会被淘汰,明年 64GB PC 将开始出货。同时,AI PC 对 SSD 性能和容量提出非常高的要求。随着人工智能技术的快速发展,AI PC(人工智能个人电脑)成为个人电脑新的发展方向,使用户能够在本地进行复杂的人工智能计算,而无需依赖云端服务。这将对个人电脑的硬件性能提出新的要求,各大 CPU 厂商已经为 AI PC 发布了“CPU GPU NPU”的架构
Meta 发言人确认将率先使用英伟达旗舰 AI 芯片 B200,预估今年晚些时候收到
感谢Meta 发言人于美东时间 19 日告诉路透社,公司预计今年晚些时候收到英伟达最新旗舰 AI 芯片 ——B200,且为英伟达的首批出货。英伟达的首席财务官 Colette Kress 则告诉金融分析师,“我们认为(产品)将在今年晚些时候上市”,但他也表示,新 GPU 的出货量要到 2025 年才会增加。据悉,社媒巨头 Meta 是英伟达最大的客户之一,该公司曾购买了数十万块上一代加速卡(H100)。Meta 的 CEO 扎克伯格曾在今年 1 月宣布,公司计划在今年年底前储备大约 35 万块 H100。他补充说,
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉