AI在线 AI在线

资讯列表

全球首次:AI 机器人画作首登苏富比拍卖,成交价 108 万美元

英国卫报今天(11 月 8 日)发布博文,报道称由类人机器人创作的艺术品,一幅英国数学家艾伦・图灵(Alan Turing)的肖像画,以 108 万美元(IT之家备注:当前约 772.7 万元人民币)的价格成交。
11/8/2024 2:08:20 PM
故渊

失业小哥在父母卧室做AI应用,日入2万刀!晒账单爆火全网,AI初创价值3500万

一位身无分文的失业小哥,和父母住在一起。 在2020年那一年,他看准AI是个风口,决定全力投入。 在父母的卧室里,他创办了一家价值3500万美元的AI初创公司。
11/8/2024 2:00:00 PM
新智元

文本图格式大一统!首个大规模文本边基准TEG-DB发布 | NeurIPS 2024

文本属性图Text-Attributed Graphs(TAGs)是一种在节点上有丰富文本信息的图结构, TAGs 广泛应用于社交网络(social network)、引用网络(citation network)和推荐系统(recommendation system)等实际场景中。 由于其强大且通用的表达能力,该领域近年来得到了快速发展。 然而目前TAGs面临三大挑战:现有的TAGs数据集一般仅在节点上包含文本信息,而边的信息往往被简化为二元或分类属性。
11/8/2024 1:30:00 PM
新智元

LeCun赞转!类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘

视频生成模型虽然可以生成一些看似符合常识的视频,但被证实目前还无法理解物理规律! 自从 Sora 横空出世,业界便掀起了一场「视频生成模型到底懂不懂物理规律」的争论。 图灵奖得主 Yann LeCun 明确表示,基于文本提示生成的逼真视频并不代表模型真正理解了物理世界。
11/8/2024 1:29:00 PM
机器之心

把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
11/8/2024 1:18:00 PM
机器之心

无问芯穹提出混合稀疏注意力方案MoA,加速长文本生成,实现最高8倍吞吐率提升

随着大语言模型在长文本场景下的需求不断涌现,其核心的注意力机制(Attention Mechanism)也获得了非常多的关注。 注意力机制会计算一定跨度内输入文本(令牌,Token)之间的交互,从而实现对上下文的理解。 随着应用的发展,高效处理更长输入的需求也随之增长 [1][2],这带来了计算代价的挑战:注意力高昂的计算成本和不断增长的键值缓存(KV-Cache)代价。
11/8/2024 1:12:00 PM
机器之心

智能体首次达到Kaggle Grandmaster水平,华为用结构化推理补齐思维链短板

前些时日,AI 大模型开始掌握操作计算机的能力,但整体而言,它们与物理世界互动的能力仍处于早期阶段。 为了提高 LLM 在复杂的现实世界中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链、思维树和思维图谱。 这些进步与工具集成一起,推动着通用 AI 智能体的发展,让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问题(不过依然还相对简单)。
11/8/2024 1:06:00 PM
机器之心

聚焦「视听触感官」协同配合的具身精细操纵,人大胡迪团队领衔探索机器人模态时变性挑战

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
11/8/2024 1:03:00 PM
机器之心

云服务用户,实际在用真金白银帮助厂商构建AI成果

这才是堪称终极的商业模式。 云计算最天才的核心构想,就是让一家掌握大量IT预算(每年可能高达数亿美元)且拥有一定专业知识的大企业,先建立起规模远超自身需求的IT部门,为此砸下数十亿美元(到如今的AI时代,投资额甚至可能高达数百亿美元),再将绝大部分容量出租给第三方客户。 如此一来,单凭第三方租金基本就足以抵平云服务商自身的IT运营成本。
11/8/2024 12:46:04 PM

谷歌 DeepMind 研究再登 Nature 封面,隐形水印让 AI 无所遁形

近日,谷歌 DeepMind 发表的一项研究登上了 Nature 期刊的封面,研究人员开发了一种名为 SynthID-Text 的水印方案,已经在自家的 Gemini 上投入使用,跟踪 AI 生成的文本内容,使其无所遁形。
11/8/2024 12:32:02 PM
汪淼

谷歌DeepMind研究再登Nature封面,隐形水印让AI无所遁形

君可知,我们每天在网上的见闻,有多少是出自AI之手? 图片除了「注意看! 这个男人叫小帅」让人头皮发麻,真正的问题是,我们无法辨别哪些内容是AI生成的。
11/8/2024 12:18:39 PM
新智元

杨笛一团队:一个弹窗,就能把AI智能体操控电脑整懵了

弹窗攻击很有效,控制计算机的智能体根本顶不住。 前些天,Anthropic 为 Claude 带来一个极具变革意义的功能:Computer Use,也就是控制用户的计算机。 当时,Anthropic 在博客中写到:「在 OSWorld 这项测试模型使用计算机的能力的评估基准上,Claude 当前的准确度为 14.9%,虽然远远不及人类水平(通常为 70-75%),但却远高于排名第二的 AI 模型(7.8%)。
11/8/2024 11:02:00 AM
机器之心

Seed校招博士自述:我为什么选择来字节做大模型

原文来自知乎博主张逸霄对“大家能分享一下当前博士就业的情况吗”的回答。 人在英国,刚过答辩。 今年拿了腾讯 AI Lab(青云计划)、字节跳动(Seed) ,国外有之前实习的 Sony Research 和 Yamaha 的 return offer,国外也有正在面试的 Adobe 和 Meta。
11/8/2024 10:55:00 AM
机器之心

英伟达稳坐全球第一,成为新霸主!回顾这波AI潮的起源:辛顿、黄仁勋、李飞飞的历史交汇

出品 | 51CTO技术栈(微信号:blog51cto)“过去12年的AI热潮得益于三位在面对广泛批评时依然追求非传统理念的先驱。 一位是多伦多大学的Geoffrey Hinton,他几十年如一日地推广神经网络,尽管几乎所有人都怀疑它。 第二位是Nvidia的CEO黄仁勋,他早早意识到GPU不仅仅能用于图形处理。
11/8/2024 10:47:32 AM

程序员不应被AI取代写代码,而是写文档!谷歌大牛呼吁:老板们应该倾听开发者心声,现在的AI代码生成器操之过急,风险太大!

编译 | 言征出品 | 51CTO技术栈(微信号:blog51cto)对于“AI帮助生产力提高”这件事情上,开发人员与他们的老板,意见其实非常不一致。 最近, Atlassian-DX DevEx 进行了一项现状调查,结果非常有意思——调查结果显示,公司老板们认为 AI 是提高开发人员生产力和满意度的最有效方法,但高达三分之二的开发人员却不这么想,他们认为实际上没有任何显著的 AI 生产力提升。 众所周知,目前最热门的软件开发 AI 用例属于代码生成。
11/8/2024 10:25:58 AM
言征

AMD 发布首个 10 亿开源 AI 模型 OLMo,用 Instinct MI250 GPU 集群训练而成

AMD 公司于 10 月 31 日发布博文,宣布推出首个完全开放的 10 亿参数语言模型系列 AMD OLMo,为开发者和研究人员提供强大的 AI 研究工具。
11/8/2024 10:13:11 AM
故渊

三款出色的无代码LLM应用程序构建神器

译者 | 布加迪审校 | 重楼通过轻松地挑选和丢弃组件并连接组件来构建LLM应用程序,比如矢量存储区、web搜索、存储内容和自定义提示等组件。 许多商业人士和非技术人士向我询问如何在缺乏技术知识的情况下构建AI应用程序。 我总是告诉他们,市面上有许多非代码解决方案,它们易于使用,可以帮助他们为公司中的任何人构建原型并部署解决方案。
11/8/2024 9:53:01 AM
布加迪

免训练加速DiT!Meta提出自适应缓存新方法,视频生成快2.6倍

现在,视频生成模型无需训练即可加速了? ! Meta提出了一种新方法AdaCache,能够加速DiT模型,而且是无需额外训练的那种(即插即用)。
11/8/2024 9:30:00 AM
量子位