AI在线 AI在线

应用

超长小说可以用AI翻译了,新型多智能体协作系统媲美人工翻译

机器翻译 (MT) 的最新进展显着提高了各个领域的翻译质量。然而,由于其复杂的语言、比喻表达和文化差异,文学文本的翻译仍然是一个艰巨的挑战。最近,一篇题为《(Perhaps) Beyond Human Translation: Harnessing Multi-Agent Collaboration for Translating Ultra-Long Literary Texts》的论文,提出了一种用于文学翻译的基于大型语言模型(LLM)的新型多智能体框架,并构建了一家名为 TRANSAGENTS 的虚拟出版公司
6/3/2024 11:52:00 AM
机器之心

CVPR 2024 | 合成视频数据集里只有单人数据?M3Act破解人群行为标注难题

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]论文链接:::M3Act: Learning from Synthetic Human Group Activities引言通过视觉信息识别、理解人群的行为是视频监测、交互机器人、自动驾驶
6/3/2024 11:47:00 AM
机器之心

AI 电影来袭:翠贝卡电影节将展映 5 部使用 OpenAI Sora 制作的短篇

由著名演员罗伯特・德尼罗 (Robert de Niro) 创立的纽约翠贝卡电影节 (Tribeca Festival) 即将迎来历史性时刻,生成式人工智能将首次登上这个已有 20 年历史的电影盛会。6 月 15 日,翠贝卡电影节将携手 OpenAI 公司首映“Sora 短片”,届时将展映五部使用人工智能创作的短片作品,这标志着 OpenAI 的文本转视频工具 Sora 首次在电影节上亮相。根据电影节发布的声明,创作者们承诺遵守去年与导演、演员和编剧工会达成的有关人工智能使用的相关条款。主办方为这些电影人提供了 O
6/3/2024 11:42:26 AM
远洋

英伟达黄仁勋解读“CEO 数学”:花小钱,办大事

英伟达首席执行官黄仁勋日前在 2024 台北电脑展前夕提出了一个有趣的概念 ——“CEO 数学”。“买得越多,省得越多,” 黄仁勋在演讲中表示,“这就是 CEO 数学,它并不完全准确,但却很有效。”乍一听让人困惑?黄仁勋随后解释了这个概念的含义。他建议企业同时投资图形处理器 (GPU) 和中央处理器 (CPU)。这两种处理器可以协同工作,将任务完成时间从“100 个单位缩短到 1 个单位”。因此,从长远来看,增加投资反而能节省成本。这种结合使用 CPU 和 GPU 的做法在个人电脑领域已经很普遍。“我们往一台 10
6/3/2024 11:26:54 AM
远洋

人形机器人“造车”,东风柳汽与优必选签署战略合作协议

5 月 31 日,东风柳汽与优必选科技正式签署人形机器人应用战略合作协议,共同推动人形机器人在汽车制造场景的应用。通过此次合作,优必选工业版人形机器人 Walker S 将进入东风柳汽,开展汽车制造过程中的安全带检测、车门锁检测、车灯盖板检测、车身质检工位、车厢后盖检测、内饰总检、油液加注、前桥分装、集配捡料、贴覆车标、配置刷写、标签打印等一系列工作。此外,人形机器人还将和传统自动化设备协作作业,解决复杂场景的柔性无人化生产。东风柳汽总经理林长波表示:今天,我们终于非常荣幸地把优必选人形机器人 Walker S 请
6/3/2024 11:16:18 AM
浩渺

世界最大开源 AI 社区 Hugging Face 曝安全漏洞:部分用户密钥泄露

感谢世界最大的开源 AI 社区 Hugging Face(IT之家注:通称“抱抱脸”)在 5 月 31 日报告了一起安全漏洞事件,其团队检测到对其 Spaces 平台的未经授权访问,可能导致部分用户密钥泄露。Hugging Face 是世界最大的人工智能和数据科学项目合作平台之一,拥有超过一百万个模型、数据集和人工智能驱动的应用程序。Hugging Face 发言人在声明中说:“在过去几个月里,我们看到网络攻击的数量明显增加,这可能是因为我们的使用量大幅增长,人工智能正成为主流。技术上很难知道有多少 Spaces
6/3/2024 9:36:37 AM
沛霖(实习)

黄仁勋一口气解密三代 GPU,量产英伟达 Blackwell 解决 ChatGPT 全球耗电难题

感谢IT之家网友 佳宜 的线索投递!【新智元导读】刚刚,老黄又高调向全世界秀了一把:已经量产的 Blackwell,8 年内将把 1.8 万亿参数 GPT-4 的训练能耗狂砍到 1/350;英伟达惊人的产品迭代,直接原地冲破摩尔定律;Blackwell 的后三代路线图,也一口气被放出。就在刚刚,老黄手持 Blackwell 向全世界展示的那一刻,全场的观众沸腾了。它,是迄今为止世界最大的芯片!▲ 眼前的这块产品,凝聚着数量惊人的技术如果用老黄的话说,它就是「全世界迄今为止制造出来的最复杂、性能最高的计算机。」▲ 8
6/3/2024 9:26:06 AM
汪淼

ECCV 2024 Workshop自动驾驶难例场景多模态理解与视频生成征稿与挑战赛火热启动!

Workshop主页:。近年来,多模态大模型(如GPT-4V)展示了其在多模态感知与理解方面前所未有的进步。然而,利用MLLMs来应对自动驾驶中复杂场景,特别是罕见但关键的难例场景,仍然是一个未解的挑战难题。本次Workshop旨在促进多模态大模型感知与理解、先进的AIGC技术在自动驾驶系统中的应用、端到端自动驾驶等方面的创新研究。Workshop征稿本次论文征稿关注自动驾驶场景多模态感知与理解、自动驾驶场景图像与视频生成、端到端自动驾驶、下一代工业级自动驾驶解决方案等主题,包括但不限于:Corner case m
6/3/2024 9:19:00 AM
新闻助手

英伟达宣布将 Copilot + 引入 RTX 系列设备,赋能游戏本 AI 助理

感谢COMPUTEX 2024 展会伊始,图形芯片巨头英伟达就发布了未来规划,宣告了其拥抱人工智能的决心。英伟达宣布其 RTX 系列显卡将大力支持微软的全新 Copilot 计划,该计划旨在为 Windows 11 系统带来一系列强大的本地化功能。IT之家注意到,首批适配的设备包括来自华硕的五款笔记本电脑以及来自微星的一款机型,由于 Copilot 目前尚未正式发布,这些笔记本电脑将预装常规版本的 Windows 11,但英伟达承诺,一旦 Copilot 上线,这些设备都将可以免费获得所有更新。此前,Copi
6/3/2024 7:28:24 AM
远洋

美国新闻媒体联盟致信贸易委员会、司法部,要求调查谷歌在新闻领域的垄断行为

美国“新闻 / 媒体联盟”(News / Media Alliance)本周致信美国联邦贸易委员会和美国司法部,敦促两部门调查谷歌垄断数字新闻出版的行为,并要求阻止谷歌通过其“无处不在”的搜索产品中使用生成式 AI 进行进一步扩张。“新闻 / 媒体联盟”关注的焦点是谷歌最新推出的“AI Overviews(AI 概述)”,并声称这一功能擅自利用出版商内容对用户的查询作全面回应,因而引起人们的警惕。该机构表示,谷歌通过利用出版商的专有资料,不仅有可能使内容创作者失去重要的流量,还破坏了数字新闻传播的基本完整性。“新闻
6/2/2024 11:20:09 PM
清源

英伟达数字孪生地球“Earth-2”亮相 2024 台北电脑展,2 公里精确预测天气信息

在目前正在进行的黄仁勋台北电脑展 2024 主题演讲上,黄仁勋介绍了英伟达 Earth-2 数字孪生地球,该“地球”主要用于天气观测,基于英伟达 CorrDiff 生成式 AI 模型技术,号称融合了人工智能、物理模拟和观测数据,够从今天的数据来预测未来世界的影响。英伟达表示,相对于第一代 Earth 数字孪生地球,Earth-2 能够以 12 倍解析度(从 25 公里提高到 2 公里)精确预测天气信息,号称能够代表区域天气预测的巨大飞跃,同时据称能够提高 3000 倍能源效率。英伟达同时表示,Earth-2 未来还
6/2/2024 7:54:31 PM
漾仔

加拿大康考迪亚大学研究人员使用 AI 辨别假币,准确率可达 99%

据 The Canadian Press 报道,加拿大蒙特利尔康考迪亚大学的研究人员及其团队开发出一种创新技术,可借助人工智能技术来精准识别假币。当前,诈骗分子制造假币的技术愈发高超,有时甚至会使经验丰富的专家也无所适从,如今 AI 的加入有望改变游戏规则。图源 Pixabay据悉,该校模式识别和 AI 研究中心博士后 Maryam Sharifi Rad 和她的团队开发了这种技术。这名研究人员表示,“这是一个非常直接影响经济和公共财政的问题。我热衷于突破技术的限制,以提高货币系统的安全性和保护性。”研究小组对大量
6/2/2024 6:36:23 PM
清源

科大讯飞:讯飞星火 V4.0 正在训练中,对标 GPT-4o 的产品也在研发

科大讯飞在“深交所互动易”平台回复网友提问时透露,对标 GPT-4 当前能力的讯飞星火 V4.0 正在训练中,预计在 2024 年 6 月底发布,对标 GPT-4o 的产品正在研发中。科大讯飞方面表示,公司将紧密结合人工智能的演进和突破,把成果持续应用到智慧教育的每个产品中,不断提升产品的用户体验和客户渗透率。而在今年 4 月,科大讯飞董事长刘庆峰曾透露,今年 6 月 27 日,讯飞星火 V4.0 将正式发布。刘庆峰当时表示,星火大模型(IT之家注:讯飞星火大模型 V3.5)的通用长文本能力,包括长文档信息抽取、长
6/2/2024 4:30:06 PM
清源

一句话搞定爆炸音效,ElevenLabs 推出新 AI 工具

ElevenLabs 此前已推出利用人工智能生成人类声音和音乐的工具,现在他们更进一步,推出了可以为播客、电影或游戏创作音效的工具。ElevenLabs 的名为“Sound Effects”的新工具可以根据用户提供的文本描述生成最长 22 秒的音效,并与公司原有的语音和音乐平台结合使用。用户每次使用“Sound Effects”后,可以获得至少四个可下载的音频片段供选择。 ElevenLabs 与素材平台 Shutterstock 合作,利用其庞大的音频素材库训练了生成式模型。据悉,Shutterstock 的内容
6/2/2024 3:20:09 PM
远洋

生成式 AI 技术大爆发,2026 年中国人形机器人产业规模或破 200 亿元

据央视财经今晚报道,人形机器人是“未来感十足”的一个代表产业,数据显示预计到 2026 年,中国人形机器人产业规模将突破 200 亿元。在生成式人工智能技术大爆发的当下,未来人形机器人更是极有可能实现超预期增长。根据中国电子信息产业发展研究院“赛迪顾问研究”的报告显示,2023 年人形机器人产业进入爆发期,未来功能型整机将逐步占据主流、发展潜力巨大。在人类工作生活的环境中,人形机器人可以处理复杂多样的工作任务,辅助或替代人类进行工作。人形机器人有望率先在工业领域实现示范应用,在特种领域将逐步替代人类,并将于成熟度较
6/1/2024 10:34:37 PM
清源

2024未来汽车先行者大会丨顾维灏:AI大模型是自动驾驶实现的唯一路径

6月1日,毫末智行CEO顾维灏受邀出席2024(第二届)未来汽车先行者大会,并在现场发表主题演讲《自动驾驶3.0时代,大模型重塑汽车智能化路线》。顾维灏表示:“AI大模型是自动驾驶真正实现的唯一路径,端到端会是未来很重要的技术方向。端到端不仅仅是模型端的优化,也需要数据的供给与算力的支持。毫末DriveGPT从2022年就开始探索端到端的解决方案,一旦应用会带来非常惊艳的效果。”(毫末智行CEO顾维灏受邀出席2024未来汽车先行者大会)第二届未来汽车先行者大会以“争流”为主题,6月1日-6月2日在深圳国际会展中心(
6/1/2024 9:24:00 PM
新闻助手

“乐坛 ChatGPT”Suno 发布 V3.5 模型,所有人可免费制作 4 分钟歌曲

感谢此前引起IT之家网友热议的“乐坛 ChatGPT”Suno 日前发布了 V3.5 版本,并宣布已经向所有用户开放。此次开放后,所有用户都可以:制作 4 分钟的歌曲创建最长 2 分钟的歌曲扩展体验改进后的歌曲结构和声音流畅度Suno 是一款生成式人工智能音乐创作平台,旨在产生人声与乐器相结合的逼真歌曲。此前,Suno 已在 3 月 21 日向所有用户发布 v3 版本,该版本支持免费账户创建 2 分钟的歌曲。该平台最令人惊奇之处,就是在用户给出指定歌词之后能够生成不同曲风、流派的歌曲,甚至可以指定 AI 歌手的音色
6/1/2024 5:16:01 PM
清源

OpenAI重拾机器人梦想

机器之能报道编辑:文华如今,OpenAI 有钱有名有人才,是时候重拾机器人梦想了。OpenAI 正值多事之秋。先是安全团队愤而离职,再是寡姐指控其盗用声音,紧接着奥特曼遭前董事会成员背刺……历经一系列动荡,OpenAI 似乎挺沉得住气,最近还传出「重启机器人团队」的新消息。-1-OpenAI 重启机器人团队据 《福布斯》援引知情人士的消息,OpenAI 正在招聘研究工程师,以重启四年前解散的机器人团队。报道称,尽管 OpenAI 尚未公开宣布其自主研发的机器人计划的细节,但在最近的招聘信息中解释说,新员工将成为团队
6/1/2024 4:57:00 PM
机器之能