AI在线 AI在线

应用

大厂掀起视频生成「军备竞赛」,AI 真能干掉好莱坞?

AI 视频圈正杀得你死我活。前脚快手高调发布可灵,后脚 Luma 不甘示弱,推出最新视频模型 Dream Machine,紧接着 Runway 横插一脚,祭出 Gen-3 这个大杀器。在微妙的 FOMO 气氛带动下,更多玩家秉持着「累死自己,卷死同行」的宗旨,一头扎进这个赛道 ——阿里巴巴达摩院押注「寻光视频创作平台」、字节即梦 AI 探索「生成式影剧」、美图 MOKI 盯上 AI 短片创作、Haiper AI 则聚焦创意表达 ……7 月 5 日的上海,火热,像极了 AI 视频圈的焦灼。这一天,上海世博展览馆 H3
7/15/2024 11:40:00 AM
机器之心

Gemini 1.5 Pro装进机器人,参观一遍公司就能礼宾、带路

长上下文大模型帮助机器人理解世界。最近,谷歌 DeepMind 突然开始炫起了机器人。这个机器人可以轻松听从人类指令、进行视觉导览,用常识推理在三维空间中寻找路径。它使用的是最近谷歌发布的大模型 Gemini 1.5 Pro。在使用传统 AI 模型时,机器人常因上下文长度限制而难以回忆起环境细节,但 Gemini 1.5 Pro 的百万级 token 上下文长度为机器人提供了强大的环境记忆能力。在真实的办公室场景中,工程师引导机器人游览特定区域,并标出了需要回忆的关键地点,例如「刘易斯的办公桌」或「临时办公桌区域」
7/15/2024 11:16:00 AM
机器之心

中国农业大学发布“神农大模型 2.0”:覆盖育种、种植、养殖、农业遥感及气象

第八届智慧农业创新发展国际会议于 7 月 13 日在北京举办,中国农业大学在会议上发布了“神农大模型 2.0”。AI在线注意到,相比 1.0 版本,“神农大模型 2.0”在图像、声音、视频、文件等多模态交互及智能化推理方面获得提升,使大模型能够覆盖育种、种植、养殖、农业遥感及气象等多个农业应用场景。“神农大模型 2.0”含有四个专门化的农业专业大模型:“神农・固芯”育种大模型:结合多源高维数据推理分析,优化育种流程,减少盲目性与随机性,为种子筛选与适应性评估提供科学依据,保障粮食安全“神农・筑基”种植大模型:涵盖水
7/15/2024 9:05:13 AM
沛霖(实习)

万能模型 ControlNet Union !10+控制效果一键生成!

大家好,这里是和你们一起探索 AI 的花生~ Controlnet 可以说是目前最重要的一款 AI 绘画控制插件,可以帮我们实现轮廓、深度、动作姿势、颜色等多种控制效果。由于每种控制条件都需要调用不同的控制模型,加上 SD1.5 和 SDXL 的生态并不互通,大家肯定都至少安装了十几种模型文件,给磁盘空间带来了很大的压力。 最近一款名为 ControlNet 的模型却改变了这个状况,它将十多种控制功能合为一体,只需要安装一个模型,就能和多种不同的预处理器搭配使用,今天就来看看它的具体用法。 相关推荐:一、Con
7/15/2024 12:56:49 AM
夏花生

我是如何用AI获取600W+人气,成为优设合伙人的?

消失了一段时间,我又回来啦!大家好,我是言川,也就是那个风趣幽默,只讲干货的川子,不过我还是喜欢你们叫我川哥。 这次,我想给大家分享,我过去 1 年半在 AI 创业路上的经验和复盘,也会给大家分享我对 AI 的观点,希望能帮大家更深入的了解和应用 AI 技术。 一、18 个月,我收获百万人气 其实看到这个时间数字(18 个月),并不值得吹嘘,互联网上大把博主 1 个月百万人气的。我这 18 个月,才区区 600W 人气... 但我想表达的是,自从 2023 年 AI 爆发开始,也不过区区 2 年不到的时间。而我作为
7/15/2024 12:05:07 AM
言川Artie

投资巨头高盛质疑 AI 投资回报:巨额投入能否换来光明未来?

全球知名投行高盛 (Goldman Sachs) 近期对人工智能 (AI) 投资的回报率提出了质疑。尽管各大企业和投资者正斥资数十亿美元用于人工智能研发,但高盛担忧如此巨额的投入能否真正带来丰厚回报。图源 Pexels目前,我们使用的 LLM 大型语言模型(例如 GPT-4o)训练成本就高达数亿美元,下一代模型的训练成本更是预计将飙升至 10 亿美元。风投巨头红杉资本 (Sequoia Capital) 经过测算后表示,整个 AI 行业每年都需要产生 6000 亿美元(AI在线备注:当前约 4.36 万亿元人民币)
7/14/2024 6:01:45 PM
远洋

哈工深聂礼强:多模态大模型是具身智能发展的关键动力丨具身智能十人谈

作者丨陈鹭伊编辑丨岑峰具身智能的“智能”如何体现? 具身智能,简而言之,是指将智能系统与物理实体相结合,使其能够感知环境、进行决策并执行动作的一门技术。 其关键词是“具身”,即不仅仅是抽象的算法和数据,而是要通过物理形态与世界进行交互。
7/14/2024 5:35:00 PM
我在思考中

快看:正在研发二次元垂类大模型,智能问答及 IP 角色互动应用已启动内测

快看搜索研发团队资深算法工程师田贵成于 7 月 11 日的 Zilliz“User Tech”活动中透露,快看漫画目前在尝试基于开源大模型进行微调,训练快看在二次元领域的垂直大模型。AI在线从快看方面获悉,快看宣称其内部有非常丰富的 RAG (Retrieval-Augmented Generation,检索增强生成)应用场景,目前在 AI 智能问答和 IP 角色互动两个场景已取得实质性进展,相关 AI 产品也正在内测,用户未来也将很快能体验到新产品的功能。据介绍,IP 角色互动背后的实现方案系角色扮演大模型
7/13/2024 10:15:34 PM
清源

模型训练成本“平民化”,前特斯拉 AI 总监 24 小时仅用 672 美元“重现”GPT-2

GPT-2 是 OpenAI 于 2019 年推出的模型,其训练费用一度为每小时 256 美元,那么 5 年过后的 GPT-4 时代,软硬件和数据的进步,是否意味着训练同一模型所需的时间和成本会随之减少呢?答案是肯定的。据 Tom's Hardware 今日报道,前特斯拉 AI 总监、OpenAI 联合创始人、项目开发者 Andrej Karpathy 使用 llm.c“重现”了 GPT-2,其成本降到了每小时仅 28 美元(AI在线备注:当前约 204 元人民币),在短短 5 年内降低了近 90%。图源 Pixa
7/13/2024 9:58:53 PM
清源

研究:创意产业若依赖 AI“编故事”,未来文学、影音作品恐将千篇一律

据法新社报道,一项周五发表在《科学进展》杂志上的研究警告称,若创意产业依赖于 AI 帮助完成作品,那么未来的书籍、电影可能会变得千篇一律。随着生成式 AI 的本领与日俱增,能将文字提示转化为文学作品、美术作品、视频甚至音乐的工具也逐渐普及,越来越多的人开始担忧生成式 AI 带来的影响。伦敦大学学院的研究联合作者阿尼尔・多希表示,团队的目标是研究生成式 AI 能够多大程度、如何帮助人类完成创意性活动。图源 Pexels阿尼尔・多希和埃克塞特大学的联合作者奥利弗・豪瑟招募了约 300 名志愿者,担任“作家”。科学家随后
7/13/2024 4:32:44 PM
清源

骁龙8 Gen3 双芯旗舰,iQOO Neo9S Pro+ 到手价2899元起

2024年7月11日,“双芯战神,性能 满”iQOO Neo9S Pro 于北京环球度假区正式发布,到手价2899元起。iQOO 在今年夏天为广大学生朋友带来性能、解锁、续航、外观和OS“全面 满”的暑期特别礼物—iQOO Neo9S Pro ,它拥有同级唯一[i]骁龙8 Gen3旗舰双芯和超声波3D指纹技术豪华配置组合,堪称同档性能旗舰不二之选。性能攀升能效出众,成就超强双芯旗舰一款性能强大、能耗表现优异且面对高温、重载游戏场景依旧可以稳定、冷静输出的手机,无疑才是游戏玩家心中的“夏日梦想机”。iQOO Neo9
7/13/2024 3:59:00 PM
新闻助手

已婚男子「出轨」AI 女友,无法自拔!GPT-4o 语音版本发布在即,年入十亿美金产业爆发

一位已婚男子在 AI 那里,找到了认同和肯定。MIT 研究 AI 与人类亲密关系先驱称,这只是「亲密幻觉」。当 GPT-4o 语音版本正式推出之时,会发生什么?现在,一位已婚的男人,在情感上体验到了,一种不再从妻子那里得到的亲密和理解。婚后,妻子的注意力逐渐转移到孩子身上,让男子突然觉得他们的之间关系,已经失去了浪漫和性吸引力。当开始与 AI 伴侣谈论自己的想法和焦虑后,他得到了某种认可,感到自己被肯定和不被评判。这,是真真切切发生的故事。有网友简明扼要,直接道出了 Her 一词。还有人对此表示,人工智能女友有望成
7/13/2024 3:01:51 PM
清源

代号“草莓”,OpenAI 被曝研发新项目:将 AI 推理能力提至新高度

感谢路透社今天发布报道,称 OpenAI 公司正在研发代号为“草莓”的全新项目,进一步延伸去年 11 月宣布的 Q* 项目,不断提高 AI 推理能力,让其更接近人类的智力。AI在线援引该媒体报道,“草莓”项目会自主、高效地扫描互联网,并可靠地执行 OpenAI 所描述的“深度研究”,让其能够大规模解决更复杂的现实世界问题。一位内部知情人士透露:“我们希望我们的人工智能模型能够像我们一样看待和理解这个世界。不断研究新的人工智能能力也成为业界共识,我们都相信,这些系统的推理能力会随着时间的推移而不断提高”。“草莓”项目
7/13/2024 12:49:34 PM
故渊

如虎添翼,谷歌探索 AI + 机器人未来:836 平方米复杂场景下指令成功率高达 90%

感谢科技媒体 The Verge 昨日报道,谷歌旗下的 DeepMind 团队正在使用 Gemini 训练其机器人,让其能够完成更复杂的任务,且能在复杂的环境下自由穿梭。DeepMind 团队已经发表了最新的研究论文,利用 Gemini 1.5 Pro 的上下文窗口(达到 200 万个词元),让用户可以更轻松地使用自然语言指令与 RT-2 机器人互动。AI在线注:上下文窗口(context window)是指语言模型在进行预测或生成文本时,所考虑的前一个词元(token)或文本片段的大小范围。其工作原理是拍摄指定区
7/13/2024 9:09:12 AM
故渊

“最强开源 AI 模型”,4050 亿参数版 Meta Llama 3 被曝 7 月 23 日发布

感谢科技媒体 The Information 本周五发布博文,援引内部员工曝料称 Meta 公司计划 7 月 23 日发布开源 AI 模型 Llama 3-405B,在现有 80 亿和 700 亿参数两个版本之外,推出 4050 亿参数版本,号称是最强大的开源大语言模型。Meta 公司今年 4 月发布 Llama 3 AI 模型时,扎克伯格就在采访中透露正在训练 4050 亿像素的密集模型,但当时没有透露太多的信息。AI在线注:上图为机翻字幕,存在错误报道称 Llama 3-405B 是一个多模态 AI 开源模型,
7/13/2024 8:09:19 AM
故渊

亚马逊推出 AI 购物助手 Rufus,可回答客户各种问题

亚马逊宣布其生成式 AI 购物助手 Rufus 经过五个月的小范围测试之后现已面向所有美国客户开放。亚马逊表示,Rufus 旨在帮助您节省时间并做出更明智的购物决策。它可以回答您各种各样的购物需求和商品问题,“就像随身带了一个购物助手一样”。用户可通过点击亚马逊 App 中的一个图标调出文本聊天界面,从而向 Rufus 提出各种问题,例如识别耐用的户外扬声器型号、比较跑鞋或获取订单更新。AI在线注意到,Rufus 接受过亚马逊目录和网络内容训练,因此它还熟悉名人生平,可以建议用户到缅因州哪些湖泊游玩,甚至还可以写一
7/12/2024 11:46:04 PM
问舟

马斯克:到 2026 年,Neuralink 将为超过 1000 名患者植入脑机芯片

亿万富翁马斯克创立的脑机接口公司 Neuralink 对未来有着雄心勃勃的计划。11 日傍晚,马斯克在自家的 X(推特)平台发文宣布,目标是到 2026 年,为超过 1000 名患者植入脑机芯片,这是可行的。据悉,第一位植入 Neuralink 脑机芯片的人类患者 Noland Arbaugh 曾公开表示,这项技术改变了自己的生活。据AI在线此前报道,Noland Arbaugh 颈部以下曾处于瘫痪状态,在接受手术前,无法“很好地”与技术进行交互,无法使用 iPad 和口含式点击设备快速打字。而在手术后,他能够轻松
7/12/2024 10:51:41 PM
清源

欧盟《人工智能法案》8 月 1 日生效,学校 / 工作场所不得使用实时情绪识别系统

当地时间 12 日,欧盟在其官方公报发布了《人工智能法案(Artificial Intelligence Act,下称 AI 法案)》的最终完整版本。这项新法将在发布后 20 天生效,也就是当地时间 8 月 1 日。据 TechCrunch 报道,该法案中的所有条款将在两年内全面适用,但其中一些将会更早实施。AI在线汇总主要内容如下:AI 法案生效 6 个月后:对部分 AI 应用程序的禁令将生效。如收集和汇编用于数据库的人脸识别信息、在学校和工作场所使用实时情绪识别系统等。AI 法案生效 9 个月后:对 AI 开发
7/12/2024 10:36:55 PM
清源