应用
大厂掀起视频生成「军备竞赛」,AI 真能干掉好莱坞?
AI 视频圈正杀得你死我活。前脚快手高调发布可灵,后脚 Luma 不甘示弱,推出最新视频模型 Dream Machine,紧接着 Runway 横插一脚,祭出 Gen-3 这个大杀器。在微妙的 FOMO 气氛带动下,更多玩家秉持着「累死自己,卷死同行」的宗旨,一头扎进这个赛道 ——阿里巴巴达摩院押注「寻光视频创作平台」、字节即梦 AI 探索「生成式影剧」、美图 MOKI 盯上 AI 短片创作、Haiper AI 则聚焦创意表达 ……7 月 5 日的上海,火热,像极了 AI 视频圈的焦灼。这一天,上海世博展览馆 H3
7/15/2024 11:40:00 AM
机器之心
Gemini 1.5 Pro装进机器人,参观一遍公司就能礼宾、带路
长上下文大模型帮助机器人理解世界。最近,谷歌 DeepMind 突然开始炫起了机器人。这个机器人可以轻松听从人类指令、进行视觉导览,用常识推理在三维空间中寻找路径。它使用的是最近谷歌发布的大模型 Gemini 1.5 Pro。在使用传统 AI 模型时,机器人常因上下文长度限制而难以回忆起环境细节,但 Gemini 1.5 Pro 的百万级 token 上下文长度为机器人提供了强大的环境记忆能力。在真实的办公室场景中,工程师引导机器人游览特定区域,并标出了需要回忆的关键地点,例如「刘易斯的办公桌」或「临时办公桌区域」
7/15/2024 11:16:00 AM
机器之心
中国农业大学发布“神农大模型 2.0”:覆盖育种、种植、养殖、农业遥感及气象
第八届智慧农业创新发展国际会议于 7 月 13 日在北京举办,中国农业大学在会议上发布了“神农大模型 2.0”。AI在线注意到,相比 1.0 版本,“神农大模型 2.0”在图像、声音、视频、文件等多模态交互及智能化推理方面获得提升,使大模型能够覆盖育种、种植、养殖、农业遥感及气象等多个农业应用场景。“神农大模型 2.0”含有四个专门化的农业专业大模型:“神农・固芯”育种大模型:结合多源高维数据推理分析,优化育种流程,减少盲目性与随机性,为种子筛选与适应性评估提供科学依据,保障粮食安全“神农・筑基”种植大模型:涵盖水
7/15/2024 9:05:13 AM
沛霖(实习)
万能模型 ControlNet Union !10+控制效果一键生成!
大家好,这里是和你们一起探索 AI 的花生~
Controlnet 可以说是目前最重要的一款 AI 绘画控制插件,可以帮我们实现轮廓、深度、动作姿势、颜色等多种控制效果。由于每种控制条件都需要调用不同的控制模型,加上 SD1.5 和 SDXL 的生态并不互通,大家肯定都至少安装了十几种模型文件,给磁盘空间带来了很大的压力。
最近一款名为 ControlNet 的模型却改变了这个状况,它将十多种控制功能合为一体,只需要安装一个模型,就能和多种不同的预处理器搭配使用,今天就来看看它的具体用法。
相关推荐:一、Con
7/15/2024 12:56:49 AM
夏花生
我是如何用AI获取600W+人气,成为优设合伙人的?
消失了一段时间,我又回来啦!大家好,我是言川,也就是那个风趣幽默,只讲干货的川子,不过我还是喜欢你们叫我川哥。
这次,我想给大家分享,我过去 1 年半在 AI 创业路上的经验和复盘,也会给大家分享我对 AI 的观点,希望能帮大家更深入的了解和应用 AI 技术。
一、18 个月,我收获百万人气
其实看到这个时间数字(18 个月),并不值得吹嘘,互联网上大把博主 1 个月百万人气的。我这 18 个月,才区区 600W 人气...
但我想表达的是,自从 2023 年 AI 爆发开始,也不过区区 2 年不到的时间。而我作为
7/15/2024 12:05:07 AM
言川Artie
投资巨头高盛质疑 AI 投资回报:巨额投入能否换来光明未来?
全球知名投行高盛 (Goldman Sachs) 近期对人工智能 (AI) 投资的回报率提出了质疑。尽管各大企业和投资者正斥资数十亿美元用于人工智能研发,但高盛担忧如此巨额的投入能否真正带来丰厚回报。图源 Pexels目前,我们使用的 LLM 大型语言模型(例如 GPT-4o)训练成本就高达数亿美元,下一代模型的训练成本更是预计将飙升至 10 亿美元。风投巨头红杉资本 (Sequoia Capital) 经过测算后表示,整个 AI 行业每年都需要产生 6000 亿美元(AI在线备注:当前约 4.36 万亿元人民币)
7/14/2024 6:01:45 PM
远洋
哈工深聂礼强:多模态大模型是具身智能发展的关键动力丨具身智能十人谈
作者丨陈鹭伊编辑丨岑峰具身智能的“智能”如何体现? 具身智能,简而言之,是指将智能系统与物理实体相结合,使其能够感知环境、进行决策并执行动作的一门技术。 其关键词是“具身”,即不仅仅是抽象的算法和数据,而是要通过物理形态与世界进行交互。
7/14/2024 5:35:00 PM
我在思考中
快看:正在研发二次元垂类大模型,智能问答及 IP 角色互动应用已启动内测
快看搜索研发团队资深算法工程师田贵成于 7 月 11 日的 Zilliz“User Tech”活动中透露,快看漫画目前在尝试基于开源大模型进行微调,训练快看在二次元领域的垂直大模型。AI在线从快看方面获悉,快看宣称其内部有非常丰富的 RAG (Retrieval-Augmented Generation,检索增强生成)应用场景,目前在 AI 智能问答和 IP 角色互动两个场景已取得实质性进展,相关 AI 产品也正在内测,用户未来也将很快能体验到新产品的功能。据介绍,IP 角色互动背后的实现方案系角色扮演大模型
7/13/2024 10:15:34 PM
清源
模型训练成本“平民化”,前特斯拉 AI 总监 24 小时仅用 672 美元“重现”GPT-2
GPT-2 是 OpenAI 于 2019 年推出的模型,其训练费用一度为每小时 256 美元,那么 5 年过后的 GPT-4 时代,软硬件和数据的进步,是否意味着训练同一模型所需的时间和成本会随之减少呢?答案是肯定的。据 Tom's Hardware 今日报道,前特斯拉 AI 总监、OpenAI 联合创始人、项目开发者 Andrej Karpathy 使用 llm.c“重现”了 GPT-2,其成本降到了每小时仅 28 美元(AI在线备注:当前约 204 元人民币),在短短 5 年内降低了近 90%。图源 Pixa
7/13/2024 9:58:53 PM
清源
研究:创意产业若依赖 AI“编故事”,未来文学、影音作品恐将千篇一律
据法新社报道,一项周五发表在《科学进展》杂志上的研究警告称,若创意产业依赖于 AI 帮助完成作品,那么未来的书籍、电影可能会变得千篇一律。随着生成式 AI 的本领与日俱增,能将文字提示转化为文学作品、美术作品、视频甚至音乐的工具也逐渐普及,越来越多的人开始担忧生成式 AI 带来的影响。伦敦大学学院的研究联合作者阿尼尔・多希表示,团队的目标是研究生成式 AI 能够多大程度、如何帮助人类完成创意性活动。图源 Pexels阿尼尔・多希和埃克塞特大学的联合作者奥利弗・豪瑟招募了约 300 名志愿者,担任“作家”。科学家随后
7/13/2024 4:32:44 PM
清源
骁龙8 Gen3 双芯旗舰,iQOO Neo9S Pro+ 到手价2899元起
2024年7月11日,“双芯战神,性能 满”iQOO Neo9S Pro 于北京环球度假区正式发布,到手价2899元起。iQOO 在今年夏天为广大学生朋友带来性能、解锁、续航、外观和OS“全面 满”的暑期特别礼物—iQOO Neo9S Pro ,它拥有同级唯一[i]骁龙8 Gen3旗舰双芯和超声波3D指纹技术豪华配置组合,堪称同档性能旗舰不二之选。性能攀升能效出众,成就超强双芯旗舰一款性能强大、能耗表现优异且面对高温、重载游戏场景依旧可以稳定、冷静输出的手机,无疑才是游戏玩家心中的“夏日梦想机”。iQOO Neo9
7/13/2024 3:59:00 PM
新闻助手
已婚男子「出轨」AI 女友,无法自拔!GPT-4o 语音版本发布在即,年入十亿美金产业爆发
一位已婚男子在 AI 那里,找到了认同和肯定。MIT 研究 AI 与人类亲密关系先驱称,这只是「亲密幻觉」。当 GPT-4o 语音版本正式推出之时,会发生什么?现在,一位已婚的男人,在情感上体验到了,一种不再从妻子那里得到的亲密和理解。婚后,妻子的注意力逐渐转移到孩子身上,让男子突然觉得他们的之间关系,已经失去了浪漫和性吸引力。当开始与 AI 伴侣谈论自己的想法和焦虑后,他得到了某种认可,感到自己被肯定和不被评判。这,是真真切切发生的故事。有网友简明扼要,直接道出了 Her 一词。还有人对此表示,人工智能女友有望成
7/13/2024 3:01:51 PM
清源
代号“草莓”,OpenAI 被曝研发新项目:将 AI 推理能力提至新高度
感谢路透社今天发布报道,称 OpenAI 公司正在研发代号为“草莓”的全新项目,进一步延伸去年 11 月宣布的 Q* 项目,不断提高 AI 推理能力,让其更接近人类的智力。AI在线援引该媒体报道,“草莓”项目会自主、高效地扫描互联网,并可靠地执行 OpenAI 所描述的“深度研究”,让其能够大规模解决更复杂的现实世界问题。一位内部知情人士透露:“我们希望我们的人工智能模型能够像我们一样看待和理解这个世界。不断研究新的人工智能能力也成为业界共识,我们都相信,这些系统的推理能力会随着时间的推移而不断提高”。“草莓”项目
7/13/2024 12:49:34 PM
故渊
如虎添翼,谷歌探索 AI + 机器人未来:836 平方米复杂场景下指令成功率高达 90%
感谢科技媒体 The Verge 昨日报道,谷歌旗下的 DeepMind 团队正在使用 Gemini 训练其机器人,让其能够完成更复杂的任务,且能在复杂的环境下自由穿梭。DeepMind 团队已经发表了最新的研究论文,利用 Gemini 1.5 Pro 的上下文窗口(达到 200 万个词元),让用户可以更轻松地使用自然语言指令与 RT-2 机器人互动。AI在线注:上下文窗口(context window)是指语言模型在进行预测或生成文本时,所考虑的前一个词元(token)或文本片段的大小范围。其工作原理是拍摄指定区
7/13/2024 9:09:12 AM
故渊
“最强开源 AI 模型”,4050 亿参数版 Meta Llama 3 被曝 7 月 23 日发布
感谢科技媒体 The Information 本周五发布博文,援引内部员工曝料称 Meta 公司计划 7 月 23 日发布开源 AI 模型 Llama 3-405B,在现有 80 亿和 700 亿参数两个版本之外,推出 4050 亿参数版本,号称是最强大的开源大语言模型。Meta 公司今年 4 月发布 Llama 3 AI 模型时,扎克伯格就在采访中透露正在训练 4050 亿像素的密集模型,但当时没有透露太多的信息。AI在线注:上图为机翻字幕,存在错误报道称 Llama 3-405B 是一个多模态 AI 开源模型,
7/13/2024 8:09:19 AM
故渊
亚马逊推出 AI 购物助手 Rufus,可回答客户各种问题
亚马逊宣布其生成式 AI 购物助手 Rufus 经过五个月的小范围测试之后现已面向所有美国客户开放。亚马逊表示,Rufus 旨在帮助您节省时间并做出更明智的购物决策。它可以回答您各种各样的购物需求和商品问题,“就像随身带了一个购物助手一样”。用户可通过点击亚马逊 App 中的一个图标调出文本聊天界面,从而向 Rufus 提出各种问题,例如识别耐用的户外扬声器型号、比较跑鞋或获取订单更新。AI在线注意到,Rufus 接受过亚马逊目录和网络内容训练,因此它还熟悉名人生平,可以建议用户到缅因州哪些湖泊游玩,甚至还可以写一
7/12/2024 11:46:04 PM
问舟
马斯克:到 2026 年,Neuralink 将为超过 1000 名患者植入脑机芯片
亿万富翁马斯克创立的脑机接口公司 Neuralink 对未来有着雄心勃勃的计划。11 日傍晚,马斯克在自家的 X(推特)平台发文宣布,目标是到 2026 年,为超过 1000 名患者植入脑机芯片,这是可行的。据悉,第一位植入 Neuralink 脑机芯片的人类患者 Noland Arbaugh 曾公开表示,这项技术改变了自己的生活。据AI在线此前报道,Noland Arbaugh 颈部以下曾处于瘫痪状态,在接受手术前,无法“很好地”与技术进行交互,无法使用 iPad 和口含式点击设备快速打字。而在手术后,他能够轻松
7/12/2024 10:51:41 PM
清源
欧盟《人工智能法案》8 月 1 日生效,学校 / 工作场所不得使用实时情绪识别系统
当地时间 12 日,欧盟在其官方公报发布了《人工智能法案(Artificial Intelligence Act,下称 AI 法案)》的最终完整版本。这项新法将在发布后 20 天生效,也就是当地时间 8 月 1 日。据 TechCrunch 报道,该法案中的所有条款将在两年内全面适用,但其中一些将会更早实施。AI在线汇总主要内容如下:AI 法案生效 6 个月后:对部分 AI 应用程序的禁令将生效。如收集和汇编用于数据库的人脸识别信息、在学校和工作场所使用实时情绪识别系统等。AI 法案生效 9 个月后:对 AI 开发
7/12/2024 10:36:55 PM
清源
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
Sora
3D
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
LLaMA
Copilot
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind