应用
阿里「轨迹可控版Sora」,告别「抽卡」,让视频生成更符合物理规律
你规定路线,Tora 来生成相应轨迹的视频。目前,扩散模型能够生成多样化且高质量的图像或视频。此前,视频扩散模型采用 U-Net 架构 ,主要侧重于合成有限时长(通常约为两秒)的视频,并且分辨率和纵横比受到固定限制。Sora 的出现打破了这一限制,其采用 Diffusion Transformer(DiT)架构,不仅擅长制作 10 到 60 秒的高质量视频,而且还因其生成不同分辨率、各种纵横比、且遵守实际物理定律的能力而脱颖而出。可以说 Sora 是 DiT 架构最有利的证明,然而,基于 Transformer 的
8/4/2024 1:25:00 PM
机器之心
红外夜视、AI 识别,新设备可精准定位蚊子
以色列初创公司 Bzigo 推出了一款名为 Iris 的智能灭蚊设备,这款产品自 2020 年原型问世以来备受关注,如今终于正式上市,售价 339 美元(AI在线备注:当前约 2438 元人民币)。Iris 的工作原理十分智能,它通过广角摄像头和计算机视觉技术不间断扫描房间内的情况,即使在黑暗中,红外 LED 灯也能帮助它准确捕捉蚊子。Iris 的 AI 系统能够精准识别蚊子,不会误判为飞蛾或尘埃。一旦发现蚊子,Iris 会持续追踪其位置,直到蚊子停落。随后,设备会用 1 级人眼安全红色激光笔精确标出蚊子的落脚点,
8/4/2024 12:09:32 PM
远洋
Transformer作者回流谷歌,Character.AI创始团队被「收购」,只要人不要公司
AI 初创者的归宿还是大厂?一觉醒来,生成式 AI 的「吃鸡大赛」再次缩圈了。初创公司 Character.AI 周五宣布已与谷歌签署协议,谷歌将获得 Character.AI 的大型语言模型(LLM)技术的非独家许可。谷歌还宣布重新雇佣 Noam Shazeer 和 Daniel De Freitas。其中,Noam Shazeer 是 Character.AI 的创始人、CEO,也是 Transformer 论文作者之一,他曾在谷歌任首席软件工程师。而 Daniel De Freitas 是 Character
8/4/2024 9:59:00 AM
机器之心
英特尔股价暴跌 26%,40 年来最大跌幅
财报披露一系列消息:业绩不及预期、裁员、暂停派发股息。北京时间今天凌晨,英特尔股价暴跌逾 26%,单日总市值蒸发达 323.7 亿美元(约合 2317 亿元人民币),经历了 40 年来表现最差的交易日之一。本周四,英特尔刚刚公布了低于预期的第二季度财报,报告显示收益低于华尔街预期,公司宣布暂停派息,同时计划实施更广泛的重组计划。在周五的交易日中,英特尔盘中跌幅曾一度接近 30%,据彭博社提供的数据,这是该股自 1982 年以来表现最差的一次。英特尔在财报中表示,在第二季度的营收为 128 亿美元,同比下降 1%,(
8/4/2024 9:49:00 AM
机器之心
从现在起,GitHub上超1亿开发者可直接访问全球顶级大模型,构建AI应用
GitHub 推出的全新功能「GitHub Models」将有望加快 AI 工程师时代的到来。什么?大家熟悉的代码托管平台 GitHub 又进化了!该平台也开始提供 AI 大模型的 Playgroud 了。所有你能叫得上名字的业界流行大模型,包括微软的 Phi-3、OpenAI 的 GPT-4o、Meta 的 Llama 3.1、Cohere 的 Command R 、Mistral AI 的 Mistral Large,都可以在一个交互式沙盒中试用。在未来几个月,Github 也将添加更多语言、视觉以及其他类型的
8/4/2024 9:48:00 AM
机器之心
特斯拉得州超级计算集群命名“Cortex”,拥有 10 万颗英伟达芯片
埃隆・马斯克 (Elon Musk) 周末在参观了最近建成的得克萨斯州超级计算集群后,透露了该工厂的名称。周六,马斯克在 X 上写道,得州超级工厂的超级计算集群被命名为“Cortex”,并指出他刚刚完成了新设施的演练。“Cortex”拥有约 10 万颗英伟达 H100 和 H200 芯片,用于训练全自动驾驶(FSD)和人形机器人擎天柱(Optimus)的神经网络。AI在线注意到,马斯克此前还详细介绍了 Cortex 超级计算集群的巨大冷却需求,并解释说该集群今年将需要约 130 MW 的电力,未来 18 个月内更是
8/4/2024 9:03:48 AM
远洋
日本创企“人机一体”研发人形机器人,可自动保持身体平衡
据共同社报道,日本机器人创新企业“人机一体”和立命馆大学 1 日公开展示其最新开发的人形机器人。该机器人由人类进行远程控制,可在事先未掌握周围环境的情况下自动保持身体平衡并安全运作。据介绍,该公司力争在 5 年内在高处等危险场地投入使用。AI在线汇总该机器人主要信息如下:参数方面,该机器人高约 2 米、宽约 70 厘米、重约 90 公斤。操作方面,该机器人由人类使用操纵杆控制手脚动作,通过机体的摄像头判断外界环境。上半身的动作由人控制,下半身会自动保持平衡,以便在人类不便控制的、脚下较难行走的地方运作。机器人足底装
8/3/2024 3:08:05 PM
清源
AI 大语言模型价格战将启?谷歌本月下调 Gemini 1.5 Flash 费用:降幅最高 78.6%
大语言模型的价格战要来了吗?谷歌公司昨日(8 月 2 日)更新价格页面,宣布将于 2024 年 8 月 12 日开始,Gemini 1.5 Flash 模型每百万输入 tokens 成本为 0.075 美元、每百万输出 tokens 成本为 0.3 美元(AI在线备注:当前约 2.2 元人民币)。这让 Gemini 1.5 Flash 模型的使用成本,比 OpenAI 的 GPT-4o mini 便宜近 50%。根据计算,Gemini 1.5 Flash 模型费用输入费用比此前降低 78.6%,输出费用比此前降低
8/3/2024 2:44:56 PM
故渊
DeepMind 研究成本大起底,一篇 ICML 论文烧掉 1290 万美元
【新智元导读】DeepMind 最近被 ICML 2024 接收的一篇论文,完完全全暴露了他们背靠谷歌的「豪横」。一篇文章预估了这项研究所需的算力和成本,大概是 Llama 3 预训练的 15%,耗费资金可达 12.9M 美元。发一篇顶会论文,需要多少实验预算?最近,DeepMind 发表了一项研究,对 LLM 扩大规模时各种算法和架构细节,比如参数和优化器的选择,进行了广泛的实证调查。这篇论文已被 ICML 2024 接收。论文地址: 页的论文涵盖了数以万计的模型,备选方案包括 3 种优化器、4 种参数化方案、几
8/3/2024 1:18:50 PM
清源
英国 AI 雄心受挫,13 亿英镑计算基础设施项目被搁置
根据 CNBC 报道,英国当局已搁置价值 13 亿英镑(AI在线备注:当前约 119.38 亿元人民币)的计算基础设施项目,意味着让英国成为世界人工智能领导者的雄心遭受重挫。政府发言人证实,为了优先考虑其它财政计划,政府将搁置两项由纳税人出资的重大支出承诺,价值分别为 5 亿英镑和 8 亿英镑。英国去年承诺提供 5 亿英镑,用于人工智能研究资源(AI Research Resource);此外去年还宣布提供 8 亿英镑,为爱丁堡大学创建下一代超大规模计算机提供资金,该计算机每秒能够执行 1 万亿次计算。这些举措将提
8/3/2024 12:03:05 PM
故渊
谷歌勇攀 AI 新高峰,邀测最强 Gemini 1.5 Pro 模型:Arena 竞技场跑分超 GPT-4o
谷歌 AI Studio 产品总监 Logan Kilpatrick 昨日(8 月 2 日)在 X 平台发布推文,推出了实验版 Gemini 1.5 Pro AI 模型(0801),并邀请用户通过 AI Studio 和 Gemini API 测试和反馈。AI在线援引 Kilpatrick 后续推文,他表示在 LMSYS 的聊天机器人竞技场(Chatbot Arena)比赛中,无论是文本还是多模态,实验版 Gemini 1.5 Pro AI 模型(0801)均取得了第一名。实验版 Gemini 1.5 Pro AI
8/3/2024 11:50:14 AM
故渊
英伟达新 AI 芯片被曝因设计缺陷“跳票”至少 3 个月,微软、谷歌或受影响
感谢据《The Information》北京时间今天上午报道,帮助生产英伟达新 AI 芯片和服务器硬件的两位知情人士透露,由于存在“设计缺陷”,英伟达新型 AI 芯片的发布将被推迟三个月甚至更长时间。报道指出,这一缺陷可能会影响 Meta、谷歌、微软等一系列“大客户”,因为他们都已订购了价值数百亿美元的芯片。另外,还有一名微软员工和另一名知情人士透露,英伟达本周向微软和另一家大型云计算提供商发出通报,其新款 Blackwell 芯片中最先进的 AI 芯片将会“跳票”。据悉,微软是英伟达最大的客户之一。而据AI在线此
8/3/2024 11:22:54 AM
清源
全球首例,AI “牙医”上岗:15 分钟搞定牙冠准备,耗时是人类牙医的 1/8
牙科行业迎来历史性时刻,AI 控制的自动机器人完成了全球首例牙科手术,且速度比人类牙医快大约八倍。该 AI 机器人由波士顿公司 Perceptive 制造,使用手持式三维容积扫描仪,通过光学相干断层扫描(OCT)建立详细的口腔三维模型,包括牙齿、牙龈甚至牙齿表面下的神经。OCT 只使用光束来建立体积模型,模型的分辨率很高,能自动检测出空腔,准确率约为 90%,且避免了有害的 X 射线辐射。 该 AI 机器人完成的首例手术是牙冠准备牙齿:会进行局部麻醉,以帮助麻醉您的牙齿和周围的牙龈,以获得最佳的舒适度,然后修剪原来
8/3/2024 10:50:22 AM
故渊
贾扬清一吐为快:要想赚钱,AI模型到底该大该小?
最近的AI社区,关于模型规模的讨论有些活跃。 一方面,此前在大模型开发奉为“圣经”的Scaling Law,似乎正在褪去光环。 去年大家还在猜测GPT-5的规模“可能会大到想不到”,现在这种讨论几乎绝迹。
8/3/2024 10:46:00 AM
刘洁
新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5
8月2日,lmsys官方在推特发布一则消息,恭喜DeepMind研发的Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena排名登顶,超越GPT 4o和Claude-3.5夺得第一。 这是继今年3月Claude 3 “超大杯”Opus版本短暂超越GPT-4以来,OpenAI第二次让出Chatbot Arena的Overall ranking宝座。 Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena测试一周后。
8/3/2024 10:35:00 AM
刘洁
现已下架,谷歌 Gemini 奥运广告遭吐槽:剥夺儿童学习机会,助涨过度依赖 AI 不良风气
谷歌在奥运期间为宣传自家 Gemini AI 服务,推出了名为《Dear Sydney》的宣传视频,不过发布后遭到广泛差评,目前已经下架。视频剧情视频的主角是一位年轻的女运动员,她的偶像是美国田径明星 Sydney McLaughlin-Levrone,旁白部分是她的父亲。她想要给 Sydney 写信,然后她的父亲借助 Gemini 来撰写了一封信件,该父亲在旁白中表示“她想向 Sydney 表达崇敬之情,情绪要饱满,但必须恰到好处”。 于是该父亲向 Gemini 发出提示词:“帮我女儿写一封信,告诉 Sydney
8/3/2024 10:07:56 AM
故渊
消息称谷歌豪掷 25 亿美元收购 AI 独角兽 Character.AI,创始人率团队“卖身大厂”
据彭博社报道,当地时间周五,AI 独角兽公司 Character.AI 创始人诺姆・沙泽尔(Noam Shazeer)和丹尼尔・德・弗雷塔斯(Daniel De Freitas)以及研究团队部分成员加入谷歌公司。报道援引不具名知情人士消息称,现有投资者将以 25 亿美元(AI在线备注:当前约 179.64 亿元人民币)的价格买断公司股票。这比之前对该公司的 10 亿美元(当前约 71.86 亿元人民币)估值高出很多。不过,这仍低于该公司去年与投资者进行早期谈判时讨论的 50 亿美元(当前约 359.29 亿元人民币
8/3/2024 10:01:21 AM
清源
Meta 被曝向好莱坞明星“发钱”:以数百万美元“买下”声音授权用于 AI 项目
根据彭博社今天清晨的报道,几名熟悉谈判情况的消息人士称,Meta 公司正在向好莱坞明星们提供数百万美元,以获得他们的录音和在 AI 项目中使用他们的声音的权利。这些人士表示,该公司正在与朱迪・丹奇(Judi Dench)、奥卡菲娜(Awkwafina)和凯根・迈克尔・基(Keegan-Michael Key)进行谈判。由于项目保密,这些消息人士不愿透露姓名,Meta 公司的代表拒绝发表评论。图源 PexelsMeta 正在抓紧时间完成交易,从而为 AI 工具的开发争取时间 —— 该工具计划在 9 月的 Connec
8/3/2024 7:12:58 AM
清源
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind