应用
沃顿商学院教授发文解析 o1:能力仍有短板,「人机协同智能」或成 AGI 最重要难题
OpenAI 最近奉上了满血版的 o1 Pro,这一全新系列的模型究竟有多强?它能否指明 AI 发展的未来方向?沃顿商学院教授在 3 个月的前一篇博客就中给出了「神预言」一般的答案。
12/18/2024 3:03:03 PM
清源
视频生成平台 Pika 推出 2.0 更新:上传自拍秒变好莱坞大片,和明星同框不是梦
Pika 2.0 上线不久即引发全网狂潮,强大场景元素功能、超强文本对齐、深刻物理学理解,让它在 AI 视频大混战中脱颖而出,效果不输谷歌 Veo 2.0。网友们疯狂实测,人手一部广告大片。
12/18/2024 2:56:39 PM
清源
微信公众号新增“作者朗读音色”功能:可生成作者音色全文音频
官方表示,作者需要下载“公众号助手”App,点击“我-设置-朗读音色”,就可以录制例句,例句也会复刻作者的语气和情感。
12/18/2024 2:28:10 PM
清源
智驾公司下场搞AI视频生成,模型上线即开源
AI好好用报道编辑:杨文人人免费可用。 大洋彼岸,两大巨头 OpenAI 和谷歌轮番炸场。 一个发布了那个传说中的 Sora,一个推出了最强视频生成模型 Veo2。
12/18/2024 2:05:00 PM
AI好好用
李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪
人类的沟通交流充满了多模态的信息。 为了与他人进行有效沟通,我们既使用言语语言,也使用身体语言,比如手势、面部表情、身体姿势和情绪表达。 因此,为了理解和生成人类动作,理解这些多模态的行为至关重要,而且这一研究方向最近受到的关注也越来越多。
12/18/2024 1:40:00 PM
机器之心
英伟达下代RTX 50系列显卡规格被泄露,旗舰5090显存达32GB
自 2022 年 10 月以来,高端显卡性能终于又将迎来大幅度升级。 明年的国际消费类电子产品展览会(CES 2025)将在北京时间 1 月 8 日至 11 日举行,包括英特尔、英伟达和 AMD 在内的各大 CPU、GPU 厂商将带着自家最新产品闪亮登场。 大家最期待的应该当属英伟达的最新 RTX 50 系列显卡了,到时候肯定会成为全场的焦点。
12/18/2024 1:33:00 PM
机器之心
Meta 推出 Apollo 开源模型,让 AI “看懂”视频
Meta携手斯坦福大学,推出全新AI模型系列Apollo,显著提升机器对视频的理解能力。Apollo的研发解决了AI领域长期存在的难题,并为视频理解领域树立了新的标杆。
12/18/2024 1:31:06 PM
故渊
Florence-VL来了!使用生成式视觉编码器,重新定义多模态大语言模型视觉信息
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
12/18/2024 1:31:00 PM
机器之心
用 AI 帮助“打灰”,缪昌文院士目标将混凝土的设计寿命延长到 200 年
建筑材料专家、中国工程院院士、东南大学教授缪昌文透露,目前重大工程使用的混凝土材料的设计寿命为 100—120 年,他们希望通过人工智能技术,将混凝土的设计寿命延长到 200 年。
12/18/2024 12:45:23 PM
汪淼
字节发布豆包视觉理解、3D 生成等新模型,豆包音乐模型可生成 3 分钟作品
豆包3D生成模型也在本次活动中正式亮相。将其与火山引擎数字孪生平台veOmniverse结合使用,可完成智能训练、数据合成和数字资产制作,官方称之为“一套支持 AIGC 创作的物理世界仿真模拟器”。
12/18/2024 11:33:56 AM
清源
消息称“通义”应用团队从阿里云分拆,并入阿里智能信息事业群
有知情人士称,此次调整包括通义 To C 方向的产品经理,以及相关的工程团队,一并调整至阿里智能信息事业群。(智能涌现)
12/18/2024 10:48:13 AM
汪淼
披头士乐队成员保罗・麦卡特尼警告英国议会:AI 可能将年轻音乐人挤出舞台
他警告说,若AI不断产生模仿人类艺术家的音乐,却不给予创作者应有的荣誉或支付版税,那么年轻音乐人将面临更加严峻的挑战,可能很难脱颖而出。
12/18/2024 8:12:02 AM
清源
碾压Sora!谷歌全新发布AI视频模型Veo2+AI绘图Imagen3
更多AI干货:. 体验完Vidu划时代的新功能,我觉得可以正式抛弃3D渲染了这两天,在 X 上看到一个很酷的 2D 动漫 AI 视频。 阅读文章 .
12/18/2024 8:02:54 AM
数字生命卡兹克
OpenAI 称目前尚无推出视频生成模型 Sora API 的计划
OpenAI 今日表示,目前没有推出其视频生成模型 Sora 的应用程序接口(API)的计划,该模型可基于文本、图像生成视频。
12/18/2024 7:37:53 AM
远洋
谷歌:只要有人工监督,客户即可在“高风险”领域使用其 AI 作出决策
根据该公司周二发布的《生成式 AI 禁止使用政策》更新版,客户可以在一定条件下使用谷歌的生成式 AI 作出可能对个人权利产生重大不利影响的“自动化决策”,例如在就业、住房、保险和社会福利等领域。
12/18/2024 7:12:19 AM
清源
OpenAI o1 推理模型 API 上线,仅面向特定开发者开放
“OpenAI 12 天”活动进入第 9 天,OpenAI 今日宣布,其“推理”人工智能模型 o1 正式通过 API 向部分开发者开放,并同步更新了包括 GPT-4o、实时 API 以及微调 API 等多项开发者工具。
12/18/2024 7:00:24 AM
远洋
零基础也能快速做海报!AI设计神器Recraft入门使用指南
Recraft,这款集成了 AI 绘画、矢量图生成和设计工具的应用平台,是一款强大的 AI 图像生成与编辑工具。 这款工具以其卓越的文本渲染、高级控制、多功能编辑和实时协作等功能,成为了设计师们不可或缺的创意助手,大大满足了设计师对于创意和效率的双重追求。 Recraft 的出色能力不仅体现在其强大的功能和便捷的操作上,更在于它能够将 AI 技术真正赋能给用户。
12/18/2024 12:32:27 AM
58UXD 团队
AI大模型时代,人才的需求已经变了
什么是 AI 发展的第一驱动力? 最近,全球科技大厂都在用行动告诉我们:人才。 本月初,谷歌 NotebookLM 的核心团队共同宣布离职创业,他们新公司的网站已经进入了「建设中」的状态。
12/17/2024 9:08:00 PM
机器之心
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
论文
Anthropic
代码
训练
算法
AI新词
Stable Diffusion
芯片
LLM
蛋白质
腾讯
开发者
苹果
Claude
生成式
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
RAG
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视觉
视频生成
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用