应用
英伟达发布 Llama Nemotron Nano VL AI:高效精准,攻克复杂文档解析难题
Llama Nemotron Nano VL 融合了 CRadioV2-H 视觉编码器和 Llama 3.1 8B 指令微调语言模型,能同时处理多页文档中的视觉和文本元素,支持最长 16K 的上下文长度,覆盖图像和文本序列。
4 个月内增加 100 万,OpenAI 宣布付费 ChatGPT AI 商业订阅用户突破 300 万
在昨日(6 月 3 日)举办的在线直播活动中,OpenAI 公司宣布在全球范围内,其付费商业订阅用户数量超过 300 万。
Reddit 起诉 AI 初创公司 Anthropic:去年 7 月以来发起超 10 万次违规访问
在诉状中,Reddit称Anthropic是一家“姗姗来迟却自诩为AI行业白衣骑士”的AI公司,但批评其“实则完全背道而驰”。
Hugging Face 称其开源机器人模型 SmolVLA 效率极高,能在苹果 MacBook 上运行
Hugging Face发布开源机器人AI模型SmolVLA,该模型轻量级但性能强大,可在消费级GPU上运行,支持异步推理堆栈,提升机器人响应速度。#AI技术# #机器人#
Mac 版 ChatGPT 变身生产力神器:AI 录音 + 云文件洞察,打造团队协作最佳助手
科技媒体 9to5Mac 昨日(6 月 4 日)发布博文,报道称 OpenAI 公司重点服务于团队和小型企业,全力推动 ChatGPT 转型为真正的生产力助手。
第一波!2025年6月精选实用设计干货合集
大家好,这是 2025 年 6 月第一波干货合集! 这一期干货合集相当直接,其中绝大多数都是在线的资源和网站,其中有帮助设计师了解全球设计工作室和设计师的涉及项目的资讯和设计案例网站,有汲取设计灵感的设计截图网站,还有将截图做好看的在线工具,有基于 AI 的好用的在线配色工具,还有在线的 LOGO 设计画布工具,以及将你的 Notion 页面直接变成 PPT 的好东西。 当然,在继续阅读下去之前,记得看看往期干货中有没有你感兴趣的素材:.
美团找黄龄,饿了么请蓝盈莹,京东要不用AI找个代言人?
自从京东进军外卖行业,无论是骑手福利、广告舆论还是红包减免,都与美团外卖展开了全面竞争。 就在这红黄两家打得不可开交之际,市场占有率持续下滑的饿了么虽想加入战局却有心无力,只得发条微博调侃自己不参与口水战,顺便搞些活动发放红包来维持活跃度。 看上去这些广告卡通配图还是用 AI 生成的。
游戏 AI 加速竞赛,消息称腾讯游戏打造游戏创作 AI 全链路解决方案业务“VISVISE”
腾讯游戏打造了一个名为“VISVISE”的游戏创作 AI 全链路解决方案业务,其中包括由旗下产品效能部 GoSkinning 团队打造的 Auto LUV 和裙摆 AI 等开发工具,并且各类 AI 游戏工具正在紧锣密鼓地开发中。(Tech 星球)
AI 逐渐取代基层员工,科技公司初级招聘大幅下降
在最近的 Snowflake Summit2025主题演讲中,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)指出,越来越多的企业开始将 AI 智能体视为基层员工。 奥尔特曼表示,许多公司的员工如今的工作重心已经转向为 AI 智能体分配任务、评估其结果的质量、整合工作内容并提供反馈。 这一工作模式与管理基层员工的方式非常相似。
Manus推出文生视频功能,力图与OpenAI的Sora一较高下
AI 初创公司 Manus 近日宣布推出其全新的 “文生视频” 功能,旨在为用户提供通过简单文本指令生成视频的便捷体验。 该功能目前已经面向 Basic、Plus 和 Pro 会员用户开放抢先体验。 Manus 在社交媒体平台 X 上表示,用户只需输入文本命令,其智能系统便能在几分钟内将这些指令转换成结构清晰、故事连贯的视频,展示了其在 AI 视频生成领域的强大能力。
韩国总统李在明承诺 100 万亿韩元 AI 投资计划,大力扩展基础设施建设
100 万亿韩元民间投资将通过设立国家基金实现,允许民众、企业、政府及养老基金等多元经济主体参与。个人与企业投资时可享受所得税、法人税减免。
Epic 创新!《堡垒之夜》引入生成式 AI,轻松定制智能 NPC
在最近的 “State of Unreal” 主题发布会上,Epic Games 首次展示了其最新技术,允许《堡垒之夜》的创作者使用生成式 AI 工具定制个性化的非玩家角色(NPC)。 这一功能的亮点在于,只需大约20行提示文本,开发者就能创建出能自由互动的 NPC,赋予他们独特的性格、语音和语气。 根据外媒 Engadget 的报道,演示中的 NPC 被命名为 “Buttons 先生”,其唯一的任务是劝说玩家按下房间中央的一个大红按钮。
DeepSeek-V3 & R1 合体:快手开源 "Auto Think" 大模型,可根据问题自动调节思考深度
快手 Kwaipilot 团队开源了 KwaiCoder-AutoThink-preview 自动思考大模型,该模型融合了“思考”和“非思考”能力,号称“DeepSeek-V3 & R1 合体”,具备根据问题难度自动切换思考形态的能力。
Komiko视频到视频功能炸裂上线!AI一键打造动漫大片,漫画动画创作从未如此简单
Komiko平台宣布推出全新视频到视频(Video-to-Video)功能,进一步巩固其作为AI驱动的漫画、动画和插画一体化创作平台的领先地位。 这一功能结合AI线稿上色、背景移除、图像增强和动画补帧技术,让用户仅需几分钟即可创作出专业品质的漫画和动画作品。 AIbase为您深度解析Komiko的最新突破及其对创意产业的深远影响。
Expensya创始人"食言"重返创业赛道,AI测试平台Thunder Code获900万美元种子轮
曾发誓永不再创业的Expensya联合创始人Karim Jouini和Jihed Othmani,最终还是被生成式人工智能的浪潮重新拉回了创业战场。 两人刚刚宣布共同创立AI驱动的软件测试平台Thunder Code,并在成立不到六个月的时间里完成了900万美元的种子轮融资。 2023年,这对创业搭档将他们的费用管理初创公司Expensya出售给瑞典采购软件公司Medius,交易金额据消息人士透露略高于1.2亿美元,这被广泛认为是非洲初创公司历史上最大的收购案之一。
松下推出 “OmniFlow” 多模态生成AI实现文本、图像与音频的自由转换
松下控股公司(Panasonic HD)联合美国松下研发公司(PRDCA)及加州大学洛杉矶分校(UCLA)的研究人员,成功开发出名为 “OmniFlow” 的多模态生成 AI。 这项技术的亮点在于其具备 “任意对任意” 的生成能力,可以实现文本、图像和音频之间的自由转换,极大地提升了多模态生成 AI 的应用潜力。 近年来,多模态生成 AI 的研究越来越受到关注,尤其是结合音频的生成技术。
“AI 歌曲”走红后,环球、华纳、索尼与音乐生成平台 Udio 及 Suno 讨论合作
三大唱片公司希望收取授权费用,并持有 Udio 和 Suno 少量股权。知情人士称,协议若落地,有望解决此前围绕版权纠纷的诉讼。
图灵奖得主 Bengio 再创业:构建下一代 AI 系统,启动资金已筹集 3000 万美元
刚刚,深度学习三巨头之一、图灵奖得主 Yoshua Bengio 官宣再次创业 —— 成立非营利组织 LawZero,要构建下一代 AI 系统,而且明确不做 Agent。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉