香港科技大学
相机运动误差降低40%!DualCamCtrl:给视频生成装上「深度相机」,让运镜更「听话」
本研究的共同第一作者是来自于香港科技大学(广州)EnVision Research 的张鸿飞(研究助理)和陈康豪(博士研究生),两位研究者均师从陈颖聪教授。 你的生成模型真的「懂几何」吗? 还是只是在假装对齐相机轨迹?
多模态大模型理解物理工具吗?PhysToolBench提出了衡量多模态大模型对物理工具理解的基准
人类之所以能与复杂的物理世界高效互动,很大程度上源于对「工具」的使用、理解与创造能力。 对任何通用型智能体而言,这同样是不可或缺的基本技能,对物理工具的使用会大大影响任务的成功率与效率。 尽管当下的多模态大模型在具身智能的高层任务规划以及低层动作执行方面都展现出很大的潜力,但它们是否真正「懂」物理工具、理解其运作原理,仍缺乏统一的量化评估。
谷歌最强AI,被港科大开源超了?让海外创作者喊出「King Bomb」的P图大杀器来了
「Photoshop is dead」,已经成为最近 AI 创作者圈中讨论最热的话题之一。 随着图像编辑与生成模型进入到了又一个集中爆发期,这个专业创意软件长久以来的王座地位受到了前所未有的冲击。 尤其是引领这波多模态生图技术升级潮流的谷歌 Nano Banana 以及字节 Seedream4.0、阿里 Qwen-Image-Edit-2509,它们涌现出了更多新的能力与玩法,比如 OOTD 穿搭、文字渲染、生成电影分镜。
比亚迪与香港科大合作成立具身智能实验室,未来投资数千万港元支持运营
AI在线 7 月 7 日消息,香港科技大学官网今日发布消息,宣布与比亚迪汽车工业有限公司签署合作框架协议,共同成立“香港科技大学–比亚迪具身智能联合实验室”。 根据介绍,比亚迪将于未来数年投入数千万港元支持实验室运营。 双方将探索数据驱动的具身智能研究,涵盖高效数据采集方法及操作与导航大模型训练技术。
香港科技大学成立冯诺依曼研究院:全力发展 AI 为关键产业
该研究院以著名电脑科学家、“电脑之父”约翰・冯・诺依曼命名,其开创的冯・诺依曼架构,对现在的 AI 演算法影响深远。
香港科技大学推出首个本地生成式人工智能大模型
香港科技大学主导的香港生成式人工智能研发中心(HKGAI)于2月25日正式发布了首个本地生成式人工智能大模型 ——HKGAI V1。 这一重大突破为香港的人工智能生态系统注入了新的活力,标志着香港在这一前沿科技领域的重要进展。 HKGAI V1是行业内首个基于 DeepSeek 技术进行全参数微调与持续训练的大模型,具有强大的本地知识库支持,能够理解并生成粤语、英语和普通话等多种语言的回答。
英伟达 CEO 黄仁勋盛赞香港科技大学:是“中国的 MIT”
据第一财经 24 日报道,黄仁勋称香港科技大学为“中国的 MIT(麻省理工学院,Massachusetts Institute of Technology)”,并称大湾区非常擅长机电一体化,这是机械技术和电子技术的交汇点。
英伟达 CEO 黄仁勋获香港科技大学荣誉博士,称 AI 正在革新科学且机器人时代即将到来
被授予名单还包括演员梁朝伟(人文学荣誉博士)、2013 年诺贝尔化学奖得主迈克尔・莱维特(理学荣誉博士)和菲尔兹奖得主戴维・芒福德(理学荣誉博士)。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉