AI
百度发布自研视频生成模型 MuseSteamer:一张图即可生成电影级高清有声视频
百度发布自研视频生成模型MuseSteamer,支持一张图生成10秒1080p电影级画质视频,人物微表情与运镜效果达专业影视水准。Turbo版已上线绘想平台开启限时免费公测,其余版本将于8月陆续开放。#AI视频生成##百度MuseSteamer#
硅谷 AI 人才争夺战愈发激烈:年薪千万美元抢夺顶尖科学家
硅谷AI人才争夺战白热化!Meta、OpenAI等科技巨头为顶尖AI科学家开出千万年薪,薪酬较2022年暴涨50%。#AI人才争夺战# #硅谷高薪# 报告显示,AI科学家更看重研究自由与使命,小型公司面临巨大招聘压力。
Grok 4源代码刚刚泄露!上线倒计时,马斯克xAI估值破1130亿,大模型要变天
突发消息:Grok 4即将上线! 与此同时,xAI再度获得百亿美元融资,估值已经直冲1130亿。 马斯克的AI帝国,再度以可怕的规模扩张。
9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA | 智谱开源
如果一个视觉语言模型(VLM)只会“看”,那真的是已经不够看的了。 因为现在真实世界的任务简直不要太复杂,要想让AI干点实事儿,光有多模态还不够,必须还得有深度思考的强推理能力。 而就在刚刚,智谱发布并开源了一个仅9B大小的模型——GLM-4.1V-9B-Thinking,在28项评测中一举拿下23个SOTA!
微软开源适用于 VS Code 的 GitHub Copilot Chat 扩展,助推 AI 编程自动化
这意味着开发社区可以深入了解和洞察聊天式编码助手的完整实现,包括“智能体模式”的实现细节、发送给大型语言模型(LLM)的上下文数据以及系统提示的设计。
小扎狂砸3亿美金薪酬包!奥特曼放狠话:传教士终将打败雇佣兵
「传教士将打败雇佣兵」! 在小扎挖走近十位OpenAI研究院后,奥特曼在内部备忘录中,写下了这句提振士气的话。 这张在全网疯传的图片中,OpenAI多数大神纷纷加入Meta,华人研究员更是占据了半壁江山。
比10年专业医生准4倍!微软发布突破性医疗AI系统
微软首席执行官Satya Nadella在社交平台分享了,微软最新发布的突破性医疗AI系统MAI-DxO。 MAI-DxO最大技术创新在于其模型无关的设计,使其能够适配不同厂商、不同能力的语言模型,并普遍提升它们的诊断性能。 并且能模拟真实医生的诊断流程,比专业医生的准确率更高。
Cursor也挖人了:Claude Code开发主管和产品经理被一锅端
编程神器Cursor的母公司Anysphere也开始挖人了Cursor这次挖到了合作伙伴Anthropic的两名前核心高管:原“Claude Code”项目开发负责人Boris Cherny将出任首席架构师兼工程主管,原项目产品经理Cat Wu将担任产品负责人Boris Cherny 2024年9月加入Anthropic,入职还不到一年,之前在小扎公司Meta 干了六年多,任职首席软件工程师, Instagram 的服务器架构和开发基础设施主管, Meta 的代码质量主管,毕业于美国加州大学圣迭戈分校,学的是经济学Cat Wu全名Catherine Wu,2024年8月加入Anthropic,擅长构建高可靠、可解释、可控制的人工智能系统,本科毕业于普林斯顿大学,专业计算机科学,加入Anthropic之前有多段不同领域工作实习经历,最长两年,比如在谷歌实习任职软件工程师,在J.P. 摩根实习任职交易员,在Alexandr Wang公司scale AI作为作为产品经理任职两年此番“挖角”或将使两家公司的合作关系变得微妙——毕竟Cursor的大部分AI功能都由Anthropic提供技术支持。 目前,Anthropic的年化收入已高达40亿美元,而Cursor的年度经常性收入也已突破5亿美元AI编程领域现在竞争非常激烈,下面给大家梳理一下,如今,AI编程领域的战火已蔓延至四大战场:1.
不用AI编程就滚蛋!这家公司CEO一封邮件把程序员都惹毛了
想象一下,你的老板突然在全员邮件里宣布:从下个月开始,公司每月投入5万美元购买AI编程工具,所有不使用"Vibe Coding"的程序员都要接受绩效改进。 这不是假设。 这是一家真实公司的CEO刚刚发出的邮件内容。
ICML 2025 Spotlight | 清华朱军组&NVIDIA提出DDO:扩散/自回归模型训练新范式,刷新图像生成SOTA
文章一作郑凯文为清华大学三年级博士生,研究方向为深度生成模型,曾提出流式扩散模型最大似然估计改进技术 i-DODE,扩散模型高效采样器 DPM-Solver-v3,扩散桥模型采样器 DBIM 以及掩码式离散扩散模型采样器 FHS 等。 清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化(DDO)。 该方法将基于似然的生成模型(如扩散模型、自回归模型)隐式参数化为 GAN,从而设计出一种无需额外网络、训练高效的微调方法,并大幅突破传统最大似然训练的性能瓶颈。
大模型时代,通用视觉模型将何去何从?
过去几年,通用视觉模型(Vision Generalist Model,简称 VGM)曾是计算机视觉领域的研究热点。 它们试图构建统一的架构,能够处理图像、点云、视频等多种视觉模态输入,以及分类、检测、分割等多样的下游任务,向着「视觉模型大一统」的目标迈进。 然而,随着大语言模型 LLM 的迅猛发展,研究热点已经悄然发生转移。
Meta“1亿美元年薪”震荡硅谷!奥特曼回应:总有人唯利是图,而且都算不上TOP
疯狂,太疯狂。 这两天,硅谷乃至全球AI领域的注意力都被Meta老板扎克伯克带走了,毕竟也不是谁都能boss直聘,一举挖走8名OpenAI核心员工。 更何况其中大部分,还是以聪明能干吃苦耐劳著称的华人研究员。
马斯克 xAI 公司补充 100 亿美元弹药,火力聚焦打造地表最强 AI
CNBC 昨日(7 月 1 日)发布博文,报道称埃隆・马斯克(Elon Musk)为增强同 OpenAI 的竞争,通过 50 亿美元债务和 50 亿美元股权的方式,成功筹集了 100 亿美元(IT之家注:现汇率约合 716.35 亿元人民币),继续烧钱推进 AI 发展。
一文读懂数据标注:定义、最佳实践、工具、优势、挑战、类型等
想知道自动驾驶汽车或语音助手等尖端人工智能系统如何实现其惊人的准确性吗? 秘诀在于高质量的数据标注。 这一过程确保数据被精确标记和分类,从而使机器学习 (ML) 模型发挥最佳性能。
超越微软,全球第一!上交AI智能体炼成「Kaggle特级大师」,登顶OpenAI MLE-bench
就在刚刚,一支来自中国高校的团队成功刷榜了OpenAI发布的权威基准测试MLE-bench! 这一次,荣耀属于上海交通大学人工智能学院Agents团队。 他们提出的AI专家智能体「ML-Master」,凭借着29.3%的平均奖牌率,拿下第一!
Meta抄袭DeepSeek大翻车?硅谷大佬爆料亮点满满,AI军备烧钱真相震碎硅谷
谁会首先到达ASI(超级智能)? 大佬斩钉截铁的回答,让主持人惊呆了几秒。 GPT-4.5到底哪里出了问题?
你的Agent电脑助手正在踩雷!最新研究揭秘Computer-Use Agent的安全漏洞
本文由上海 AI Lab、中国科学技术大学和上海交通大学联合完成。 主要作者包括中国科学技术大学硕士生杨靖懿、上海交通大学本科生邵帅。 通讯作者为刘东瑞和邵婧,上海 AI Lab 安全团队,研究方向为 AI 安全可信。
四年三次加码核聚变,硅谷巨头们疯狂抢电ing
当前的趋势是AI,AI的下一个趋势是——电。 准确说是核电。 AI狂飙的时代,算力需求呈指数级攀升。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
大型语言模型
AI设计
生成式AI
搜索
视频生成
亚马逊
AI模型
DeepMind
特斯拉
场景
深度学习
Transformer
架构
Copilot
MCP
编程
视觉