AI
一行“解”字赢了全场?腾讯 x 普林斯顿发现AI裁判集体走神
想象一下,你向一个AI提问一道数学题:“阿里有21美元,莱拉把她100美元的一半给了他,现在阿里有多少钱? ”接着,你让一个“AI裁判”去评估两个答案,一个答案是一串错误的计算公式,另一个答案只有一个单词:“Solution”(解)。 你认为AI裁判会判定哪个答案正确?
港科大团队开发出新 AI 模型:2 至 4 张 X 光片构建 3D 影像,相比 CT 扫描辐射量降低 99%
AI在线 7 月 17 日消息,据中新社报道,香港科技大学(以下简称“港科大”)今日召开记者会宣布,其研究团队成功开发出一套创新的人工智能(AI)模型,能够在仅需极少量 X 光影像的情况下,快速构建出高质量的 3D 骨骼与器官图像,较计算机体层 (CT) 成像 (简称“CT 扫描”),可大幅降低病人接收的辐射量达 99%。 据AI在线了解,CT 扫描作为一种常见的医学影像工具,广泛应用于医疗诊断、手术指导以及复杂病况处理,如畸形、骨折和肿瘤等。 然而,CT 扫描过程中患者需暴露于高剂量辐射,这对儿童、孕妇以及需要频繁接受检查的老年人极为不利。
Adobe 推出全新 AI 影视制作工具,可制作音效、模仿视频画面构图
AI在线 7 月 17 日消息,Adobe 宣布推出一系列全新的生成式 AI 影视制作工具,为创作者带来更加有趣且高效的音效创作与视频生成控制方式。 AI在线注意到,Adobe 新推出的 Generate Sound Effects 工具目前正在 Firefly 应用中处于测试阶段,可用于录制和生成的视频片段,并且与谷歌的 Veo 3 视频工具相比其对音频生成的控制能力更强。 其界面类似视频编辑时间轴,用户可以将自己创作的音效与上传的视频片段精准匹配。
Meta 重金抢人,明星云集就能复制 DeepSeek 的成功吗?
最近 AI 圈最大的新闻,大约就是 Meta 扎克伯格亲自出手、重金招人的消息了。 根据公开信息,如今在小扎亲自出手的推动下,Meta 已经组建起一支堪称豪华的 AI 战队。 核心领导团队方面,包括前 Scale AI 创始人 Alexandr Wang(现任 Meta 首席 AI 官)、前 GitHub CEO Nat Friedman,以及 Safe Superintelligence 联合创始人 Daniel Gross,三人共同执掌 Meta Superintelligence Labs 的战略与节奏。
黄仁勋对话阿里云王坚爆猛料!未来芯片大如桌面,AI开启全新软件开发范式!中国AI研究全球领先!更断言:AI将定义未来一百年!
出品 | 51CTO技术栈(微信号:blog51cto)今天,在链博会现场。 老黄再次身穿皮衣,与之江实验室主任、阿里云创始人王坚进行了一场炉边谈话。 两个计算界的大佬,围绕着AI和算力展开了一场深刻的思想交锋。
美国青少年 AI 伴侣使用调查:72% 体验过,半数定期使用
AI在线 7 月 17 日消息,据一项最新调查显示,美国青少年中使用人工智能伴侣(AI 伴侣)的现象十分普遍,但这一趋势也引发了对其安全性和心理健康风险的担忧。 调查显示,近四分之三的美国青少年曾使用过 AI 伴侣,其中超过半数为定期使用者。 AI 伴侣是专为个人对话设计的聊天机器人,与传统的人工智能助手不同,它们被编程为与用户建立情感联系。
新研究指出人类语言被 AI 影响,日常交流更频繁出现“GPT 词汇”
AI在线 7 月 17 日消息,科技媒体 Android Headline 今天(7 月 17 日)发布博文,报道称最新研究表明,在 ChatGPT 为代表的 AI 聊天机器人影响下,AI 在模仿人类语言的同时,也影响人类在日常交流中出现更多 AI 口吻的词汇。 德国马克斯・普朗克人类发展研究所的研究人员发现,人类的口头语言在 AI 影响下,正发生微妙变化,比以往更频繁地使用“深入研究”(delve)或“细致”(meticulous)等“GPT 词汇”。 AI在线援引博文介绍,研究团队首先将包括电子邮件、论文和新闻故事在内的数百万篇人类写作,输入到 ChatGPT 中,然后让这个 AI 驱动的聊天机器人“润色”这些文本。
加速AI技术落地的有效方法
GenAI的迅速崛起揭示了一个职场现实:一线员工往往比管理人员更快地接受新技术。 AI技术的发展速度之快,令人难以跟上其改变人们工作方式的众多新途径,然而,对于大多数企业而言,技术可能性与实际应用之间的差距正在不断扩大。 2024年麦肯锡全球调查发现,90%的员工在工作中使用GenAI,其中21%的员工是重度用户,然而,尽管员工热情高涨,但大多数企业对AI工具的正式采用却滞后:只有13%的受访员工认为自己的企业是早期采用者。
500美元刷新SOTA!训练成本砍到1/200,华人团队重构视频生成范式
你可能听说过OpenAI的Sora,用数百万视频、千万美元训练出的AI视频模型。 但你能想象,有团队只用3860段视频、不到500美元成本,也能在关键任务上做到SOTA? 比如这个图生视频:攀岩者在小行星攀岩,人体运动与太空光影完美仿真。
OpenAI 被曝谋求多元化收入:ChatGPT AI 将整合支付系统,抽佣电商产品
AI在线 7 月 17 日消息,金融时报昨日(7 月 16 日)发布博文,报道称 OpenAI 公司为进一步拓展电商功能并寻求新收入,计划从 ChatGPT 直接销售的在线产品中,抽取一定比例的佣金。 AI在线注:OpenAI 公司目前已经在 ChatGPT 中展示相关商品,并提供链接至在线零售商的选项。 OpenAI 公司今年 4 月,还宣布与支付集团 Shopify 建立合作关系。
免剪辑直出!AI生成多角色同框对话视频,动态路由精准绑定音频
近年来随着视频生成基础模型的涌现,音频驱动的说话人视频生成领域也取得了显著进展。 但现有方法主要聚焦于单角色场景,现有可生成两个角色对话视频的方法仅能单独地生成两个分离的说话人视频。 针对这一挑战,研究人员提出了首个专注同场景多角色说话视频生成的框架Bind-Your-Avatar该模型基于扩散Transformer(MM-DiT),通过细粒度的嵌入路由机制将「谁在说」与「说什么」绑定在一起,从而实现对音频–角色对应关系的精确控制。
ChatGPT还没学会打电话,谷歌搜索AI已经替你电话约服务,还会谈价砍单!
谷歌搜索要出新花样了! 想象一下,你想给你的宠物狗做一次美容,但是家附近好像没有这样的门店。 你打开搜索,输入「附近的宠物美容师」,并且勾选了「让AI查价格」,然后接下来你就什么都不用做了。
Transformer终结者!谷歌DeepMind全新MoR架构问世,新一代魔王来了
就在刚刚,KAIST、Mila和谷歌DeepMind团队等放出重磅炸弹——一个名为Mixture-of-Recursions的全新LLM模型架构。 这个崭新的架构,被业内认为有潜力成为Transformer杀手! 它的推理速度提升2倍,训练FLOP减少,KV缓存内存直接减半。
1万tokens是检验长文本的新基准,超过后18款大模型集体失智
上下文扩展至1万tokens,LLM集体“失智”! 且“智商”不是均匀下降,而是在一些节点突然断崖式下跌。 比如Claude Sonnet 4,就是在1000tokens后准确率一路下滑,从90%降到60%。
投奔小扎,Jason Wei连发两篇博文公布“屠龙术”:一个公式看透AI,一条心法指引人生
Jason Wei:OpenAI研究科学家,OpenAI思维链研究开创者,《Chain-of-thought prompting elicits reasoning in large language models》论文第一作者,谷歌学术他引17000余次(CoT单篇),高中学历,毕业于全美顶级的科技高中:托马斯·杰弗逊科学技术高中,sat 2390(2400满分),强化学习大神。 在刚刚爆出被小扎挖走,加入meta超级智能实验室后,Jason Wei 连发两篇文章,一篇是关于 AI 发展的核心驱动力公式——“验证者定律”,另一篇则是从强化学习中悟出的人生哲学——“人生要走 On-Policy 路线”,这可能就是jason wei 在OpenAI最后的遗作了吧。 验证者定律说的是:训练人工智能解决一个任务的难易程度与该任务的可验证性成正比。
面对无解问题大模型竟会崩溃?港中文&华为联合提出首个大模型推理可靠性评估基准
本文作者是香港中文大学博士三年级薛博阳,导师为黄锦辉教授,目前在伦敦大学学院进行访问交流,他的研究方向包括可信大模型,模型不确定性,对话系统等,在 ACL, EMNLP, TASLP 等会议期刊作为第一作者发表多篇论文,并长期在知乎写作大模型、机器学习等专栏文章,个人主页为:? 今年初以 DeepSeek-r1 为代表的大模型在推理任务上展现强大的性能,引起广泛的热度。 然而在面对一些无法回答或本身无解的问题时,这些模型竟试图去虚构不存在的信息去推理解答,生成了大量的事实错误、无意义思考过程和虚构答案,也被称为模型「幻觉」 问题,如下图(a)所示,造成严重资源浪费且会误导用户,严重损害了模型的可靠性(Reliability)。
舍弃自回归,离散扩散语言模型如何演化?NUS综述解构技术图谱与应用前沿
本论文共同第一作者于润芃和李奇是新加坡国立大学 xML 实验室博士生,指导老师为王鑫超,研究方向是多模态大模型与可信深度模型。 本文主要介绍 xML 团队的论文:Discrete Diffusion in Large Language and Multimodal Models: A Survey。 论文链接: 仓库: GPT 引爆大语言模型热潮以来,自回归的大语言模型(LLMs)与多模态模型(MLLMs)已成为智能系统的基石。
两周反转:Anthropic「闪电」夺回被Cursor挖走的核心编程大将
本月初,据 The Information 报道,Anthropic Claude Code 的两位负责人 Boris Cherny 和 Cat Wu 被 AI 编程应用 Cursor 的开发商 Anysphere 挖走。 其中,Boris Cherny 是 Claude Code 项目的开发负责人,可以说是 Claude Code 技术的灵魂人物,此前加入 Anysphere 担任首席架构师和工程主管。 Cat Wu 则是 Claude Code 产品经理,在 Anysphere 的新职务是产品主管。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉