资讯列表
Meta 出品!Pippo:输入单张人物图片生高分辨率多视角图片
近日,Meta Reality Labs 的研究团队联合高效发布了一项名为 “Pippo” 的创新性生成模型,能够从一张随意拍摄的照片中,生成一段高达1K 分辨率的密集周转视频。 这一突破性技术,标志着计算机视觉和图像生成领域的又一重要进展。 Pippo 模型的核心在于其多视图扩散转换器的设计。
2/17/2025 10:32:00 AM
AI在线
Nature:全球博士生数量锐减,钱少、事多、前途迷茫
过去几年,一些国家的博士项目申请人数出现下滑,有专家警告称,这是一个令人担忧的趋势。 从澳大利亚、日本到巴西和英国,高昂的生活成本、微薄的助学金以及毕业后有限的就业前景,正在阻碍人们攻读博士学位。 据经合组织(OECD)巴黎总部项目负责人斯拉里科表示,这些下降的数据应该「敲响警钟」。
2/17/2025 10:30:00 AM
新智元
微软发布 OmniParser V2.0:把屏幕截图转化成LLM可处理的结构化格式
微软近日发布了 OmniParser V2.0,这是一个旨在将用户界面(UI)截图转换为结构化格式的全新解析工具。 OmniParser 能够提高基于大型语言模型(LLM)的 UI 代理的性能,帮助用户更好地理解和操作屏幕上的信息。 该工具的训练数据集包括一个可交互图标检测数据集,该数据集从热门网页中精心挑选并自动注释,以突出可点击和可操作的区域。
2/17/2025 10:28:00 AM
AI在线
OpenAI调整策略,力求在内容审查与自由言论之间找到平衡
OpenAI 近期宣布了一项重要的政策更新,旨在改变其人工智能模型的训练方式,强调 “知识自由” 的重要性,无论话题多么具有挑战性或争议性。 这一变化意味着,ChatGPT 将能更全面地回答问题,提供更多视角,减少拒绝讨论某些话题的情况。 在新的187页模型规范中,OpenAI 提出了一个新的指导原则:不要撒谎,既不要发表不真实的陈述,也不要省略重要的上下文。
2/17/2025 10:26:00 AM
AI在线
微信与百度相继接入DeepSeek,AI技术普惠开启超级加速度
2月16日,腾讯微信和百度相继宣布接入DeepSeek,这一事件标志着中国互联网行业在AI领域的又一次重大突破。 微信作为拥有近14亿月活用户的超级应用,百度作为国内领先的搜索引擎,两者的接入不仅为用户带来了更智能的交互体验,更对整个行业产生了深远影响。 推动AI技术普惠化与应用落地DeepSeek的开源特性使其成为AI技术普惠化的关键力量。
2/17/2025 10:25:46 AM
苹果与Meta争相开发AI驱动的人形机器人
在科技界的舞台上,苹果与 Meta 这两大巨头正在悄然展开一场关于 AI 驱动的人形机器人的竞赛。 尽管这两家公司在某些领域存在竞争,但此次合作与对抗的交织,或许将开启科技的新篇章。 苹果作为消费者电子产品的先锋,其在智能硬件领域的创新能力毋庸置疑。
2/17/2025 10:20:00 AM
AI在线
首个基于统计学的线性注意力机制ToST,高分拿下ICLR Spotlight
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2/17/2025 10:19:00 AM
机器之心
阿里巴巴在AI热潮中逆风翻盘,股价上涨50%
阿里巴巴集团控股有限公司(NYSE:BABA)近期股价飙升超过50%,这主要得益于投资者对 AI(人工智能)发展的乐观预期。 尽管由于核心零售业务的增长乏力以及中国的地缘政治风险,阿里巴巴的估值一直处于低位,但这并没有阻止其股价的强劲反弹。 市场普遍认为,阿里巴巴正经历从零售主导向 AI 创新的战略转型,且其资本支出增长正不断加速。
2/17/2025 10:14:00 AM
AI在线
大语言模型的解码策略与关键优化总结
本文系统性地阐述了大型语言模型(Large Language Models, LLMs)中的解码策略技术原理及其实践应用。 通过深入分析各类解码算法的工作机制、性能特征和优化方法,为研究者和工程师提供了全面的技术参考。 主要涵盖贪婪解码、束搜索、采样技术等核心解码方法,以及温度参数、惩罚机制等关键优化手段。
2/17/2025 10:13:27 AM
佚名
超强DNA大模型「GENERator」问世!解锁生命密码设计新范式
编辑 | ScienceAI在基因组学研究领域,DNA 序列的解码与预测一直是科学家们面临的核心挑战。 随着测序技术的飞速发展,我们能够以前所未有的速度获取海量基因组数据,但如何高效解读这些复杂的遗传信息,仍是一个亟待解决的难题。 近年来,大语言模型(LLMs)在自然语言处理领域的成功,为生物序列分析带来了新的契机。
2/17/2025 10:11:00 AM
ScienceAI
零基础也能看懂的ChatGPT等大模型入门解析!
近两年,大语言模型LLM(Large Language Model)越来越受到各行各业的广泛应用及关注。 对于非相关领域研发人员,虽然不需要深入掌握每一个细节,但了解其基本运作原理是必备的技术素养。 本文笔者结合自己的理解,用通俗易懂的语言对复杂的概念进行了总结,与大家分享~什么是ChatGPT?
2/17/2025 10:09:54 AM
郭小喵玩AI
免手术AI读心术新突破!Meta脑机接口研究惊呆网友:能边睡边玩手机发帖了??
新年伊始,Meta脑机接口研究传来新进展——语言模型加持下,无需动脑部手术,脑机接口实现了当前非侵入式方式(MEG)最准确的结果。 简单来说,仅利用AI模型Brain2Qwerty,他们实现了对脑电图(EEG)或脑磁图(MEG)电信号的高度解析。 具体效果如何呢?
2/17/2025 10:08:00 AM
量子位
Meta 创新推出 “连续概念混合” 框架,推动 Transformer 预训练新革命
近年来,随着大型语言模型(LLMs)的快速发展,自然语言处理领域经历了前所未有的变革。 这些技术如今广泛应用于代码助手、搜索引擎和个人 AI 助手等场景,展现了强大的能力。 然而,传统的 “下一个 token 预测” 范式存在一定局限性,尤其是在处理复杂推理和长期任务时,模型需要经历大量训练才能掌握深层次的概念理解。
2/17/2025 10:05:00 AM
AI在线
马斯克即将发布Grok3,称其为 “全球最聪明的人工智能”
科技巨头埃隆・马斯克(Elon Musk)领导的人工智能初创公司 xAI,计划于2月17日晚上8点(太平洋时间)发布其最新的聊天机器人 Grok3。 马斯克称 Grok3为 “地球上最聪明的人工智能”,其发布正值人工智能大模型竞争日益激烈的背景下。 Grok3的模型基于合成数据进行训练,具备通过反复审视数据实现逻辑一致性的能力,能够反思和纠正自身错误。
2/17/2025 10:01:00 AM
AI在线
UI设计神器!Ready AI:输入提示词即可生成专业级网页
最近,一款名为Ready AI的工具正在设计圈引起不少关注。 这款工具的优秀之处在于用户仅需输入文字指令,就能在30秒内生成专业级网页界面。 使用 Ready AI,用户对自己想要的 UI 有更多控制权。
2/17/2025 10:01:00 AM
AI在线
DeepSeek 关联公司高层变动,经营范围新增互联网信息服务
天眼查 App 显示,DeepSeek 关联公司杭州深度求索人工智能基础技术研究有限公司近日发生多项工商变更。 裴湉卸任执行董事兼总经理,改任经理、董事;新增王贤祖为财务负责人;公司经营范围新增互联网信息服务。 该公司成立于2023年7月,法定代表人为裴湉,注册资本1000万人民币,由梁文锋及其名下宁波程恩企业管理咨询合伙企业(有限合伙)共同持股。
2/17/2025 10:00:51 AM
AI在线
腾讯文档正式接入DeepSeek-R1满血版
2月17日,腾讯文档宣布正式接入DeepSeek-R1模型满血版,进一步提升用户在文档创作、信息处理和协作编辑中的效率。 此次接入的DeepSeek-R1模型具备深度思考、联网搜索、多轮对话等功能,能够为用户提供更全面、专业和高效的内容生成与处理体验。 用户在腾讯文档的AI文档助手中选择DeepSeek-R1模型后,即可在腾讯文档小程序、网页版、移动端和桌面端(支持3.9.5及以上版本)体验该功能。
2/17/2025 9:56:00 AM
AI在线
DeepSeek冲击之下,大模型六小强如何「回应」?
马上整整1个月了! 这一个月以来,全球大模型市场受DeepSeek搅动,无不方寸大乱。 中外大厂、初创公司都头好秃,全被追着问:你们对DeepSeek怎么看?
2/17/2025 9:50:00 AM
量子位