数据
即插即用ChatTracker:多模态大模型重塑目标跟踪
                        写在前面 & 笔者的个人理解视觉对象跟踪旨在基于初始边界框在视频序列中定位目标对象。 最近,视觉语言(VL)跟踪器已经提出利用额外的自然语言描述来增强各种应用中的通用性。 然而,VL跟踪器在跟踪性能方面仍然不如最先进的视觉跟踪器(SoTA)。
                    
                    11/12/2024 10:20:00 AM
                        自动驾驶Daily
                    两位本科生一作,首次提出「持续学习」+「少样本」知识图谱补全 | CIKM 2024
                        知识图谱(Knowledge Graphs)是一种结构化的,用于展示和管理信息,组织现实世界知识的形式。 其通常被表达为三元组形式(头实体,关系,尾实体)。 KGs 为问答系统、推荐系统和搜索引擎等各种实际应用提供了极其重要支持。
                    
                    11/11/2024 2:20:00 PM
                        新智元
                    空间智能版ImageNet来了!李飞飞吴佳俊团队出品
                        空间智能版ImageNet来了,来自斯坦福李飞飞吴佳俊团队! HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。 通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。
                    
                    11/11/2024 8:30:00 AM
                        量子位
                    文本图格式大一统!首个大规模文本边基准TEG-DB发布 | NeurIPS 2024
                        文本属性图Text-Attributed Graphs(TAGs)是一种在节点上有丰富文本信息的图结构, TAGs 广泛应用于社交网络(social network)、引用网络(citation network)和推荐系统(recommendation system)等实际场景中。 由于其强大且通用的表达能力,该领域近年来得到了快速发展。 然而目前TAGs面临三大挑战:现有的TAGs数据集一般仅在节点上包含文本信息,而边的信息往往被简化为二元或分类属性。
                    
                    11/8/2024 1:30:00 PM
                        新智元
                    GPT-4o加钱能变快!新功能7秒完成原先23秒的任务
                        OpenAI出了个新功能,直接让ChatGPT输出的速度原地起飞! 这个功能叫做“预测输出”(Predicted Outputs),在它的加持之下,GPT-4o可以比原先快至多5倍。 以编程为例,来感受一下这个feel:为啥会这么快?
                    
                    11/6/2024 3:20:00 PM
                        量子位
                    英伟达团队机器训练新方法:仅 5 次演示让机器生成 1000 个新 demo
                        人类只需要演示五次,就能让机器人学会一项复杂技能。 英伟达实验室,提出了机器人训练数据缺乏问题的新解决方案 ——DexMimicGen。 五次演示之后,DexMimicGen 就可以直接模仿出 1000 个新的 demo。
                    
                    11/5/2024 12:56:36 PM
                        汪淼
                    车道线再出发!SinLane:孪生Transformer如何破局(上交&浙大)
                        本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 & 笔者的个人理解车道检测是自动驾驶系统中一项重要但具有挑战性的任务。 基于Visual Transformer的发展,早期基于Transformer的车道检测研究在某些场景下取得了有前景的结果。
                    
                    11/5/2024 9:46:21 AM
                        自动驾驶Daily
                    微软清华改进Transformer:用降噪耳机原理升级注意力,一作在线答疑
                        Transformer自问世后就大放异彩,但有个小毛病一直没解决:总爱把注意力放在不相关的内容上,也就是信噪比低。 现在微软亚研院、清华团队出手,提出全新改进版Differential Transformer,专治这个老毛病,引起热议。 论文中介绍,整体思路类似差分放大电路或降噪耳机,用两个信号的差值来滤除共模噪声。
                    
                    11/4/2024 8:45:00 AM
                        量子位
                    Claude AI 上线新工具:分析、可视化 CSV 文件中的数据
                        科技媒体 NeoWin 昨日(10 月 24 日)发布博文,报道称 Anthropic 公司在更新  Claude 3.5 Sonnet 并推出全新的 Claude 3.5 Haiku 后,还推出了全新的分析工具,可以编写和运行 JavaScript 代码,实现处理数据、进行分析并生成实时洞察。 此分析工具将作为 Claude.ai 的新内置功能提供,类似于 ChatGPT 的代码解释器,它能够编写和运行 JavaScript 代码,处理数据、进行分析并生成洞察。 Claude 可以根据输入提示和文件,逐步清理、探索和分析数据,直到达到预期结果。
                    
                    10/25/2024 11:11:23 AM
                        故渊
                    中国移动上海产业研究院:金融领域 AI 大模型渗透率过半,系行业最高
                        据《北京商报》周日报道,在 2024 金融街论坛年会“AI   金融赋能数字金融新篇章”平行论坛上,中国移动上海产业研究院副总经理陈豫蓉介绍,金融领域是大模型渗透率最高的行业,渗透率超过 50%。智慧销售、智能问答和智能风控是现阶段金融行业最热门,也是应用成熟度最高的 AI 大模型应用场景。AI在线从报道获悉,金融业具备大规模、高质量的数据资源和多维度、多元化的应用场景,被视为大模型技术应用的最优行业之一。
                    
                    10/21/2024 8:52:35 AM
                        清源
                    LightRAG: 港大黄超团队打造简单高效的RAG系统, 大幅降低大模型检索增强成本
                        项目地址:: ,结合了图结构与双层检索机制,显著降低了大模型检索增强的成本,同时提升了信息检索的准确性和效率。首先,通过引入图结构,LightRAG能够更好地捕捉实体之间的复杂依赖关系,实现全面的信息理解。其次,其双层检索策略允许系统同时处理具体和抽象的查询,确保用户获得既相关又丰富的响应。
                    
                    10/14/2024 2:17:00 PM
                        新闻助手
                    OpenAI 发布 MMMLU 数据集:更广、更深评估 AI 模型,支持简体中文
                        科技媒体 marktechpost 昨日(9 月 23 日)发布博文,报道称 OpenAI 在 Hugging Face 上发布了多语言大规模多任务语言理解(MMMLU)数据集。背景随着语言模型日益强大,评估其在不同语言、认知和文化背景下的能力已成为当务之急。OpenAI 决定推出 MMMLU 数据集,通过提供强大的多语言和多任务数据集,来评估大型语言模型(LLMs)在各种任务中的性能,从而应对这一挑战。MMMLU 数据集简介MMMLU 数据集包含一系列问题,涵盖各种主题、学科领域和语言。其结构旨在评估模型在不同研
                    
                    9/24/2024 2:46:03 PM
                        故渊
                    阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
                        看一眼菜品图就知道怎么做、能给植物看病、能把手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态大模型能够处理和理解多种不同类型的数据输入,例如文本、图像。与大型语言模型(LLMs)相比,大语言模型在处理和生成文本数据方面有专长,而多模态大模型能够处理非文本数据,如图像等等。根据多模态权威综合评测平台OpenCompass的数据,Ovis1.6-Gemma2
                    
                    9/19/2024 10:47:00 AM
                        新闻助手
                    全球最大商业图库 Getty Images 推出免费高画质照片 AI 训练集:含 3750 张照片、分 15 项类别
                        以提供新闻、体育和娱乐照片授权闻名的全球最大的商业图库 Getty Images 上周宣布推出高画质照片样本训练数据集,供开发者开发和训练 AI 模型使用。AI在线获悉,该样本数据集包含 3,750 张照片,分为商业、教育、医疗健康、运动与健身、物品与物体、插图、图标等 15 个类别。数据集提供多种主题的高质量视觉内容,可用于训练机器学习和 AI 模型,开发多种应用场景。▲ 相关图片选集目前,这一数据集已在 Hugging Face 上线(点此访问),不过用户需同意服务条款并提供联系方式,才能免费访问该数据集。Ge
                    
                    9/9/2024 2:03:16 PM
                        漾仔
                    更高分辨率,更经济,深度生成模型与主动学习策略结合,推进大规模单细胞研究
                        编辑 | 萝卜皮单细胞测序是分析复杂疾病细胞复杂性的重要工具。然而,其高昂的成本阻碍了其在广泛的生物医学研究中的应用。传统的细胞反卷积方法可以从更便宜的批量测序数据中推断出细胞类型比例,但它们无法提供单细胞水平分析所需的精细分辨率。为了克服这一挑战,加拿大麦吉尔大学(McGill University)的研究人员引入了「scSemiProfiler」,这是一个创新的计算框架,将深度生成模型与主动学习策略结合在一起。该方法具有高度精确性,能推断出大群体中的单细胞概况。可与真实的单细胞分析数据紧密结合,支持精细的细胞分
                    
                    9/3/2024 7:10:00 PM
                        ScienceAI
                    迈向「多面手」医疗大模型,上交大团队发布大规模指令微调数据、开源模型与全面基准测试
                        编辑 | ScienceAI近日,上海交通大学、上海 AI Lab、中国移动等机构的联合研究团队,在 arXiv 预印平台发布文章《Towards Evaluating and Building Versatile Large Language Models for Medicine》,从数据、测评、模型多个角度全面分析讨论了临床医学大语言模型应用。文中所涉及的所有数据和代码、模型均已开源。GitHub:   Link:  :  ,大型语言模型(LLM)取得了显著的进展,并在医疗领域取得了一定成果。这些模型在医学多
                    
                    9/3/2024 7:09:00 PM
                        ScienceAI
                    谷歌 AI 推出 CardBench 评估框架:含 20 个真实数据库,更全面评估基数估计模型
                        谷歌 AI 研究人员最新推出了 CardBench 基准,主要为学习型基数估计(cardinality estimation)满足系统评估框架需求。CardBench 基准是个综合评估框架,包含 20 个不同真实数据库中的数千次查询,大大超过了以往的任何基准。项目背景基数估计(cardinality estimation,简称 CE)是优化关系数据库查询性能的关键,涉及预测数据库查询将返回的中间结果数量,直接影响查询优化器对执行计划的选择。对于选择高效的连接顺序、决定是否使用索引以及选择最佳连接方法来说,准确的卡入
                    
                    9/3/2024 2:35:55 PM
                        故渊
                    美国加州通过人工智能训练数据透明度法案,要求企业披露 AI 模型数据来源
                        今日,美国加州立法机构通过了一项颇具争议的法案 —— 人工智能训练数据透明度法案,该法案将提交给州长加文・纽瑟姆,但其尚未对此法案表态。图源 Pexels该法案旨在要求人工智能公司在开发和训练模型时,对其使用的数据集进行更加透明的披露。AI在线注意到,这项由议员雅克・欧文提出的法案(AB 2013)原本适用范围更广,但在 8 月 20 日范围缩小至仅适用于生成式人工智能,即能生成文本、图像和类似内容的人工智能,例如 Open AI 的 ChatGPT 这类。该法案要求人工智能公司公开其训练模型的关键信息,如数据来源
                    
                    8/28/2024 2:35:06 PM
                        远洋
                    
        资讯热榜
    
    
                全新开源的DeepSeek-OCR,可能是最近最惊喜的模型!
        刚刚,ChatGPT终于可以走遍整个互联网了!OpenAI深夜炸街:原生ChatGPT集成、即时理解、主动执行,浏览器赛道鲨疯了
        告别抽卡!Vidu Q2多图参考生视频功能重磅上线
        最强OCR竟然不是DeepSeek、Paddle!HuggingFace新作:六大顶尖开源OCR模型横评!继DS后又杀出匹黑马!
        OpenAI首款ChatGPT浏览器发布!现在就能免费下载使用
        通义千问再放大招!Qwen3-VL 家族新增 2B 与 32B 模型,开源矩阵全面升级
        保姆级教程!教你用Coze工作流2分钟生成优质文章
        OpenAI 招募逾百名前投行人士训练 AI,目标干掉初级银行从业者的重复活
    
        标签云
    
    
                    
                    AI
                    
                    
                    人工智能
                    
                    
                    OpenAI
                    
                    
                    AIGC
                    
                    
                    模型
                    
                    
                    ChatGPT
                    
                    
                    DeepSeek
                    
                    
                    谷歌
                    
                    
                    AI绘画
                    
                    
                    机器人
                    
                    
                    数据
                    
                    
                    大模型
                    
                    
                    Midjourney
                    
                    
                    开源
                    
                    
                    Meta
                    
                    
                    智能
                    
                    
                    微软
                    
                    
                    用户
                    
                    
                    AI新词
                    
                    
                    GPT
                    
                    
                    学习
                    
                    
                    技术
                    
                    
                    智能体
                    
                    
                    马斯克
                    
                    
                    Gemini
                    
                    
                    图像
                    
                    
                    Anthropic
                    
                    
                    英伟达
                    
                    
                    AI创作
                    
                    
                    训练
                    
                    
                    LLM
                    
                    
                    论文
                    
                    
                    代码
                    
                    
                    算法
                    
                    
                    芯片
                    
                    
                    AI for Science
                    
                    
                    腾讯
                    
                    
                    Stable Diffusion
                    
                    
                    Agent
                    
                    
                    苹果
                    
                    
                    Claude
                    
                    
                    蛋白质
                    
                    
                    开发者
                    
                    
                    生成式
                    
                    
                    神经网络
                    
                    
                    xAI
                    
                    
                    机器学习
                    
                    
                    3D
                    
                    
                    人形机器人
                    
                    
                    研究
                    
                    
                    AI视频
                    
                    
                    生成
                    
                    
                    RAG
                    
                    
                    大语言模型
                    
                    
                    Sora
                    
                    
                    百度
                    
                    
                    具身智能
                    
                    
                    工具
                    
                    
                    GPU
                    
                    
                    华为
                    
                    
                    计算
                    
                    
                    字节跳动
                    
                    
                    AI设计
                    
                    
                    搜索
                    
                    
                    大型语言模型
                    
                    
                    AGI
                    
                    
                    视频生成
                    
                    
                    场景
                    
                    
                    深度学习
                    
                    
                    DeepMind
                    
                    
                    架构
                    
                    
                    生成式AI
                    
                    
                    视觉
                    
                    
                    编程
                    
                    
                    预测
                    
                    
                    Transformer
                    
                    
                    AI模型
                    
                    
                    伟达
                    
                    
                    特斯拉
                    
                    
                    Copilot
                    
        
     
                     
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                