大型语言模型(LLM)
字节跳动推出 QuaDMix:大型语言模型预训练数据质量与多样性的统一框架
                        近日,字节跳动宣布推出其全新的数据选择框架 QuaDMix,旨在提升大型语言模型(LLM)预训练的效率和泛化能力。 众所周知,模型的训练效果受基础数据集的质量和多样性影响很大。 然而,传统的数据筛选方法往往将质量和多样性视为两个独立的目标,先进行质量过滤,再进行领域平衡。
                    
                    4/28/2025 10:01:33 AM
                        AI在线
                    微软MarkItDown MCP,可把Word、Excel等转换成markdown格式
                        在数字化时代,如何有效地处理文档信息已经成为了许多行业中的一个热门话题。 而今,微软推出的 MarkItDown MCP(Model Context Protocol)将文档处理提升到了一个新的高度!想象一下,您只需简单几步,就能将各种格式的文件(如 PDF、Word、PowerPoint 等)轻松转换为 Markdown 格式,为您的文本分析和大型语言模型(LLM)应用提供无缝支持。 更为惊艳的是,MarkItDown 不仅保持了文档的结构与内容,更能实现信息的高效传递。
                    
                    4/21/2025 11:00:46 AM
                        AI在线
                    字节跳动研究开源 ChatTS-14B:原生理解并随着时间的推移进行推理
                        字节跳动研究团队宣布开源 ChatTS-14B,这是一款专为时间序列数据理解和推理设计的140亿参数大型语言模型(LLM)。 以 Apache2.0许可协议发布,ChatTS-14B 的开源引发了 AI 社区的广泛关注,被认为是时间序列分析与生成式 AI 结合的重大进展。 ChatTS-14B:时间序列的智能对话引擎ChatTS-14B 基于 Qwen2.5-14B-Instruct 模型进行微调,专为处理时间序列数据而设计,能够理解和推理复杂的时序数据模式。
                    
                    4/21/2025 10:00:57 AM
                        AI在线
                    LMArena正式成立公司,致力于提供中立的AI评估平台
                        近日,备受关注的人工智能评估平台 LMArena 宣布将成立一家新公司,名为 Arena Intelligence Inc.,以便为未来的项目改进提供更强大的资源。 LMArena 的创始团队在博客中表示,新公司的成立将帮助他们在保持中立的同时,增强大型语言模型(LLM)测试平台的功能,致力于为 AI 用户提供一个不受任何企业影响的公平评估环境。 LMArena 于2023年由加州大学伯克利分校的研究人员创建,迅速发展成为业内最受认可的 AI 基准测试平台之一。
                    
                    4/18/2025 11:01:57 AM
                        AI在线
                    DroidRun正式开源,LLM驱动Android手机自动化控制新突破
                        近日,一个名为DroidRun的开源项目引发了广泛关注。 该项目通过大型语言模型(LLM)实现自然语言指令控制Android手机,为用户提供了前所未有的自动化体验。 从社交媒体管理到日常任务自动化,DroidRun展示了AI在移动设备交互领域的巨大潜力。
                    
                    4/17/2025 11:01:15 AM
                        AI在线
                    英伟达AI研究人员推出FFN融合技术:加速大型语言模型推理
                        人工智能芯片巨头英伟达的研究人员近日发布了一项名为“FFN融合”(FFN Fusion)的创新架构优化技术。 该技术旨在通过解决Transformer架构中固有的串行计算瓶颈,显著提升大型语言模型(LLMs)的推理效率,为更广泛地部署高性能AI应用铺平道路.近年来,大型语言模型在自然语言处理、科学研究和对话代理等领域展现出强大的能力。 然而,随着模型规模和复杂性的不断增加,其推理过程所需的计算资源也大幅增长,导致了效率瓶颈。
                    
                    3/31/2025 1:48:00 PM
                        AI在线
                    告别AI“一本正经”!Midjourney联手NYU解锁创意文本新维度,多样性飙升23%!
                        Midjourney 和纽约大学的研究人员近日联手开发出一种创新方法,旨在显著提升语言模型生成创意文本的多样性,同时将质量损失控制在最低限度。 这项发表在最新研究论文中的技术,核心在于将“偏差指标”引入人工智能的训练过程。 其运作原理是通过量化每个生成的文本与针对同一提示创建的其他文本之间的差异。
                    
                    3/30/2025 10:34:00 AM
                        AI在线
                    小模型助力法律行业,LexisNexis 推出 AI 助手 Protégé
                        法律研究公司 LexisNexis 最近推出了一款名为 Protégé 的 AI 助手,旨在为、助理和法律专员提供支持。 Protégé 的主要功能是帮助用户撰写和校对法律文件,并确保引用的内容在诉状和简中是准确的。 LexisNexis 希望打造一款不仅仅是通用的法律 AI 助手,而是能够学习各个法律事务所的工作流程并提供定制化服务的智能助手。
                    
                    3/21/2025 4:14:00 PM
                        AI在线
                    报道称阿里云全新 “T 项目” 启动,推进下一代 AI 技术研发
                        据《科创板日报》,阿里云启动了名为 “T 项目” 的新计划,旨在加速下一代 AI 技术的研发。 该项目将专注于多个前沿领域,包括 AI 引擎、大型语言模型(LLM)和多模态技术等,期望通过这些技术的突破,满足日益增长的市场需求。 “T 项目” 的启动意味着阿里云在 AI 领域布局的进一步加深。
                    
                    3/17/2025 4:47:00 PM
                        AI在线
                    谷歌Gemini 2.0 Flash放出原生图像生成功能:支持多轮对话式实时编辑编辑
                        继Gemma3之后,谷歌又给我们带来了一位“闪电侠”——Gemini2.0Flash,而且人家这次是带着独门绝技来的:原生图像生成!  要知道,以前的AI图像生成,很多时候都是大型语言模型(LLM)先理解你的文字,然后再把意思“翻译”给专门生成图像的扩散模型。  这中间难免会有些“失真”,就像隔着好几个人传话,最后意思都变味儿了。
                    
                    3/13/2025 9:50:00 AM
                        AI在线
                    LLMs.txt生成器 v2发布:网站文本转换速度提升10倍
                        近日,LLMs.txt生成器迎来重大升级,正式推出v2版本。 这一工具能够将任何网站内容快速转化为可供人工智能代理或大型语言模型(LLM)使用的文本文件,为AI应用的开发者和使用者带来了极大便利。 新版本由@firecrawl_dev团队开发,并得到其官方llmstxt端点的全力支持,相较于上一代,处理速度提升了惊人的10倍。
                    
                    3/12/2025 10:53:00 AM
                        AI在线
                    仅用四周时间!富士康推出中文大语言模型FoxBrain
                        富士康旗下的鸿海研究院近日发布了一款全新的传统中文大型语言模型(LLM)——FoxBrain。 这一模型的推出引起了业界的广泛关注,标志着在中文人工智能领域的一次重要进展。 FoxBrain 的训练过程在短短四周内完成,展示了强大的技术能力和高效的研发速度。
                    
                    3/10/2025 2:17:00 PM
                        AI在线
                    - 1
        资讯热榜
    
    
                LangChain V1.0 深度解析:手把手带你跑通全新智能体架构
        OpenAI 宣布印度用户可享受一年免费 ChatGPT Go 服务
        微软AI主管苏莱曼:微软不会开发情色类AI,与OpenAI划清界限
        消息称软银批准对 OpenAI 追加 225 亿美元投资,助力未来上市
        软银豪掷225亿美元加码OpenAI,AI音乐与超级融资计划全面提速
        OpenAI进军音乐创作领域,携手茱莉亚学院学生打造全新AI音乐模型
        Transformer 之父“叛逃”:我已经受够了 Transformer!警告:AI研究变得越来越窄,我们需要找到新的架构
        全网刷屏的「电影感」三宫格图片,教你用AI快速生成!
    
        标签云
    
    
                    
                    AI
                    
                    
                    人工智能
                    
                    
                    OpenAI
                    
                    
                    AIGC
                    
                    
                    模型
                    
                    
                    ChatGPT
                    
                    
                    DeepSeek
                    
                    
                    谷歌
                    
                    
                    AI绘画
                    
                    
                    机器人
                    
                    
                    大模型
                    
                    
                    数据
                    
                    
                    Midjourney
                    
                    
                    开源
                    
                    
                    Meta
                    
                    
                    智能
                    
                    
                    微软
                    
                    
                    用户
                    
                    
                    AI新词
                    
                    
                    GPT
                    
                    
                    学习
                    
                    
                    技术
                    
                    
                    智能体
                    
                    
                    马斯克
                    
                    
                    Gemini
                    
                    
                    图像
                    
                    
                    Anthropic
                    
                    
                    英伟达
                    
                    
                    AI创作
                    
                    
                    训练
                    
                    
                    LLM
                    
                    
                    论文
                    
                    
                    代码
                    
                    
                    算法
                    
                    
                    Agent
                    
                    
                    AI for Science
                    
                    
                    芯片
                    
                    
                    苹果
                    
                    
                    腾讯
                    
                    
                    Stable Diffusion
                    
                    
                    Claude
                    
                    
                    蛋白质
                    
                    
                    开发者
                    
                    
                    生成式
                    
                    
                    神经网络
                    
                    
                    xAI
                    
                    
                    机器学习
                    
                    
                    3D
                    
                    
                    RAG
                    
                    
                    人形机器人
                    
                    
                    研究
                    
                    
                    AI视频
                    
                    
                    生成
                    
                    
                    大语言模型
                    
                    
                    具身智能
                    
                    
                    Sora
                    
                    
                    工具
                    
                    
                    GPU
                    
                    
                    百度
                    
                    
                    华为
                    
                    
                    计算
                    
                    
                    字节跳动
                    
                    
                    AI设计
                    
                    
                    AGI
                    
                    
                    大型语言模型
                    
                    
                    搜索
                    
                    
                    视频生成
                    
                    
                    场景
                    
                    
                    深度学习
                    
                    
                    架构
                    
                    
                    生成式AI
                    
                    
                    DeepMind
                    
                    
                    编程
                    
                    
                    视觉
                    
                    
                    Transformer
                    
                    
                    预测
                    
                    
                    AI模型
                    
                    
                    伟达
                    
                    
                    亚马逊
                    
                    
                    MCP
                    
        
     
                     
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                