大型语言模型(LLM)
字节跳动推出 QuaDMix:大型语言模型预训练数据质量与多样性的统一框架
近日,字节跳动宣布推出其全新的数据选择框架 QuaDMix,旨在提升大型语言模型(LLM)预训练的效率和泛化能力。 众所周知,模型的训练效果受基础数据集的质量和多样性影响很大。 然而,传统的数据筛选方法往往将质量和多样性视为两个独立的目标,先进行质量过滤,再进行领域平衡。
4/28/2025 10:01:33 AM
AI在线
微软MarkItDown MCP,可把Word、Excel等转换成markdown格式
在数字化时代,如何有效地处理文档信息已经成为了许多行业中的一个热门话题。 而今,微软推出的 MarkItDown MCP(Model Context Protocol)将文档处理提升到了一个新的高度!想象一下,您只需简单几步,就能将各种格式的文件(如 PDF、Word、PowerPoint 等)轻松转换为 Markdown 格式,为您的文本分析和大型语言模型(LLM)应用提供无缝支持。 更为惊艳的是,MarkItDown 不仅保持了文档的结构与内容,更能实现信息的高效传递。
4/21/2025 11:00:46 AM
AI在线
字节跳动研究开源 ChatTS-14B:原生理解并随着时间的推移进行推理
字节跳动研究团队宣布开源 ChatTS-14B,这是一款专为时间序列数据理解和推理设计的140亿参数大型语言模型(LLM)。 以 Apache2.0许可协议发布,ChatTS-14B 的开源引发了 AI 社区的广泛关注,被认为是时间序列分析与生成式 AI 结合的重大进展。 ChatTS-14B:时间序列的智能对话引擎ChatTS-14B 基于 Qwen2.5-14B-Instruct 模型进行微调,专为处理时间序列数据而设计,能够理解和推理复杂的时序数据模式。
4/21/2025 10:00:57 AM
AI在线
LMArena正式成立公司,致力于提供中立的AI评估平台
近日,备受关注的人工智能评估平台 LMArena 宣布将成立一家新公司,名为 Arena Intelligence Inc.,以便为未来的项目改进提供更强大的资源。 LMArena 的创始团队在博客中表示,新公司的成立将帮助他们在保持中立的同时,增强大型语言模型(LLM)测试平台的功能,致力于为 AI 用户提供一个不受任何企业影响的公平评估环境。 LMArena 于2023年由加州大学伯克利分校的研究人员创建,迅速发展成为业内最受认可的 AI 基准测试平台之一。
4/18/2025 11:01:57 AM
AI在线
DroidRun正式开源,LLM驱动Android手机自动化控制新突破
近日,一个名为DroidRun的开源项目引发了广泛关注。 该项目通过大型语言模型(LLM)实现自然语言指令控制Android手机,为用户提供了前所未有的自动化体验。 从社交媒体管理到日常任务自动化,DroidRun展示了AI在移动设备交互领域的巨大潜力。
4/17/2025 11:01:15 AM
AI在线
英伟达AI研究人员推出FFN融合技术:加速大型语言模型推理
人工智能芯片巨头英伟达的研究人员近日发布了一项名为“FFN融合”(FFN Fusion)的创新架构优化技术。 该技术旨在通过解决Transformer架构中固有的串行计算瓶颈,显著提升大型语言模型(LLMs)的推理效率,为更广泛地部署高性能AI应用铺平道路.近年来,大型语言模型在自然语言处理、科学研究和对话代理等领域展现出强大的能力。 然而,随着模型规模和复杂性的不断增加,其推理过程所需的计算资源也大幅增长,导致了效率瓶颈。
3/31/2025 1:48:00 PM
AI在线
告别AI“一本正经”!Midjourney联手NYU解锁创意文本新维度,多样性飙升23%!
Midjourney 和纽约大学的研究人员近日联手开发出一种创新方法,旨在显著提升语言模型生成创意文本的多样性,同时将质量损失控制在最低限度。 这项发表在最新研究论文中的技术,核心在于将“偏差指标”引入人工智能的训练过程。 其运作原理是通过量化每个生成的文本与针对同一提示创建的其他文本之间的差异。
3/30/2025 10:34:00 AM
AI在线
小模型助力法律行业,LexisNexis 推出 AI 助手 Protégé
法律研究公司 LexisNexis 最近推出了一款名为 Protégé 的 AI 助手,旨在为、助理和法律专员提供支持。 Protégé 的主要功能是帮助用户撰写和校对法律文件,并确保引用的内容在诉状和简中是准确的。 LexisNexis 希望打造一款不仅仅是通用的法律 AI 助手,而是能够学习各个法律事务所的工作流程并提供定制化服务的智能助手。
3/21/2025 4:14:00 PM
AI在线
报道称阿里云全新 “T 项目” 启动,推进下一代 AI 技术研发
据《科创板日报》,阿里云启动了名为 “T 项目” 的新计划,旨在加速下一代 AI 技术的研发。 该项目将专注于多个前沿领域,包括 AI 引擎、大型语言模型(LLM)和多模态技术等,期望通过这些技术的突破,满足日益增长的市场需求。 “T 项目” 的启动意味着阿里云在 AI 领域布局的进一步加深。
3/17/2025 4:47:00 PM
AI在线
谷歌Gemini 2.0 Flash放出原生图像生成功能:支持多轮对话式实时编辑编辑
继Gemma3之后,谷歌又给我们带来了一位“闪电侠”——Gemini2.0Flash,而且人家这次是带着独门绝技来的:原生图像生成! 要知道,以前的AI图像生成,很多时候都是大型语言模型(LLM)先理解你的文字,然后再把意思“翻译”给专门生成图像的扩散模型。 这中间难免会有些“失真”,就像隔着好几个人传话,最后意思都变味儿了。
3/13/2025 9:50:00 AM
AI在线
LLMs.txt生成器 v2发布:网站文本转换速度提升10倍
近日,LLMs.txt生成器迎来重大升级,正式推出v2版本。 这一工具能够将任何网站内容快速转化为可供人工智能代理或大型语言模型(LLM)使用的文本文件,为AI应用的开发者和使用者带来了极大便利。 新版本由@firecrawl_dev团队开发,并得到其官方llmstxt端点的全力支持,相较于上一代,处理速度提升了惊人的10倍。
3/12/2025 10:53:00 AM
AI在线
仅用四周时间!富士康推出中文大语言模型FoxBrain
富士康旗下的鸿海研究院近日发布了一款全新的传统中文大型语言模型(LLM)——FoxBrain。 这一模型的推出引起了业界的广泛关注,标志着在中文人工智能领域的一次重要进展。 FoxBrain 的训练过程在短短四周内完成,展示了强大的技术能力和高效的研发速度。
3/10/2025 2:17:00 PM
AI在线
- 1
资讯热榜
智谱AI全新企业级超级助手Agent CoCo正式上线
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
ChatGPT 语音功能升级,实时翻译对话更自然流畅
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊