大型语言模型(LLM)
字节跳动推出 QuaDMix:大型语言模型预训练数据质量与多样性的统一框架
近日,字节跳动宣布推出其全新的数据选择框架 QuaDMix,旨在提升大型语言模型(LLM)预训练的效率和泛化能力。 众所周知,模型的训练效果受基础数据集的质量和多样性影响很大。 然而,传统的数据筛选方法往往将质量和多样性视为两个独立的目标,先进行质量过滤,再进行领域平衡。
4/28/2025 10:01:33 AM
AI在线
微软MarkItDown MCP,可把Word、Excel等转换成markdown格式
在数字化时代,如何有效地处理文档信息已经成为了许多行业中的一个热门话题。 而今,微软推出的 MarkItDown MCP(Model Context Protocol)将文档处理提升到了一个新的高度!想象一下,您只需简单几步,就能将各种格式的文件(如 PDF、Word、PowerPoint 等)轻松转换为 Markdown 格式,为您的文本分析和大型语言模型(LLM)应用提供无缝支持。 更为惊艳的是,MarkItDown 不仅保持了文档的结构与内容,更能实现信息的高效传递。
4/21/2025 11:00:46 AM
AI在线
字节跳动研究开源 ChatTS-14B:原生理解并随着时间的推移进行推理
字节跳动研究团队宣布开源 ChatTS-14B,这是一款专为时间序列数据理解和推理设计的140亿参数大型语言模型(LLM)。 以 Apache2.0许可协议发布,ChatTS-14B 的开源引发了 AI 社区的广泛关注,被认为是时间序列分析与生成式 AI 结合的重大进展。 ChatTS-14B:时间序列的智能对话引擎ChatTS-14B 基于 Qwen2.5-14B-Instruct 模型进行微调,专为处理时间序列数据而设计,能够理解和推理复杂的时序数据模式。
4/21/2025 10:00:57 AM
AI在线
LMArena正式成立公司,致力于提供中立的AI评估平台
近日,备受关注的人工智能评估平台 LMArena 宣布将成立一家新公司,名为 Arena Intelligence Inc.,以便为未来的项目改进提供更强大的资源。 LMArena 的创始团队在博客中表示,新公司的成立将帮助他们在保持中立的同时,增强大型语言模型(LLM)测试平台的功能,致力于为 AI 用户提供一个不受任何企业影响的公平评估环境。 LMArena 于2023年由加州大学伯克利分校的研究人员创建,迅速发展成为业内最受认可的 AI 基准测试平台之一。
4/18/2025 11:01:57 AM
AI在线
DroidRun正式开源,LLM驱动Android手机自动化控制新突破
近日,一个名为DroidRun的开源项目引发了广泛关注。 该项目通过大型语言模型(LLM)实现自然语言指令控制Android手机,为用户提供了前所未有的自动化体验。 从社交媒体管理到日常任务自动化,DroidRun展示了AI在移动设备交互领域的巨大潜力。
4/17/2025 11:01:15 AM
AI在线
英伟达AI研究人员推出FFN融合技术:加速大型语言模型推理
人工智能芯片巨头英伟达的研究人员近日发布了一项名为“FFN融合”(FFN Fusion)的创新架构优化技术。 该技术旨在通过解决Transformer架构中固有的串行计算瓶颈,显著提升大型语言模型(LLMs)的推理效率,为更广泛地部署高性能AI应用铺平道路.近年来,大型语言模型在自然语言处理、科学研究和对话代理等领域展现出强大的能力。 然而,随着模型规模和复杂性的不断增加,其推理过程所需的计算资源也大幅增长,导致了效率瓶颈。
3/31/2025 1:48:00 PM
AI在线
告别AI“一本正经”!Midjourney联手NYU解锁创意文本新维度,多样性飙升23%!
Midjourney 和纽约大学的研究人员近日联手开发出一种创新方法,旨在显著提升语言模型生成创意文本的多样性,同时将质量损失控制在最低限度。 这项发表在最新研究论文中的技术,核心在于将“偏差指标”引入人工智能的训练过程。 其运作原理是通过量化每个生成的文本与针对同一提示创建的其他文本之间的差异。
3/30/2025 10:34:00 AM
AI在线
小模型助力法律行业,LexisNexis 推出 AI 助手 Protégé
法律研究公司 LexisNexis 最近推出了一款名为 Protégé 的 AI 助手,旨在为、助理和法律专员提供支持。 Protégé 的主要功能是帮助用户撰写和校对法律文件,并确保引用的内容在诉状和简中是准确的。 LexisNexis 希望打造一款不仅仅是通用的法律 AI 助手,而是能够学习各个法律事务所的工作流程并提供定制化服务的智能助手。
3/21/2025 4:14:00 PM
AI在线
报道称阿里云全新 “T 项目” 启动,推进下一代 AI 技术研发
据《科创板日报》,阿里云启动了名为 “T 项目” 的新计划,旨在加速下一代 AI 技术的研发。 该项目将专注于多个前沿领域,包括 AI 引擎、大型语言模型(LLM)和多模态技术等,期望通过这些技术的突破,满足日益增长的市场需求。 “T 项目” 的启动意味着阿里云在 AI 领域布局的进一步加深。
3/17/2025 4:47:00 PM
AI在线
谷歌Gemini 2.0 Flash放出原生图像生成功能:支持多轮对话式实时编辑编辑
继Gemma3之后,谷歌又给我们带来了一位“闪电侠”——Gemini2.0Flash,而且人家这次是带着独门绝技来的:原生图像生成! 要知道,以前的AI图像生成,很多时候都是大型语言模型(LLM)先理解你的文字,然后再把意思“翻译”给专门生成图像的扩散模型。 这中间难免会有些“失真”,就像隔着好几个人传话,最后意思都变味儿了。
3/13/2025 9:50:00 AM
AI在线
LLMs.txt生成器 v2发布:网站文本转换速度提升10倍
近日,LLMs.txt生成器迎来重大升级,正式推出v2版本。 这一工具能够将任何网站内容快速转化为可供人工智能代理或大型语言模型(LLM)使用的文本文件,为AI应用的开发者和使用者带来了极大便利。 新版本由@firecrawl_dev团队开发,并得到其官方llmstxt端点的全力支持,相较于上一代,处理速度提升了惊人的10倍。
3/12/2025 10:53:00 AM
AI在线
仅用四周时间!富士康推出中文大语言模型FoxBrain
富士康旗下的鸿海研究院近日发布了一款全新的传统中文大型语言模型(LLM)——FoxBrain。 这一模型的推出引起了业界的广泛关注,标志着在中文人工智能领域的一次重要进展。 FoxBrain 的训练过程在短短四周内完成,展示了强大的技术能力和高效的研发速度。
3/10/2025 2:17:00 PM
AI在线
- 1
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
Gemini
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
DeepMind
特斯拉