AI在线 AI在线

语言

用户提问方式影响AI模型准确性,简洁回答易导致错误信息

近期,法国人工智能研究机构 Giskard 进行了一项关于语言模型的研究,结果表明,当用户要求简短回答时,许多语言模型更可能生成错误或误导性的信息。 该研究使用了多语言的 Phare 基准测试,专注于模型在现实使用环境中的表现,尤其是它们所产生的 “幻想” 现象。 幻想指的是模型产生虚假或误导性内容的情况,而先前的研究显示,这一问题占据了大型语言模型所有记录事件的三分之一以上。
5/12/2025 10:01:12 AM
AI在线

UGMathBench动态基准测试数据集发布 可评估语言模型数学推理能力

近日,魔搭ModelScope社区宣布发布一项名为UGMathBench的动态基准测试数据集,旨在全面评估语言模型在本科数学广泛科目中的数学推理能力。 这一数据集的问世,填补了当前在本科数学领域评估语言模型推理能力的空白,并为研究者提供了更为丰富和具有挑战性的测试平台。 随着人工智能技术的飞速发展,自然语言模型在自动翻译、智能客服、医疗、金融等多个领域展现出巨大潜力。
5/10/2025 11:00:51 AM
AI在线

Meta FAIR最新五大AI感知突破:从3D对象定位到协作推理,开源助力产业升级

Meta人工智能研究团队(FAIR)近日公开发布五项前沿研究成果,标志着AI感知领域的重大突破。 这些开源项目从视觉编码器到3D空间理解,再到协作式推理框架,共同构建了通向高级机器智能(AMI)的关键路径,为未来AI如何理解和感知世界带来全新可能。 "机器之眼"再升级:Meta感知编码器引领视觉理解新标准Meta感知编码器(Perception Encoder)作为大规模视觉编码器,在图像和视频处理领域显示出卓越能力,成为AI系统的"眼睛"。
5/9/2025 12:01:52 PM
AI在线

阿里通义Qwen3语言模型上线 ,开源实力再升级!

在全球人工智能领域,Qwen 系列大型语言模型迎来了新成员 ——Qwen3的发布。 今日,通义宣布将 Qwen3开源,带来了令人振奋的技术革新。 此次发布的旗舰模型 Qwen3-235B-A22B 以其2350亿个参数的规模在多个基准测试中展现出强大的竞争力,超越了 DeepSeek-R1、o1、o3-mini、Grok-3及 Gemini-2.5-Pro 等顶级模型。
5/6/2025 6:00:51 PM
AI在线

微软 Azure 将支持马斯克的 Grok AI,谷歌也在测试 AI 搜索新模式

在人工智能领域的持续快速发展中,近日有消息称微软的 Azure 云平台将会托管马斯克的 Grok AI 模型。 这一消息引发了业内广泛关注,特别是在 AI 技术日益成为企业和社会各个层面的重要工具的背景下。 Grok AI 是一款旨在提供智能辅助的 AI 工具,能够帮助用户更高效地处理信息和做出决策。
5/3/2025 11:00:47 AM
AI在线

​谷歌推出个性化语言学习 AI 工具,助你轻松掌握新语言

谷歌宣布推出三项新的人工智能实验,旨在帮助用户以更个性化的方式学习语言。 虽然这些实验尚处于初期阶段,但它们显示出谷歌可能正在试图与 Duolingo 等语言学习平台竞争,这些工具得益于谷歌的多模态大语言模型 Gemini。 第一个实验名为 “微型课程(Tiny Lesson)”,旨在帮助用户快速学习特定短语,以应对实际情境。
4/30/2025 3:00:51 PM
AI在线

NotebookLM音频概览新增多语言支持 中文音频表现亮眼

2025 年 4 月 30 日 - AIbase报道:谷歌旗下AI研究助手NotebookLM迎来重大更新,其音频概述(Audio Overviews)功能现已支持超过 50 种语言,其中包括备受期待的中文音频支持。 这一突破性进展得益于谷歌Gemini模型的原生音频处理能力,为全球用户提供了更便捷的多语言学习与内容创作体验。 多语言支持打破语言壁垒NotebookLM的音频概述功能自 2024 年 9 月推出以来,以其将上传文档转化为类似播客的生动讨论而广受好评。
4/30/2025 9:01:01 AM
AI在线

GenAI遇上SLM:边缘计算的新纪元

小型语言模型(SLM)在效率、隐私和适应性之间实现了卓越的平衡,使其成为各种应用的理想选择。 译自GenAI Meets SLMs: A New Era for Edge Computing,作者 Pankaj Mendki。 让我们想象一个场景:一家医院的患者拥有自己的医疗记录。
4/3/2025 4:21:00 AM
岱军

一文详尽大型语言模型的四种量化技术

大型语言模型(比如ChatGPT背后的技术)确实非常"庞大"——这不仅指它们的能力,更直接体现在它们的体积上。 一个中等规模的模型就可能占用几十GB的内存,相当于几百部高清电影的大小。 对于普通开发者、个人研究者或初创公司来说,这样的资源需求无疑是一道难以跨越的门槛。
3/27/2025 2:44:00 AM
云朵君

蛋白质设计新纪元:语言模型驱动的 5 亿年进化模拟

在生命科学的浩瀚星空中,蛋白质一直是最为璀璨的研究焦点之一。 近期,一项由 Thomas Hayes 等众多学者共同完成的研究成果 —— 利用语言模型模拟 5 亿年蛋白质进化,在《Science》杂志重磅发表,如同一颗超新星爆发,瞬间照亮了整个领域,为蛋白质研究开启了全新的篇章。 一、ESM3 模型架构揭秘ESM3 模型作为此项研究的核心成果,无疑是一座闪耀着创新光芒的科学丰碑。
2/4/2025 11:11:07 AM
tune
  • 1