大语言模型
多样任务真实数据,大模型在线购物基准Shopping MMLU开源|NeurIPS&KDD Cup 2024
谁是在线购物领域最强大模型? 也有评测基准了。 基于真实在线购物数据,电商巨头亚马逊终于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU,用以评估大语言模型在在线购物领域的能力与潜力。
11/20/2024 12:17:59 PM
Nature:「人类亲吻难题」难倒 LLM,所有大模型全部失败
Nature 上的一项研究,全面驳斥了 LLM (大语言模型)具有类人推理能力的说法。研究者设定的「人类亲吻难题」把 7 个大模型彻底绕晕。最终研究者表示,与其说 LLM 是科学理论,不如说它们更接近工具,比如广义导数。
11/16/2024 6:21:58 PM
清源
谷歌Gemini咒骂学生凸显AI失控风险
随着AI技术的迅猛发展,大语言模型应用(例如谷歌的Gemini和OpenAI的ChatGPT)已逐渐融入日常生活,帮助人们完成作业、解答各种问题。 然而,最近的一起事件再次引发了对AI模型潜在风险的广泛关注。 Gemini咒骂学生去死近日,一位Reddit学生用户分享了一段与Google聊天机器人Gemini的对话,令人不寒而栗。
11/15/2024 1:09:41 PM
佚名
SMoA: 基于稀疏混合架构的大语言模型协同优化框架
在大语言模型(LLM)快速发展的背景下,研究者们越来越关注如何通过多代理系统来增强模型性能。 传统的多代理方法虽然避免了大规模再训练的需求,但仍面临着计算效率和思维多样性的挑战。 本文提出的稀疏代理混合(Sparse Mixture-of-Agents, SMoA)框架,通过借鉴稀疏专家混合(Sparse Mixture-of-Experts, SMoE)的设计理念,有效解决了这些问题。
11/13/2024 2:37:30 PM
佚名
三款出色的无代码LLM应用程序构建神器
译者 | 布加迪审校 | 重楼通过轻松地挑选和丢弃组件并连接组件来构建LLM应用程序,比如矢量存储区、web搜索、存储内容和自定义提示等组件。 许多商业人士和非技术人士向我询问如何在缺乏技术知识的情况下构建AI应用程序。 我总是告诉他们,市面上有许多非代码解决方案,它们易于使用,可以帮助他们为公司中的任何人构建原型并部署解决方案。
11/8/2024 9:53:01 AM
布加迪
借助LLM实现模型选择和试验自动化
译者 | 布加迪审校 | 重楼大语言模型(LLM)已成为一种工具,从回答问题到生成任务列表,它们在许多方面简化了我们的工作。 如今个人和企业已经使用LLM来帮助完成工作。 代码生成和评估最近已经成为许多商业产品提供的重要功能,以帮助开发人员处理代码。
11/7/2024 8:03:10 AM
布加迪
AI Agent智能代理如何快速变现
AI Agent,即人工智能代理,是一种能够感知环境、进行自主理解、决策和执行动作的智能实体。 它基于大语言模型,能够通过独立思考、调用工具来逐步完成给定目标的计算机程序。 AI Agent的核心在于其自主性和自适应性,在特定任务或领域中能够自主地进行学习和改进。
11/5/2024 4:47:27 PM
天涯咫尺TGH
重大突破!AI首次发现内存安全漏洞
近日,谷歌宣布其大语言模型(LLM)项目“Big Sleep”成功发现了一个SQLite数据库引擎中的内存安全漏洞,这是人工智能首次在真实软件中发现可利用的内存安全漏洞(且该漏洞无法通过传统的模糊测试检测到)。 AI首次发现内存安全漏洞谷歌的“Project Naptime”项目旨在评估LLM在进攻性安全研究方面的能力,后来该项目演变为“Big Sleep”,由谷歌Project Zero和DeepMind团队共同参与。 Big Sleep项目致力于探索AI在发现软件漏洞中的潜力,特别关注高危漏洞的检测与利用。
11/5/2024 2:48:57 PM
佚名
RAG新突破:块状注意力机制实现超低延迟检索增强
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
11/3/2024 1:31:00 PM
机器之心
北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
9/15/2024 1:41:00 PM
机器之心
讲座预约 | AI4S 的前世今生:大语言模型与提示学习在科技研发中的应用与潜力丨GAIR Live
尽管人工智能驱动科学研究(AI4S)是最近几年才逐步火热的一个话题,但在某些科研领域如生物信息学,早在上个世纪90年代,随着人类基因组计划的实施,生物信息学迎来了一个“数据大爆炸”的时代,从那时起,生物信息学领域研究者就开始尝试使用人工智能技术来助力科研工作,直至今天。 在过去几年中,大模型技术作为人工智能的一个重要分支,已经从理论研究的深奥殿堂走向了实践应用的广阔天地,从实验室的封闭空间走向了我们日常生活的各个角落。 在生物信息学、材料科学、药物发现等领域,大模型技术正在发挥着越来越重要的作用。
9/12/2024 9:25:00 AM
岑大师
华为云发布医疗健康解决方案,盘古大模型赋能五大医药健康场景
8 月 10 日,华为云医药健康 AI 高峰论坛在海南博鳌拉开帷幕。华为云副总裁(战略与产业发展部 总裁)黄瑾在会上表示,国家政策对生物医药持续加码,医药健康企业也纷纷增加科研创新投入,但与国际先进水平相比仍有差距,尤其是在创新药研发上。然而,国内人工智能的快速发展为医药健康提供了可以赶超的新契机。华为云副总裁(战略与产业发展部 总裁)黄瑾“华为云拥有全栈自主的 AI 创新能力,我们希望和医药健康行业的客户一起努力,打造出中国自己的享誉国际的医药品牌,一起为人类健康谋福祉,推动中国医药健康产业发展。” 黄瑾表示。A
8/12/2024 3:37:00 PM
新闻助手
华为云用盘古大模型重塑服务,ModelArts Studio全面升级
6 月 21 日,华为开发者大会 2024 在东莞召开。在大会现场,华为发布了 HarmonyOS Next、盘古大模型 5.0 等方面的最新进展,也介绍了一系列 AI 先进技术的应用案例。在活动中,华为云 CTO 张宇昕表示:“华为云基于盘古大模型的能力,重塑一系列的云服务,打造 AI Native 的云,助力千行万业智能化。” 据介绍,华为云将盘古大模型和华为在产品研发、数据治理、安全防护、业务运维等各个领域积累的数据和经验相结合,“跳了自己的降落伞”,应用在了华为云 CodeArts、DataArts、Met
6/21/2024 7:57:00 PM
新闻助手
答案抽取正确率达96.88%,xFinder断了大模型「作弊」的小心思
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文第一作者和通讯作者均来自上海算法创新研究院。其中,通讯作者李志宇博士毕业于中国人民大学计算机专业,并曾在阿里巴巴、小红书等互联网公司从事算法落地与研究工作,曾参与了包括千亿级商品知识图
6/17/2024 2:59:00 PM
机器之心
总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述
大语言模型(Large Language Models, LLMs)在过去两年内迅速发展,涌现出一些现象级的模型和产品,如 GPT-4、Gemini、Claude 等,但大多数是闭源的。研究界目前能接触到的大部分开源 LLMs 与闭源 LLMs 存在较大差距,因此提升开源 LLMs 及其他小模型的能力以减小其与闭源大模型的差距成为了该领域的研究热点。LLM 的强大能力,特别是闭源 LLM,使得科研人员和工业界的从业者在训练自己的模型时都会利用到这些大模型的输出和知识。这一过程本质上是知识蒸馏(Knowledge,
3/18/2024 11:09:00 AM
机器之心
对话上交苏剑波教授:直面手语的「方言」多样性与系统「通用性」挑战|GAIR live
作为上海交通大学自动化系的资深教授,苏剑波坚守着一条科研信条:研究工作需源源不断地注入活力。 他曾阐释这一理念:“一个研究者在踏入某一科学领域时,应选取一个能够长期深耕、并随着理论及技术进步而能不断更新研究内容的主题,这才是研究者始终能保持学术活力的根本原因。 ”苏教授的研究领域覆盖了智能机器人理论与技术、多传感器信息与智能融合、机器学习与人机交互等科学研究持续的热点领域。
3/15/2024 5:20:00 PM
吴彤
专访上海大学倪兰教授:语言学与手语识别技术的融合突破,解锁交流障碍|GAIR live
在语言学的广阔天地中,手语研究曾是一片未被充分开垦的荒地。 上海大学的倪兰教授,作为中国大陆培养的第一位「手语语言学」方向博士,在谈到自己选择手语方向时仍忍不住感慨,“往前推二十年,语言学界几乎无人涉足这一领域。 ”然而,时光流转至今,这一领域的现状是否得到了改善?
3/14/2024 10:00:00 AM
吴彤
资讯热榜
昆仑万维面向全球发布天工超级智能体Skywork Super Agents
超多案例!让 Lovart 作图更好看更高效的提示词在这里了!
Flowith NEO发布!全球首款无限步骤、上下文与工具的AI Agent
昆仑万维天工超级智能体发布!AI Office革命来袭,Deep Research碾压OpenAI,成本仅40%!
谷歌发布Flow AI剪辑工具:Veo3 与Imagen4 驱动、镜头控制与场景扩展
告别“单打独斗”!AI 协作新范式 MoA,如何集结大模型“梦之队”?
字节跳动开源多模态模型 BAGEL:图文生成与编辑的新突破
Google搜索推出AI Mode实验,探索全新智能问答体验
标签云
人工智能
AI
OpenAI
AIGC
ChatGPT
模型
DeepSeek
AI绘画
机器人
数据
谷歌
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
芯片
英伟达
生成式
蛋白质
开发者
腾讯
Anthropic
神经网络
研究
3D
计算
Sora
机器学习
AI设计
AI for Science
生成
苹果
GPU
AI视频
搜索
华为
场景
百度
训练
人形机器人
Claude
预测
伟达
xAI
深度学习
Transformer
大语言模型
智能体
字节跳动
模态
文本
具身智能
神器推荐
Copilot
驾驶
LLaMA
视觉
API
算力
应用
安全
干货合集
工具
大型语言模型
视频生成
Agent