AI在线 AI在线

资讯列表

机器教学入门指南

什么是机器教学?尽管人工智能(AI)已在许多行业得到广泛应用,但根据麻省理工学院斯隆管理学院的研究,只有不到10%的采用人工智能的企业真正实现了预期的商业收益。 要从人工智能中真正获益,企业必须找到将人类与机器紧密结合的方式,这一概念被称为“组织学习”。 具体而言,许多企业在初期应用人工智能时,通常会选择那些已经具备大量可用数据且容易训练模型的低难度场景,比如客户支持分流、社交媒体情感分析以及市场营销中的客户细分等。
11/19/2024 3:07:07 PM
Thoughtworks洞见

AI重塑医疗保健领域的消费者体验中的潜力、挑战与策略

AI驱动的解决方案能够从以往难以获取的数据中挖掘出有价值的见解,并以前所未有的规模实现消费者互动和个性化服务,从而提升医疗行业的业务成果。 在快速变化的医疗领域,AI有潜力重塑消费者与医疗服务的互动方式。 如今,美国的消费者在寻找合适的保险覆盖、了解何时应就医、就医费用以及如何管理自身健康等方面面临诸多困难。
11/19/2024 3:01:31 PM
Jenny Cordina

北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超越闭源模型

北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。 在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。 新模型具体如何推理,直接上实例,比如问题是:减去所有的小亮球和紫色物体,剩下多少个物体?
11/19/2024 3:00:00 PM
量子位

Mistral 发布 Pixtral Large 多模态 AI 模型:登顶复杂数学推理,图表 / 文档推理超过 GPT-4o

Mistral AI 公司昨日(11 月 18 日)发布公告,宣布了全新的多模态 AI 模型 Pixtral Large。该模型拥有 1240 亿参数,基于 Mistral Large 2,主要用于处理文本和图片。
11/19/2024 2:57:21 PM
故渊

多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开

作为欧洲的OpenAI,Mistral最近压力不小。 端侧小模型端不出来,对比评测的结果又遭到质疑。 上个月震撼登场的自家首款多模态大模型Pixtral 12B,也疑似遇到了成绩不如人的窘境。
11/19/2024 2:40:00 PM
新智元

阿里通义千问发布 Qwen2.5-Turbo 开源 AI 模型:支持 100 万 tokens 上下文,处理时间缩短至 68 秒

阿里通义千问昨日(11 月 18 日)发布博文,宣布在经过数月的优化和打磨后,针对社区中对更长上下文长度(Context Length)的要求,推出了 Qwen2.5-Turbo 开源 AI 模型。
11/19/2024 2:18:29 PM
故渊

对话华为云马会彬:AI原生应用变革,本质上是一场「从1到 0」的创新

嘉宾 | 马会彬编辑 | 云昭 出品 | 51CTO技术栈(微信号:blog51cto)进入2024年,业界对于生成式AI的注意力开始转向应用层。 AI编程领域的Cursor、AI生成视频领域的可灵、自动驾驶领域的Robotaxi等,都取得了很大的突破。 据有关媒体报道,2024年创投界在AI应用层上的投资规模整体超过了模型层。
11/19/2024 2:13:31 PM
云昭

使用Pytorch构建视觉语言模型(VLM)

视觉语言模型(Vision Language Model,VLM)正在改变计算机对视觉和文本信息的理解与交互方式。 本文将介绍 VLM 的核心组件和实现细节,可以让你全面掌握这项前沿技术。 我们的目标是理解并实现能够通过指令微调来执行有用任务的视觉语言模型。
11/19/2024 1:17:38 PM
Achraf Abbaoui

新AI模型提高与疾病相关基因组学的预测能力

为了了解DNA与疾病的关系,美国洛斯阿拉莫斯国家实验室的科学家开发了第一个多模态深度学习模型EPBDxDNABERT-2,该模型能够利用DNA“呼吸”,即双螺旋结构自发打开和关闭,来确定转录因子(调节基因活动的蛋白质)之间的精确关系。 该模型有可能帮助设计用于治疗源于基因活性疾病的药物。 与DNA链结合的转录因子蛋白的表示洛斯阿拉莫斯国家实验室研究员、该论文的第一作者Anowarul Kabir说:“转录因子有很多种,人类基因组的规模大得令人生畏。
11/19/2024 1:13:54 PM
AI情报室

高通的自研架构芯片,正在整合生成式AI世界

生成式 AI 的驱动力,就在这块「至尊」芯片上? 身处 2024 年末的我们,已经能感觉到大模型就在身边。 新一代的旗舰手机上,动态壁纸、AI 画图、语音通话总结等功能一字排开,常用功能也有了新技术加持。
11/19/2024 1:01:00 PM
机器之心

LLM为何频频翻车算术题?研究追踪单个神经元,「大脑短路」才是根源

由于缺少对运行逻辑的解释,大模型一向被人称为「黑箱」,但近来的不少研究已能够在单个神经元层面上解释大模型的运行机制。 例如Claude在2023年发表的一项研究,将大模型中大约500个神经元分解成约4000个可解释特征。 而10月28日的一项研究,以算术推理作为典型任务,借鉴类似的研究方法,确定了大模型中的一个模型子集,能解释模型大部分的基本算术逻辑行为。
11/19/2024 12:53:50 PM
新智元

发力了,Mistral对标ChatGPT全面升级le Chat,还祭出超大杯多模态模型

一觉醒来,Mistral AI 又发力了。 就在今天,Mistral AI 多模态家族迎来了第二位成员:一个名为 Pixtral Large 的超大杯基础模型。 这是一个基于 Mistral Large 2 构建、124B 开放权重的多模态模型,具备顶尖的图像理解能力 —— 能够看懂文档、图表和自然图像,同时保持 Mistral Large 2 领先的纯文本理解能力。
11/19/2024 12:53:00 PM
机器之心

大模型承重墙,去掉了就开始摆烂!苹果给出了「超级权重」

去掉一个「超权重」的影响,比去掉其他 7000 个离群值权重加起来还要严重。 大模型的参数量越来越大,越来越聪明,但它们也越来越奇怪了。 两年前,有研究者发现了一些古怪之处:在大模型中,有一小部分特别重要的特征(称之为「超权重」),它们虽然数量不多,但对模型的表现非常重要。
11/19/2024 12:48:00 PM
机器之心

取人类与大模型之长,人机协作式智能软件开发框架AgileGen来了

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
11/19/2024 12:43:00 PM
机器之心

面向代码语言模型的安全性研究全新进展,南大&NTU联合发布全面综述

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
11/19/2024 12:37:00 PM
机器之心

消息称腾讯杰出科学家、混元大模型技术负责人之一刘威离职

今年 9 月,他还在 2024 外滩新媒体年会上发表了题为《生成式 AI 的发展与腾讯混元大模型的实践》的主旨演讲。(AI 前线)
11/19/2024 12:33:09 PM
汪淼

英伟达发布新 AI 硬件:H200 NVL PCIe GPU 和 GB200 NVL4 超级芯片

H200 NVL 是此前 H200 SXM 的 PCIe AIC 降频版本;GB200 NVL4 超级芯片规模相当于 2 组单 CPU + 双 GPU 的 GB200 Grace Blackwell 超级芯片。
11/19/2024 12:25:06 PM
溯波(实习)

研究发现ChatGPT在疾病诊断方面优于医生

随着AI技术的飞速发展,其在医疗保健领域的应用也日益广泛。 近期,一项由波士顿贝斯以色列女执事医疗中心(BethIsrael Deaconess Medical Center)的研究团队发表在《美国医学会网络开放》(JAMA Network . Open)上的研究,引发了广泛关注。
11/19/2024 12:21:45 PM
Gina Kolata