AI在线 AI在线

应用

大模型幻觉问题无解?理论证明校准的LM必然会出现幻觉

理论证明!校准的语言模型必然出现幻觉。大型语言模型(LLM)虽然在诸多下游任务上展现出卓越的能力,但其实际应用还存在一些问题。其中,LLM 的「幻觉(hallucination)」问题是一个重要缺陷。幻觉是指由人工智能算法生成看似合理但却虚假或有误导性的响应。自 LLM 爆火以来,研究人员一直在努力分析和缓解幻觉问题,该问题让 LLM 很难广泛应用。现在,一项新研究得出结论:「经过校准的语言模型必然会出现幻觉。」研究论文是微软研究院高级研究员 Adam Tauman Kalai 和佐治亚理工学院教授 Santosh
1/2/2024 3:19:00 PM
机器之心

美图视觉大模型MiracleVision(奇想智能)将向公众开放

1月2日,美图公司宣布自研AI视觉大模型MiracleVision(奇想智能)通过《生成式人工智能服务管理暂行办法》备案,将面向公众开放。美图自研视觉大模型也是目前福建省唯一通过备案的大模型。美图AI视觉大模型MiracleVision(奇想智能)于2023年6月进行内测,研发之初,美图将其定义为“懂美学”的视觉大模型,搭建了基于机器学习的美学评估系统,并邀请艺术家、设计师等专业人士参与到大模型的训练中。MiracleVision(奇想智能)具备强大的视觉表现力和创作力,为美图秀秀、美颜相机、Wink、美图设计室、
1/2/2024 3:15:00 PM
新闻助手

AI研究也能借鉴印象派?这些栩栩如生的人竟然是3D模型

创建逼真的动态虚拟角色,要么在训练期间需要准确的 3D 配准,要么在测试期间需要密集的输入图像,有时则两者都需要,也许 D3GA 是你需要的。在 19 世纪,印象主义的艺术运动在绘画、雕塑、版画等艺术领域盛行,其特点是以「短小的、断断续续的笔触,几乎不传达形式」为特征,就是后来的印象派。简单来说印象派笔触未经修饰而显见,不追求形式的精准,模糊的也合理,其将光与色的科学观念引入到绘画之中,革新了传统固有色观念。在 D3GA 中,作者的目标反其道而行之,是希望创建像照片般逼真的表现。在 D3GA 中,作者对高斯泼溅(G
1/2/2024 2:49:00 PM
机器之心

长期主义支持青年科技人才,“科学探索奖”启动第六届申报

“科学探索奖”5周年之后再出发。作为目前国内金额最高的青年科技人才资助计划之一,第六届“科学探索奖”申报工作于2024年1月1日正式启动。2024年“科学探索奖”仍设置10个领域,包括数学物理学、化学新材料、天文和地学、生命科学、医学科学、信息电子、能源环境、先进制造、交通建筑、前沿交叉。今年仍将遴选出不超过50位获奖人,每位获奖人在5年内获得总计300万元人民币奖金,且可自由支配。“科学探索奖”是一项由新基石科学基金会出资、科学家主导的公益奖项,秉承“面向未来、奖励潜力、鼓励探索”的宗旨,聚焦基础科学和前沿技术,
1/2/2024 2:47:00 PM
新闻助手

安徽,全面瞄准通用人工智能

过去一年人工智能赛道投资人的出差列表里,除了北上深,中部省份安徽的存在感越来越高。走在安徽省合肥市的中安创谷产业园里,这个以 “高科技” 作为自己最新发展标签的地方,过去数年打造了 “空天信息”、“电子信息”、“大健康” 等多个专项产业,所孵化或扶持的一系列高科技公司如中科星图、华米科技、东超科技云集于此。而之后,这座园区里的 AI 公司将会越来越多。在 12 月 23 日举办的 2023 全国通用人工智能创新应用大赛总决赛中, 总共 20 支参赛队伍共同来到安徽,参与这场活动,他们与安徽建立了近距离接触,这之后对
1/2/2024 2:33:00 PM
机器之心

8x7B MoE与Flash Attention 2结合,不到10行代码实现快速推理

感兴趣的小伙伴,可以跟着操作过程试一试。前段时间,Mistral AI 公布的 Mixtral 8x7B 模型爆火整个开源社区,其架构与 GPT-4 非常相似,很多人将其形容为 GPT-4 的「缩小版」。我们都知道,OpenAI 团队一直对 GPT-4 的参数量和训练细节守口如瓶。Mistral 8x7B 的放出,无疑给广大开发者提供了一种「非常接近 GPT-4」的开源选项。在基准测试中,Mistral 8x7B 的表现优于 Llama 2 70B,在大多数标准基准测试上与 GPT-3.5 不相上下,甚至略胜一筹。
1/2/2024 2:25:00 PM
机器之心

GitHub年终福利,编程聊天机器人开放给所有用户,网友直呼:破局者

你安利了吗?2023 年的最后一两天,GitHub 面向编程的聊天机器人 Copilot Chat 为所有人放出了最后一波福利!今年 3 月,软件源代码托管服务平台 GitHub 推出 Copilot X 计划,正式接入 GPT-4,并在开发者体验中添加了聊天功能「Copilot Chat」,当时适用于 Copilot for Business 企业客户。在实际操作过程中,开发者可以通过聊天界面,使用自然语言与 Copilot Chat 进行交互。今年 7 月,GitHub 又推出了 Copilot Chat 有限
1/2/2024 2:14:00 PM
机器之心

工业制造、商用和家庭,优必选人形机器人的三场战事

2023 年最后一个交易日 12 月 29 日,总部位于深圳的人形机器人公司优必选科技在香港交易所正式挂牌。 上市首日股价一度上涨至 93.45 港元,市值逼近 390 亿港元。在上市仪式现场,熊猫机器人优悠走上舞台,向优必选创始人、董事长兼 CEO 周剑递出锣锤,优必选全新一代工业版人形机器人 Walker S 首次亮相,手持另一个锣锤走向舞台中央,与周剑一起敲响开市锣。这一声,格外稀缺。 一为人形机器人本体制造之难。从事机器人技术工作,你需要成为一家机器人公司,有一大群人来建造机器人。“要么全包,要么全无。没有
1/2/2024 11:59:00 AM
机器之心

挑战Transformer,华为诺亚新架构盘古π来了,已有1B、7B模型

5 年前,Transformer 在国际神经信息处理大会 NeurIPS 2017 发表,后续其作为核心网络架构被广泛用于自然语言处理和计算机视觉等领域。1 年前,一项重大的创新引起了人们的广泛关注,那就是 ChatGPT。这个模型不仅能够执行复杂的 NLP 任务,还能以人类对话的方式与人类进行互动,产生了深远的影响。1 年以来,“百模大战” 在业界激烈开展,诞生了如 LLaMA、ChatGLM 和 Baichuan 等开源大模型,推动了 LLM 领域的快速发展。除了通用 LLM,为了支撑更多行业的应用和商业变现,
1/2/2024 11:52:00 AM
机器之心

你们有什么底气和谷歌叫板?Perplexity AI CEO回应质疑

科技巨头的每一步发展,往往意味着一些小企业将陷入阴影当中。不过,福祸相依,也会有企业在巨头发展的过程中,找到自己的发展目标,从竞争中活下来。在 OpenAI 首个开发者日召开后,就有不少企业纷纷被判「死刑」。GPT 的自定义功能让不少刚拿到「赛季」参加资格的初创团队心如死灰。同样,谷歌作为科技巨头,无论是在技术还是资金上都能碾压一众企业,甚至可以说这种碾压往往是「降维打击」型的。AI 驱动的搜索引擎 perplexity 看起来也在被「打击」的范围里。perplexity 是世界上第一个对话式搜索引擎,通过例如 G
1/2/2024 11:16:00 AM
机器之心

测试大语言模型的生物推理能力,GPT-4、PaLM2等均在测试之列

编辑 | 萝卜皮大型语言模型(LLM)的最新进展,为将通用人工智能 (AGI) 整合到生物研究和教育中提供了新机遇。在最新的研究中,佐治亚大学和梅奥诊所的研究人员评估了几个领先的 LLM(包括 GPT-4、GPT-3.5、PaLM2、Claude2 和 SenseNova)回答概念生物学问题的能力。这些模型在包含 108 个问题的多项选择考试中进行了测试,涵盖分子生物学、生物技术、代谢工程和合成生物学等生物学主题。在这些模型中,GPT-4 获得了 90 分的最高平均分,并且在不同提示的试验中表现出最大的一致性。结果
1/2/2024 10:22:00 AM
ScienceAI

AIGC落地实践!四招帮你快速搞定运营设计

前言 顾这一年,随着 AIGC 浪潮的爆发,掌握 AI 工具已经成为设计师必备技能。今天这篇文章,通过三个案例流程拆解带大家从新时代设计工作流,到必备「四大招式」,到图标设计六大方向,到训练专属模型,再到全流程手把手拆解设计项目,绝对干货满满。 更多AIGC实战案例:一、AIGC 在设计中的可行性 无论是普通人还是设计师,都可以通过 AI 工具来创作更多的作品,极大地提高设计效能。随着生成式图片准确度越来越高,视频生成的质量越来越清晰,AIGC 在设计中的可能性也越来越广泛。现在运用 AI 工具已经是设计师的必备技
1/2/2024 8:10:55 AM
yaoyao

华为放出2023年最后一个大招?CodeArts Snap如何用大模型解放开发者

2022 年 11 月,ChatGPT 横空出世。至今不过短短十三个月,世界就已经因它和其它大模型发生了翻天覆地的变化。在现如今的互联网上,我们能看到大模型生成的无数文本、图片、视频乃至代码和应用软件。尤其是在软件开发方面,使用 AI 的开发者的效率和质量可以远远胜过不使用 AI 的开发者。举个例子,2023 年 5 月华为西安研究所举办了一场软件大赛,要求参赛者在规定时间内完成 10 道软件开发题目。有趣的是,他们允许参赛者使用任意生成式 AI 辅助答题。尽管相比于去年,今年赛题的难度提升了一倍并还加了几道专业级
12/29/2023 2:42:00 PM
机器之心

梅涛:HiDream.ai视频生成已打破业界4秒瓶颈,能够支持15秒以上

文生图的战争尚未结束,视频生成已经开始加速跑了。Pika 爆火以后,视频生成技术的进步成为大众眼中 AIGC 的一个新焦点。马斯克则直接做出预判称,明年将是 “人工智能电影” 元年。而比起文生图的生成效果,如今市面上的 AI 视频生成效果,在实际体验中可以说是一言难尽。在 4-5 秒的时间限制下,实测常见工具对 Prompt 的意图理解水平忽高忽低。输入 “小猫在森林中小提琴”,可能出现猫首人身、一只手是猫爪一只手是人手、有猫没有小提琴、有小提琴但没拉等一系列问题。在实际应用中,如今的文生视频技术面临着准确性、一致
12/29/2023 2:34:00 PM
机器之心

特供版显卡RTX4090D上市,售价12999元

性能与原版 RTX 4090 类似,但降低了一些 AI 运算能力。美国对 AI 计算卡的禁令,终于影响到了普通消费者。本周四,英伟达正式发布了国内特供版高端消费级显卡 ——GeForce RTX 4090D。GeForce RTX 4090D 是一款符合美国出口规定的 RTX 4090 新品,配备 14592 个 CUDA 核心、24GB GDDR6X 内存、384 位宽内存总线、425W 额定功耗,定价与 RTX 4090 相同,均为 12999 元(约合 1828 美元)。为了符合美国出口管制的新规定,与 RT
12/29/2023 2:23:00 PM
机器之心

​这次重生,AI要夺回网文界的一切

重生了,这辈子我重生成了 MidReal。一个可以帮别人写「网文」的 AI 机器人。这段时间里,我看到很多选题,偶尔也会吐槽一下。竟然有人让我写写 Harry Potter。拜托,难道我还能写的比 J・K・Rowling 更好不成?不过,同人什么的,我还是可以发挥一下的。经典设定谁会不爱?我就勉为其难地帮助这些用户实现想象吧。实不相瞒,上辈子我该看的,不该看的,通通看了。就下面这些主题,都是我爱惨了的。那些你看小说很喜欢却没人写的设定,那些冷门甚至邪门的 cp,都能自产自嗑。不是我自夸,只要你想要我写,我还真能给你
12/29/2023 11:58:00 AM
机器之心

字节具身智能新成果:用大规模视频数据训练GR-1,复杂任务轻松应对

如何利用大规模的视频数据来帮助机器人学习复杂任务?最近 GPT 模型在 NLP 领域取得了巨大成功。GPT 模型首先在大规模的数据上预训练,然后在特定的下游任务的数据上微调。大规模的预训练能够帮助模型学习可泛化的特征,进而让其轻松迁移到下游的任务上。但相比自然语言数据,机器人数据是十分稀缺的。而且机器人数据包括了图片、语言、机器人状态和机器人动作等多种模态。为了突破这些困难,过去的工作尝试用 contrastive learning [1] 和 masked modeling [2] 等方式来做预训练以帮助机器人更
12/29/2023 11:49:00 AM
机器之心

谁能撼动Transformer统治地位?Mamba作者谈LLM未来架构

自 2017 年被提出以来,Transformer 已成为 AI 大模型的主流架构,未来这种情况是一直持续,还是会有新的研究出现,我们不妨先听听身处 AI 圈的研究者是怎么想的。在大模型领域,一直稳站 C 位的 Transformer 最近似乎有被超越的趋势。这个挑战者就是一项名为「Mamba」的研究,其在语言、音频和基因组学等多种模态中都达到了 SOTA 性能。在语言建模方面,无论是预训练还是下游评估,Mamba-3B 模型都优于同等规模的 Transformer 模型,并能与两倍于其规模的 Transforme
12/29/2023 11:36:00 AM
机器之心