AI在线 AI在线

人工智能

斯坦福打脸大模型数学水平:题干一改就集体降智,强如o1也失准,能力涌现怕不是检索题库

只是换一下数学题的变量名称,大模型就可能集体降智? ? 斯坦福大学最新研究表明,在他们最新提出的Putnam-AXIOM测试集上,仅仅是更换一下原题目的变量名称、变量取值范围,模型的准确率就直线下降。
1/6/2025 7:50:00 AM

全网都在扒的DeepSeek团队,是清北应届生撑起一片天

DeepSeek-v3大模型横空出世,以1/11算力训练出超过Llama 3的开源模型,震撼了整个AI圈。 紧接着,“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻,也使得人们把目光聚焦向DeepSeek的人才。 这下不只科技圈,全网都在好奇,连小红书上都有人发帖询问,这究竟是一只怎样的团队?
1/6/2025 7:45:00 AM

破解大模型隐私防线,华科清华联手实现微调数据90%精准识别

微调大模型的数据隐私可能泄露? 最近华科和清华的研究团队联合提出了一种成员推理攻击方法,能够有效地利用大模型强大的生成能力,通过自校正机制来检测给定文本是否属于大模型的微调数据集。 NeurIPS24论文 《Membership inference attacks against fine-tuned large language models via self-prompt calibration》,提出了一种基于自校正概率波动的成员推理攻击算法SPV-MIA,首次在微调大模型场景下将攻击准确度提高至90%以上。
1/6/2025 7:40:00 AM

AGI-Eval团队:AI视频生成模型年度横评,Sora大饼落地,但国产模型仍然领先!

说到2024年AI圈的热门话题,当然不能错过视频生成模型了! 即使是在12月,国内外视频模型的更新脚步依旧没有放缓。 其中以Sora、可灵AI为代表。
1/6/2025 7:30:00 AM

深度学习最佳 GPU,知多少?

众所周知,在深度学习领域,硬件选择的重要性不言而喻。 随着机器学习模型复杂性的不断提升,对高效计算的需求也在指数级增长。 图形处理单元(GPU,Graphics Processing Unit)凭借其强大的并行计算能力,成为应对深度学习挑战的理想硬件解决方案。
1/6/2025 5:00:00 AM
架构驿站

因广受网友嘲讽、不满,Meta 在 Facebook、Instagram 撤下大量“AI 账号”

Meta 公司已从 Facebook 和 Instagram 上撤下了大量 AI 生成的虚拟个人资料。这些 AI 角色在社交媒体上引发了广泛争议和嘲讽,该公司随后证实了这一决定。
1/4/2025 2:59:53 PM
清源

微软计划本财年砸下 800 亿美元,建设符合 AI 工作需求的数据中心

微软在博客文章中宣布了一项雄心勃勃的计划:在 2025 财年投资 800 亿美元(IT之家备注:当前约 5857.49 亿元人民币),用于建设能够支持人工智能运算需求的数据中心。
1/4/2025 7:14:25 AM
清源

北大、港理工革新性LiNo框架:线性与非线性模式有效分离,性能全面超越Transformer

本文的通讯作者为北京大学计算机学院长聘副教授杨仝和香港理工大学助理教授王淑君。 第一作者为香港理工大学 24 级博士生余国齐,以及联合作者北京大学 21 级软微学院博士生、每因智能创始人郭潇宇等。 研究工作在北京大学计算机学院数据结构实验室和每因智能发起的研究课题中完成。
1/3/2025 11:38:34 AM

多模态大语言模型空间智能新探索:仅需单张图片或一句话,就可以精准生成3D建模代码啦!

计算机辅助设计(CAD)已经成为许多行业设计、绘图和建模的标准方法。 如今,几乎每一个制造出来的物体都是从参数化 CAD 建模开始的。 CAD 构造序列是 CAD 模型表示的一种类型,不同于 Mesh 类型的三角网格、B-rep 格式的点、线、面表示,它被描述为一系列建模操作,包括确定草图 3D 起点和 3D 草图平面方向、绘制 2D 草图、将草图拉伸成 3D 实体形状的完整参数和过程,以 JSON 代码格式储存和表示。
1/3/2025 11:37:13 AM

揭示LLaMA 3对话能力的奥秘

过去的一年中,大模型技术得到了广泛认可,全行业对大模型的投入也在不断增加。 开源社区涌现了许多优秀的模型和框架,推动了大模型技术的普及和应用。 在这一年的时间里,LLaMA 系列模型也经历了快速的发展,从 LLaMA 2 到 LLaMA 3,我们看到了性能和应用上的显著提升。
1/3/2025 11:16:38 AM
greencoatman

当人工智能遇上市政债券市场:聊聊算法交易与AI预测

算法交易时至今日,“算法交易”一词已经被广泛使用。 但其真实含义却往往众说纷纭。 没关系,下面咱们就来捋捋这个概念的具体细节。
1/3/2025 8:00:00 AM

智象未来多模态大模型3.0全球首发,创始人兼CEO梅涛演讲实录来了

2024年12月28日,智象未来科技有限公司在安徽省人工智能产业先导区启动仪式中,宣布智象多模态生成大模型3.0与智象多模态理解大模型1.0同时发布。 上海电影集团、中国移动咪咕音乐、科大讯飞等企业参加。 加拿大工程院外籍院士、智象未来创始人兼CEO梅涛进行现场演讲。
1/2/2025 4:20:00 PM
新闻助手

Ebay 等警告:利用个人信息展开的诈骗邮件正在激增,AI 或为“帮凶”

这些工具还能抓取受害者的社交媒体和在线活动数据,锁定他们最容易回应的话题,帮助黑客批量生成量身定制的网络钓鱼骗局。
1/2/2025 3:37:40 PM
清源

“人工智能教父”辛顿公开支持马斯克起诉 OpenAI

本周一,由年轻人领导的全球倡导组织 Encode 向法院提交了一份支持埃隆・马斯克(Elon Musk)诉讼的法律意见书,试图阻止 OpenAI 的企业化转型。这一举措得到了人工智能领域重量级人物、诺贝尔奖和图灵奖得主杰弗里・辛顿(Geoffrey Hinton)的公开支持。
1/2/2025 3:16:58 PM
辰辰

2024年AI安全五大热点回顾

在ChatGPT推出两年后,生成式AI已成为网络安全领域的重要力量。 2024年生成式AI技术的影响无处不在,从深伪欺诈到“影子AI”的风险,再到AI安全法规的出现和AI驱动的漏洞研究潜力。 以下,我们将盘点过去一年AI与网络安全的五大热点话题。
1/2/2025 1:10:56 PM
佚名

2024年人工智能的发展趋势

回顾2024年的人工智能领域,我们可以观察到一系列显著的趋势,特别是人工智能助手的广泛应用、人工智能代理的兴起,以及企业在选择人工智能解决方案时所面临的挑战与考量。 以下是对行业专家Derek Topp关于这些趋势的深入解读。 一、人工智能助手的快速发展在2024年,我们见证了无数供应商竞相发布新产品,旨在创建、部署和维护基于通用人工智能(GenAI)的代理。
1/2/2025 11:39:32 AM
Harris编译

多模态长文档新基准来了!20多项任务覆盖理解推理定位,GPT-4o也就刚及格

GPT-4o仅得分64.5,其余模型均未及格! 全面、细粒度评估模型多模态长文档理解能力的评测集来了~名为LongDocURL,集成了长文档理解、数值推理和跨元素定位三个主任务,并包含20个细分子任务。 LongDocURL主打多模态、长上下文,专注于篇幅在50~150页的英文文档,平均页数和文档标记数分别为85.6和43622.6。
1/2/2025 11:01:45 AM

艾维·维格森、杰弗里·辛顿、汤晓鸥……盘点2024那些站在AI背后的科学家

2024年,人工智能的发展势头异常迅猛。 这一年,GPT-4o、Sora、o1以及最近的DeepSeek V3等广为大众所知的重大突破相继发布,每一次都引发了广泛的讨论热潮,也让Sam Altman、黄仁勋、马斯克等业界领袖频频登上媒体热搜榜。 但在科研领域,还有一群鲜为大众所知、但在业内享有极高赞誉,却一直默默耕耘为AI进步贡献力量的科学家,同样值得铭记。
1/2/2025 10:23:00 AM
新闻助手