论文
如何训练最强代码大模型?北大aiXcoder-7B贡献前沿实践
本文的通讯作者是北京大学计算机学院长聘教授李戈。 本文一作是 aiXcoder 蒋思源和北大李戈教授课题组博士生李佳,团队重点关注融合深度学习与软件工程的代码建模方法。 如何训练一个代码大模型?
2/12/2025 1:34:40 PM
机器之心
本科生推翻姚期智40年前的猜想,哈希表的平均查询时间竟与填满程度无关
1985 年,著名计算机科学家、图灵奖得主姚期智提出了一个与哈希表有关的猜想。 现在,40 年过去了,一名本科生却成功推翻了这个猜想。 而这项成就却源自一个始于 2021 年秋的故事。
2/11/2025 11:17:30 AM
机器之心
AI伪造论文渗透学术圈:Google Scholar成虚假科学温床,如何应对?
编辑 | 1984随着生成式 AI 技术的普及,学术界正面临着一个新的挑战:越来越多疑似由 AI 生成的研究论文正在渗透到学术期刊、档案库和知识库中。 这些论文通常借助 ChatGPT 等普及型 AI 应用来模仿学术写作风格,其危害不容忽视。 作为广受欢迎的学术搜索引擎,Google Scholar 在展示搜索结果时,并未区分这些可疑论文与经过严格质量把关的研究成果。
1/22/2025 6:27:00 PM
ScienceAI
41%博士后逃生学术界,顶刊PNAS揭残酷真相!名校光环背后曝职业危机
去年,随着LLM产品化和工程化的发展,工业界的研究岗迅速缩减,许多AI博士面临巨大的就业压力,纷纷表示后悔读博。 工业界机会稀少,学术界同样问题重重。 为此,有的博士生甚至转行去当了主播。
1/22/2025 3:14:57 PM
新智元
2025年AAAI Fellow名单出炉!港科大(广州)熊辉等四位华人学者入选
2025年AAAI Fellow名单火热出炉! 其中四位华人学者获选。 每年,AAAI通过其Fellow计划表彰一批在人工智能领域做出重大、持续贡献的个人。
1/17/2025 11:07:28 AM
新智元
495篇参考文献!北交大清华等高校发布多语言大模型综述
虽然大模型取得突破性进展,但其在多语言场景下仍具有局限性,存在很大的改善空间。 那么,大模型多语言能力到底什么水平? 其发展又存在什么样的挑战?
1/16/2025 5:08:38 PM
量子位
姚期智团队开源新型注意力,节省90%内存不降性能,一个框架统一MHA/MQA/GQA
新型注意力机制TPA,姚期智院士团队打造。 TPA对每个token做动态的张量分解,不存储完整的静态KV,而是保留分解的版本,内存占用节省90%(或者更多),而不会牺牲性能。 论文中还证明了流行的MHA、MQA、GQA都是TPA的特殊情况,用一个框架统一了现代注意力设计。
1/16/2025 9:20:00 AM
量子位
厦门大学联合网易提出StoryWeaver,可根据统一模型内给定的角色实现高质量的故事可视化
本文经AIGC Studio公众号授权转载,转载请联系出处。 厦门大学联合网易提出StoryWeaver,可以根据统一模型内给定的角色实现高质量的故事可视化。 可根据故事文本生成与之匹配的图像,并且确保每个角色在不同的场景中保持一致。
1/7/2025 9:30:00 AM
Jinlu Zhang等
陶哲轩自述被拒稿是常事,「大牛名字」不是通行证!
著名数学家、菲尔兹奖得主陶哲轩在个人社交网站上分享了自己被拒稿的经历,出发点是有人曾表示「陶哲轩被拒稿」很不可思议,但其实自己每年都会被拒稿。 拒稿事件在经过几天发酵后,登上了Hacker News热榜:让网友感到惊奇的是,原来「大牛名字」也不保中,进而引发了关于「审稿制度」合理性的讨论。 下面是陶哲轩发布的原文:今天我投稿的一篇论文被期刊拒绝了,他们礼貌地回信说虽然他们觉得这篇论文有趣,但并不适合他们的期刊。
1/6/2025 8:00:00 AM
新智元
o1 pro深评博士医学论文,震惊顶尖免疫学家!2分破解神秘作家身份
圣诞马拉松的第一天,OpenAI对外发布了o1 pro。 近乎全网都震惊于o1 pro高达博士水平的数学、科学、编程能力。 最近,OpenAI总裁Greg Brockman在X上转发了世界顶尖免疫学专家Derya Unutmaz的帖子。
12/30/2024 11:00:00 AM
新智元
芝大、清华团队分析了6800万份论文表明,AI可能会降低科学家的创造力?
编辑 | 白菜叶一项新研究表明,采用人工智能工具分析数据和建模结果对年轻科学家的职业前景有着巨大的影响,大大增加了他们在各自领域晋升到有影响力职位的机会。 但这种对个体研究人员的利好似乎以牺牲科学为代价。 芝加哥大学和清华大学的研究人员分析了六个科学学科(生物学、医学、化学、物理学、材料学和地质学,不包括计算机科学)的近 6800 万份研究论文,发现融入人工智能技术的论文被引用的次数更多,但同时也集中在更窄的主题上,而且重复性更强。
12/19/2024 6:43:00 PM
ScienceAI
NeurIPS 2024最佳论文开奖!北大字节NUS夺冠,Ilya连续三年获奖
刚刚,NeurIPS 2024最佳论文放榜了! 不出所料,今年两篇最佳论文分别颁给了北大字节团队,和新加坡国立大学Sea AI Lab团队。 除此之外,大会还公布了「数据集与基准」赛道的最佳论文,以及主赛道最佳论文奖委员会,数据集和基准赛道最佳论文奖委员会。
12/11/2024 3:00:00 PM
揭秘注意力机制真正起源!10年前3项研究几乎同时独立提出,背后故事细节被Karpathy晒邮件公开了
大模型的核心组件注意力机制,究竟如何诞生的? 可能已经有人知道,它并非2017年Transformer开山论文《Attention is all you need》首创,而是来自2014年Bengio实验室的另一篇论文。 现在,这项研究背后更多细节被公开了!
12/5/2024 9:00:00 AM
量子位
ICLR审稿集体搞抽象!评审结果写半句,还有的求ta也不审,网友:科研人自己的春晚
今天,ICLR 2025的discussion phase的ddl已经截止。 回看过去14天的讨论过程,可太精彩了! 各大平台上随手一翻就是作者们的吐槽大会,都在无语这届ICLR评审的各种奇葩乱象。
12/4/2024 2:50:00 PM
量子位
多个中国团队斩获EMNLP'24最佳论文!UCLA华人学者中三篇杰出论文,明年顶会落户苏州
刚刚,EMNLP 2024最佳论文奖新鲜出炉! 5篇中榜论文中,华人学者参与三篇,分别来自CMU、上海交通大学、中国科学院大学等机构。 其中,Pretraining Data Detection for Large Language Models: A Divergence-based Calibration Method主要由中科院网络数据科学与技术重点实验、中国科学院大学的学者完成。
11/15/2024 2:00:00 PM
量子位
昆仑万维发布天工 AI 高级搜索功能,升级分析推理、金融 / 科研能力
感谢昆仑万维天工 AI 今日发布最新版本的 AI 高级搜索功能,迎来四个方面的升级:全面升级多层次分析推理能力升级的金融投资专业 AI 搜索升级的科研学术专业 AI 搜索针对文档 AI 阅读分析的智能优化全面升级多层次分析推理能力在处理复杂任务时,天工 AI 推理能力支持难题拆解 自动规划 主动扩展 深度回答 图文交织。 智能搜索 Agent 把复杂的难题拆解为多个简单的问题,自动规划路径,一边思考一边执行。 自研大模型搜索 Agent,面对用户输入的问题,能够模拟人的思考和推理过程,自动生成任务规划并逐步完成预设任务路径,并在每一步检查任务的执行情况,确保最终结果的准确性。
11/5/2024 11:10:25 AM
汪淼
AI 驱动的「科学搜索引擎」如何加速你的课题进度
编辑 | 白菜叶人工智能 (AI) 工具正在改变我们的工作方式。许多产品试图通过帮助研究人员整理大量文献来提高科学研究的效率。这些科学搜索引擎基于大型语言模型 (LLM),旨在筛选现有研究论文并总结关键发现。
10/15/2024 3:49:00 PM
ScienceAI
顶会卷到中学:人大附中吴悠上榜 NeurIPS,入选高中赛道 Spotlight
NeurIPS 2024 放榜,人大附中有高中生一作入选。今年,NeurIPS 率先把 AI 顶会卷到了高中里,正式面向高中生征集论文,还为此专门设置了高中生赛道(High School Projects Track)。现在结果终于出炉,北京大学计算机学院的张铭教授分享了一则入围消息:人大附中吴悠,有一篇一作论文入选该赛道,还被选为了 Spotlight Project。论文题为《Vision-Braille:An End-to-End Tool for Chinese Braille Image-to-Text
9/29/2024 12:45:39 PM
汪淼
资讯热榜
全新开源的DeepSeek-OCR,可能是最近最惊喜的模型!
AI 模型“炒股”比拼!DeepSeek 收益超14%,Gemini2.5Pro 惨亏四成
具身智能学界业界思想「惊人的统一」?美团在IROS开了个学术年会
OpenAI强化Sora 2保护政策,确保艺人声音与肖像权不被侵犯
刚刚,ChatGPT终于可以走遍整个互联网了!OpenAI深夜炸街:原生ChatGPT集成、即时理解、主动执行,浏览器赛道鲨疯了
OpenAI首款ChatGPT浏览器发布!现在就能免费下载使用
Andrej Karpathy评DeepSeek-OCR论文:图像输入可能成为大语言模型新方向
告别抽卡!Vidu Q2多图参考生视频功能重磅上线
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
芯片
腾讯
AI for Science
Stable Diffusion
苹果
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
研究
AI视频
生成
大语言模型
RAG
百度
具身智能
Sora
工具
GPU
华为
计算
字节跳动
AI设计
搜索
大型语言模型
AGI
视频生成
场景
深度学习
DeepMind
架构
视觉
生成式AI
预测
Transformer
编程
AI模型
伟达
特斯拉
Copilot