AI在线 AI在线

资讯列表

ICLR 2025|大模型也需要好奇心,TeleAI 提出探索驱动的对齐方法,8B越级胜70B

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
1/30/2025 7:40:00 PM
机器之心

UC 伯克利等最新研究:大语言模型就是比人类啰嗦,“提问的艺术”仍难参透

不过由大模型给出的考题,和人类出的题目究竟有没有差别,以及有哪些差别?
1/30/2025 7:26:29 PM
清源

调查显示:美国青少年对大型科技公司的信任正在下降

Common Sense的调查发现,64%的青少年表示不相信大型科技公司会关心他们的心理健康,62%的青少年认为这些公司若涉及到利润问题,就不会保证他们的安全。
1/30/2025 5:55:14 PM
清源

印度启动创建本土 AI 基础模型计划:目标训出“有文化特色”的模型

“我们已经构建了框架,并今天正式启动。我们的核心目标是开发能够反映印度本土语境和文化的人工智能模型。”
1/30/2025 4:40:20 PM
清源

大模型训练开销还能更小:微软推出首个 FP4 训练框架,训练效果与 BF16 相当

首个 FP4 精度的大模型训练框架来了,来自微软研究院!在相同超参数的设置下,可以达到与 FP8 以及 BF16 相当的训练效果。
1/30/2025 2:52:31 PM
清源

David Baker 利用 AI 设计蛋白质,一招制蛇毒,或将彻底改变蛇咬治疗

编辑丨&蛇中毒是一种严重的个人健康威胁,每年导致约 10 万人死亡和 30 万人永久残疾,尤其是在医疗资源匮乏的地区。 目前的抗蛇毒血清主要依赖于动物血浆提取的多克隆抗体,存在成本高、副作用大、对某些毒素效果有限等问题。 今年诺贝尔化学奖得主 David Baker 团队的一项研究揭示了蛇咬伤治疗可能改变游戏规则。
1/30/2025 12:03:00 PM
ScienceAI

股东施压苹果:要求其公开 AI“黑匣子”,提高隐私保护透明度

根据最新披露的股东提案,多名股东向苹果公司施压,要求其披露更多的 AI 活动细节,进一步提高训练和推理 Apple 智能(Apple Intelligence)的透明度。
1/30/2025 7:00:21 AM
故渊

DeepSeek 应用在意大利应用商店下架,此前曾被该国隐私监管机构盯上

DeepSeek 应用已从意大利的 Google Play 和苹果 App Store 中下架。虽然确切原因未知,但猜测可能与意大利隐私监管机构 Garante 此前对 DeepSeek 提出的数据隐私问题有关。
1/29/2025 9:50:43 PM
远洋

阿斯麦 CEO:DeepSeek 的出现是好消息

荷兰光刻机制造商 ASML Holding NV 的首席执行官克里斯托夫・福凯(Christophe Fouquet)在周三的新闻发布会上表示,对于 ASML 而言,任何能够降低成本的消息都是好消息。此前,中国初创公司 DeepSeek 推出的低成本聊天机器人在市场上引发了波动,但福凯认为,这反而为 ASML 带来了更多机遇。
1/29/2025 8:04:00 PM
远洋

能思考会搜索的国产大模型,全网疯测的 DeepSeek 牛在哪?

一家来自杭州的“小公司” DeepSeek,却给整个 AI 行业带来了新思路,这两天可以说是火遍了全网。
1/29/2025 8:02:20 PM
泓澄

OpenAI:有证据表明 DeepSeek 使用了我们的模型进行训练

OpenAI 向《金融时报》表示,他们发现了 DeepSeek 使用“蒸馏”技术的证据。这是一种常见的开发手段,开发者通过从更大、更强大的模型中提取数据来训练自己的 AI 模型。这种技术能够以远低于 OpenAI 训练 GPT-4 所花费的 1 亿美元以上的成本,高效地训练出小型模型。尽管开发者可以通过 OpenAI 的 API 将其 AI 技术整合到自己的应用程序中,但利用输出数据来构建竞争模型则违反了 OpenAI 的服务条款。
1/29/2025 7:07:03 PM
远洋

OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评

成本打下来了,需求更多才对? 春节这几天,国内外 AI 圈都被 DeepSeek 刷了屏。 英伟达的股市震荡更是让全世界看得目瞪口呆(参见《英伟达市值蒸发近 6000 亿美元,而 DeepSeek 刚刚又开源新模型》)。
1/29/2025 6:43:00 PM
机器之心

原来,这些顶级大模型都是蒸馏的

「除了 Claude、豆包和 Gemini 之外,知名的闭源和开源 LLM 通常表现出很高的蒸馏度。 」这是中国科学院深圳先进技术研究院、北大、零一万物等机构的研究者在一篇新论文中得出的结论。 前段时间,一位海外技术分析师在一篇博客中提出了一个猜想:一些顶级的 AI 科技公司可能已经构建出了非常智能的模型,比如 OpenAI 可能构建出了 GPT-5,Claude 构建出了 Opus 3.5。
1/29/2025 6:40:00 PM
机器之心

医疗具身智能发展到哪了?看这一篇综述就够了!

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
1/29/2025 6:37:00 PM
机器之心

春晚小品“远程施法”,昨晚至今唤醒全球小米小爱同学超亿次

小米智能助手“小爱同学”官方账号今日分享了来自小米数据中心的信息,称昨晚到今天中午,春晚唤醒全球小爱同学超亿次(统计时间:2025 年 1 月 28 日 23:00 - 2025 年 1 月 29 日 12:00)。
1/29/2025 4:05:34 PM
归泷(实习)

意大利机构要求 DeepSeek 提供数据保护相关信息

据 Techcrunch 报道,欧洲消费者组织(Euroconsumers)与意大利数据保护机构(Italian Data Protection Authority,DPA)联合对 DeepSeek 提出投诉。这是自 DeepSeek 迅速走红以来,首次有数据保护机构对其采取重大行动。投诉的核心问题是 DeepSeek 在处理个人数据时是否符合欧洲的《通用数据保护条例》(GDPR)。
1/29/2025 3:19:09 PM
远洋

宇树科技回应春晚个别机器人“失误”:加了一些搞笑的“小彩蛋”

有细心的观众发现,在表演的时候,有个别机器人出现“失误”,比如收手绢时慢了半拍。对此,据九派新闻报道,宇树科技市场部的工作人员陈女士表示,确实在表演里加了一些搞笑的“小彩蛋”,人形机器人的“怪异”“犯错”或“故障”能给大家带来欢乐。
1/29/2025 2:55:25 PM
远洋

​谷歌前CEO:DeepSeek崛起标志着全球AI竞赛新阶段

谷歌前首席执行官埃里克·施密特(Eric Schmidt)在发表的专栏文章中呼吁美国加大开源人工智能的研发力度,以应对DeepSeek的崛起。 图源备注:图片由AI生成,图片授权服务商Midjourney施密特认为,DeepSeek的崛起标志着全球人工智能竞赛的转折点,证明中国可以利用更少的资源与大科技公司竞争。 施密特指出,为了对抗DeepSeek,美国必须开发更多的开源模型,投资人工智能基础设施(如星际之门),并鼓励领先的实验室分享他们的训练方法。
1/29/2025 10:33:00 AM
AI在线