AI在线 AI在线

资讯列表

​湖南禁止互联网医院用AI开处方 已有医院接入DeepSeek作为辅助

近日,湖南省医疗保障局发布了一项新通知,明确禁止互联网医院使用人工智能等技术自动生成处方。 这一规定引发了社会的广泛关注,尤其是在互联网医疗服务日益普及的背景下。 图源备注:图片由AI生成,图片授权服务商Midjourney据湖南省医疗保障局发布的《通知》,互联网医院在开具处方时必须遵循相关规定,确保处方行为由实际接诊的医师本人亲自完成。
2/25/2025 10:29:00 AM
AI在线

LLM高效推理:KV缓存与分页注意力机制深度解析

随着大型语言模型(LLM)规模和复杂性的持续增长,高效推理的重要性日益凸显。 KV(键值)缓存与分页注意力是两种优化LLM推理的关键技术。 本文将深入剖析这些概念,阐述其重要性,并探讨它们在仅解码器(decoder-only)模型中的工作原理。
2/25/2025 10:21:15 AM
Dewang Sultania

OpenAI研究人员发现,AI无法解决大多数编程问题

2月24日消息,据外媒报道,OpenAI的研究人员承认,即使是最先进的AI模型仍然无法与人类程序员匹敌,尽管首席执行官山姆·奥特曼(Sam Altman)坚称,到今年年底,他们将能够击败“低级”的软件工程师。 在一篇新论文中,该公司的研究人员发现,即使是前沿模型,或最先进、最具突破边界的人工智能系统,“仍然无法解决大多数”编码任务。 研究人员使用了一种名为sw-lancer的新开发基准,该基准基于自由职业者网站Upwork的1400多个软件工程任务。
2/25/2025 10:21:12 AM
Yu

最新!Claude 3.7 Sonnet 即将揭秘:各种关键领域达到顶尖水平

最新消息:亚马逊云服务 (AWS) Bedrock 平台即将迎来 Anthropic 最新的 Claude 3.7 Sonnet 模型。 据可靠消息,这款升级版 Sonnet 3.7 极有可能在 2 月 26 日的亚马逊活动中正式发布。 目前,该模型已在 AWS Bedrock 后台准备就绪,但尚未在前台用户界面中公开显示,处于隐藏状态Claude 3.7 Sonnet 是 Anthropic 公司迄今为止推出的最智能模型。
2/25/2025 10:20:00 AM
AI寒武纪

上海明星 AI 公司“澜码科技”曝“员工停薪社保停缴”,创始人周健回应称“借钱卖房补偿,正寻求被并购的可能性”

据极速财讯报道,曾顶着“李开复关门弟子”、“ACM 世界冠军”光环的周健和他的明星 AI 公司澜码科技现在陷入舆论漩涡。该媒体援引员工“佐鸣”例子,称 2025 年 1 月 6 日,其在没有收到任何解释的情况下,收到了一纸解除合同的通知。通知上写着,澜码科技将在 2025 年的 2 月、3 月、4 月分期支付所欠工资。
2/25/2025 10:19:48 AM
漾仔

首个罕见病 AI 大模型在中国医院投入临床使用

在中国医学领域取得了重要进展,北京协和医院与中国科学院自动化研究所联合研发的 “协和・太初” 罕见病 AI 大模型,近日正式进入临床应用阶段。 这一举措不仅标志着我国在罕见病诊断技术上的突破,也为提升临床医疗效率提供了新的工具。 该 AI 大模型的研发得益于多年来在我国罕见病知识库的积累以及中国人群基因检测数据的支持。
2/25/2025 10:19:00 AM
AI在线

教育科技公司 Chegg 起诉谷歌,称 AI 搜索摘要损害其流量与收入

教育科技公司 Chegg 近日在美国哥伦比亚特区联邦地区法院对谷歌提起诉讼,声称谷歌的 AI 搜索结果摘要对其流量和收入造成了负面影响。Chegg 指控谷歌存在不公平竞争行为,包括互惠交易、维持垄断地位以及不当得利。
2/25/2025 10:11:07 AM
远洋

DeepSeek开源FlashMLA:Hopper GPU解码新标杆,测评大揭秘!

DeepSeek今天正式启动为期五天的开源成果发布计划,首个亮相的项目是FlashMLA。 这一开源项目将先进的MLA算法与GPU优化技术相结合,为大模型推理提供了一套高性能、低延迟的解码方案。 FlashMLA是一款专门为Hopper GPU(比如H800 SXM5)优化的高效MLA解码内核,旨在加速大模型的计算任务,尤其是在NVIDIA高端显卡上提升性能。
2/25/2025 10:09:00 AM
新闻助手

深夜王炸!刚刚Anthropic发布全球首个混合推理模型与全新代码“神器”:双面王牌组合

刚刚Anthropic公司正式发布了他们最新的AI王牌组合—— Claude 3.7 Sonnet 和 Claude Code! 各种能力超群,只是数学能力还是不及DeepSeek等,感觉Claude所有重点都在代码能力 观看更多转载,深夜王炸! 刚刚Anthropic发布全球首个混合推理模型与全新代码“神器”:双面王牌组合AI寒武纪已关注分享点赞在看已同步到看一看写下你的评论 视频详情 第一时间(熬夜🤣)给大家划个重点Claude 3.7 Sonnet:混合推理架构登场,打造前所未有的智能巅峰!
2/25/2025 10:08:38 AM
AI寒武纪

OpenAI 投资新材料应用!挪威 1X 公司推出新款家用机器人

近日,挪威人形机器人公司1X Technologies(简称1X)发布了其最新款家用机器人 Neo Gamma,标志着家用机器人技术迈出了重要一步。 与之前的原型不同,Neo Gamma 将进行有限的家庭测试,旨在让用户体验更加人性化的智能服务。 1X 公司在设计 Neo Gamma 时特别注重减少机器人与人接触时可能带来的伤害。
2/25/2025 10:06:00 AM
AI在线

Perplexity AI推出新浏览器Comet,基于AI的代理搜索工具

近日,Perplexity AI 宣布即将推出一款专为 “代理搜索” 设计的新浏览器 ——Comet。 这款浏览器将融合人工智能的强大能力,为用户提供更加智能和便捷的搜索体验。 Perplexity AI 本身是一款利用大型语言模型和实时网络搜索相结合的搜索引擎,旨在为用户提供全面、准确且最新的信息。
2/25/2025 10:05:00 AM
AI在线

ICLR2025|小红书等提出AI图像检测新基准新方法

在数字化浪潮汹涌澎湃的今天,AI生成内容已深度渗透至我们生活的方方面面,从艺术创作到设计领域,再到信息传播与版权保护,其影响力无处不在。 然而,随着生成模型技术的飞速发展,如何精准甄别AI生成图像成为业界与学界共同聚焦的难题。 近日,小红书生态算法团队、中科大、上海交通大学联合在ICLR 2025上提出行业稀缺的全人工标注Chameleon基准和行业领先的AIDE检测方法,为AI生成图像检测领域带来了新的挑战和曙光。
2/25/2025 10:04:10 AM

DeepSeek-R1秘籍轻松迁移,最低只需原始数据0.3%

DeepSeek-R1背后关键——多头潜在注意力机制(MLA),现在也能轻松移植到其他模型了! 而且只需原始数据的0.3%~0.6%。 这项研究由复旦大学、华东师范大学、上海AI Lab等联合提出,复旦教授邱锡鹏(Moss大模型项目负责人)也在作者名单之列。
2/25/2025 10:03:20 AM
量子位

苹果宣布超5000亿美元投资计划 以生产苹果智能服务器

苹果公司近日正式揭晓了一项前所未有的大规模投资蓝图,预计未来四年内将在美国市场投入超过5000亿美元资金。 据悉,苹果已着手准备在休斯敦地区建立一座全新的工厂,占地面积高达25万平方英尺。 该工厂将专注于组装用于数据中心的服务,特别是生产支持苹果智能设备的服务器。
2/25/2025 10:00:49 AM
AI在线

网传“四川成都 30 所中小学将开启机器人授课”,官方回应称“消息不实”

据“抖音辟谣”官方号,近日,有自媒体账号发布虚假信息,称“成都 30 所中小学即将开启机器人授课”,引发网友热议。据悉,相应消息称“成都未来的课堂不再需要真人老师上课了”。对此,成都市教育局有关负责人称该消息并不属实。
2/25/2025 9:55:12 AM
漾仔

剑指“蹭热点”国家知识产权局驳回63件“DeepSeek”商标申请

2月24日,国家知识产权局发布最新通告,宣布依法驳回一批恶意抢注“DeepSeek”等商标的注册申请,以维护公平竞争的市场秩序,并保护创新主体的合法权益。 通告指出,近期,由杭州深度求索人工智能基础技术研究有限公司研发的DeepSeek人工智能大模型,在全球范围内引发广泛关注,其技术实力和市场潜力备受瞩目。 图源备注:图片由AI生成,图片授权服务商Midjourney然而,部分企业和自然人出于不正当目的,恶意抢注与该知名人工智能大模型名称相同的“DEEPSEEK”及相关图形商标,并向国家知识产权局商标局提交了商标注册申请。
2/25/2025 9:54:00 AM
AI在线

AI 模型 Claude 3.7 Sonnet 刚发布,消息称 Anthropic 新一轮融资增至 35 亿美元

据《华尔街日报》报道,人工智能公司 Anthropic 正在敲定一轮 35 亿美元(IT之家备注:当前约 253.83 亿元人民币)的融资,公司估值达到 615 亿美元。最初,Anthropic 计划筹集 20 亿美元,但投资者现已同意投入更大一笔资金。
2/25/2025 9:50:44 AM
远洋

大语言模型:表面的推理能力背后是出色的规划技巧

译者 | 刘汪洋审校 | 重楼大语言模型(LLMs)在技术发展上取得了显著突破。 OpenAI 的 o3、Google 的 Gemini 2.0和 DeepSeek 的R1展现出了卓越的能力:它们能处理复杂问题、生成自然的对话内容,甚至精确编写代码。 业界常把这些先进的LLMs 称为"推理模型",因为它们在分析和解决复杂问题时表现非凡。
2/25/2025 9:49:12 AM
刘汪洋