AI
LeCun力荐!进化算法淘汰77%低质数据:RIP方法让模型性能狂飙60%
在LLM的开发中,推动模型进步的主要驱动力是精心挑选高质量的训练示例。 虽然Scaling Law的确能实现「力大砖飞」,但仅仅增加数据量并不能保证模型性能的提升,数据的质量才是关键。 低质量的数据可能会引入噪声,影响模型的训练效果。
官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug
近日,获英伟达支持、已获数亿美元风投资金的Sakana AI爆出戏剧性反转。 此前,该公司宣称开发出「AI CUDA工程师」,能将特定模型训练速度提升最高达100倍,引发行业关注。 然而,网友却发现,这个系统根本不管用。
刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1
憋了大半年,Anthropic终于放出大招——首款混合推理模型Claude 3.7 Sonnet重磅登场! 这是Claude系列中,迄今为止最智能的模型,几乎能够及时响应,并进行可扩展的、逐步的思考。 简言之,一个模型,两种思考方式。
Anthropic 下一轮融资金额或将增至 35亿美元,估值达 615 亿美元
根据《华尔街日报》的报道,人工智能初创公司 Anthropic 正在完成一轮新的融资,该轮融资规模已从最初计划的20亿美元增至35亿美元。 这轮融资将使公司的估值达到615亿美元。 Anthropic 以其人工智能聊天机器人 Claude 而闻名,日前发布了其最新的旗舰 AI 模型 Claude3.7Sonnet。
全球首个混合推理模型:Claude 3.7 Sonnet来袭,真实编码力压一切对手
就在昨晚,Anthropic 要发新模型的消息开始在 AI 社区广泛发酵,不过并不是期待中的 Claude 4.0,而是 3.7 Sonnet 版本。 图源:,Anthropic 的新旗舰模型如约而至,正式发布了其迄今为止最智能的模型以及市面上首款混合推理模型 —— Claude 3.7 Sonnet。 Claude 3.7 Sonnet 可以产生近乎即时的响应或者向用户展示扩展的、逐步的思考。
DeepSeek R1 满血版来了,完全不卡!
前言最近DeepSeek爆火。 我之前也发过多篇关于DeepSeek的文章,推荐大家使用它。 今年是AI的一个风口。
Gartner:预计到2027年跨境GenAI滥用引起的AI数据泄露比例将达40%
2月24日消息,据市场研究机构Gartner预测,到2027年,跨境生成式人工智能(GenAI)引起的AI相关数据泄露比例将超过40%。 GenAI在终端用户中的普及速度已超过了数据治理和安全措施的发展速度,而支持这些技术所需的集中算力引发了对数据本地化的担忧。 Gartner研究副总裁Joerg Fritsch表示:“由于监管不力,常常会发生意外的跨境数据传输,尤其是当GenAI被集成到现有产品但却没有明确的说明或公告时。
受DeepSeek影响,印度启动重磅AI项目:计划投入2700万美元
在全球 AI 技术竞争愈演愈烈的背景下,印度政府启动了一项名为 BharatGen 的重大人工智能项目。 这一项目获得了科技部的支持,计划投入约235亿卢比(约合2700万美元),旨在构建国家自己的基础 AI 模型,以保障印度的科技自主性。 图源备注:图片由AI生成,图片授权服务商MidjourneyBharatGen 项目的推进并非偶然。
雷军:小米首款AI专业办公笔记本将于本周发布
今日,小米创办人、董事长兼CEO雷军在微博表示,小米首款AI专业办公笔记本REDMI Book Pro162025将于2月27日19:00发布,并且发布即开售。 根据官方海报,REDMI Book Pro162025将是首批搭载第二代英特尔酷睿"Ultra 处理器,领先算力 至高96TOPS,平台 AI 算力提升150% ,疾速内存 LPDDR5X8400MT/s 超高频内存,飓风散热 整机散热系数较上代提升34.4%。
DeepSeek一夜把百度干回20年前,网友:还有这好事?
没完了,刚刚接入DeepSeek的百度,又双叒叕搞事情了。 最新消息,“百度一下 你就知道”这条2005年开始伴随着中国用户度过了互联网黄金岁月的Slogan,回归了。 有意思的是,这种“炒冷饭”的行为在大厂中已经出现了人传人的现象。
企业RAG落地避坑指南:自主开发 vs 三大框架,核心配置与选型全解析
这个项目原是春节期间在老家给一个企业做 RAG 项目咨询的精简版本,使用 Gradio 构建 Web 界面供大家测试使用。 本是希望大家在这个基础上根据个人或者企业需求进行二次开发,但是在小红书、微信收到一些后台私信里,在集中咨询关于自行开发和现有主流 RAG 框架的区别。 所以,有了这篇。
梁文锋亲自挂名,DeepSeek 最新论文丢出注意力新机制,推理速度直线提升 11 倍
2 月 18 日,马斯克发布 Grok 3 的热度还没过去,梁文锋就作为 co-authors 带着 DeepSeek 研究团队杀了回来。 公布新研究的推文发布不到 3 个小时,就带来了三十多万的浏览量,火爆程度不逊 OpenAI。 而这次 DeepSeek 团队最新的研究论文更是重磅,论文中介绍了一种全新的,可用于超快速的长上下文训练与推理的注意力机制 —— NSA,值得一提的是,NSA 还具有与硬件对齐的特点,十足的硬件友好。
如何用AI预测性维护数据中心降低40%故障率
数据中心故障困境:传统维护的力不从心在数字化浪潮汹涌澎湃的当下,数据中心已然成为现代业务运营的中流砥柱。 从金融机构的在线交易处理,到电商平台的订单管理与物流追踪;从社交媒体的海量数据存储与实时交互,到医疗行业的患者信息管理与远程诊疗支持,数据中心支撑着各个领域的关键业务流程,其重要性不言而喻。 一旦数据中心出现故障,带来的后果将是灾难性的。
利用 AI 生成“小姐姐”照片视频实施“流水化”诈骗,上海破获一起“恋爱交友”电诈案件
上海市公安局闵行分局近期通报破获一起以“恋爱交友”为名的电信网络诈骗案,捣毁一个10人诈骗团伙,涉案资金200余万元,相应犯罪团伙主要利用AI生成“小姐姐”照片视频内容后在短视频平台引流,再用同一套话术“剧本”,对全国各地近千名男性实施“流水化”诈骗。
据悉,2024年8月,市民刘先生至上海市公安局闵行分局刑侦支队报案,称其在2个月前通过一则短视频结交了网友“焦女士”,接触后感觉十分投缘。不久,“焦女士”称在外出游玩时为他请了一串手串,刘先生深受感动,两人迅速发展为恋人关系。
随后,“焦女士”又称刚盘下一家服装店,希望刘先生能为她预订花篮支持开业,刘先生未多想就转账给了对方推荐的“花店老板”。接下来的一个月内,“焦女士”故伎重施,以家属生病、进货需要资金等理由,陆续向刘先生索要了近20万元。
其间,为博得信任,“焦女士”还向刘先生展示了“身份证”“家属病历”和“进货单”。然而,数月以来刘先生却连“焦女士”的面都没见过,察觉被骗后,刘先生遂向警方报案。
经查,2024年嫌疑人杨某组织同乡吴某、林某、仲某等人组成诈骗团伙。利用AI生成的视频或网络素材拼贴发布交友短视频引流,进行“广撒网式”行骗,诱导被害人添加微信。
待相应受害者“上钩”后,犯罪团伙中的“聊天业务员”便会使用“恋爱话术”与被害人聊天,通过建立人设、嘘寒问暖、赠送手串等方式确立“恋爱关系”。后续则与被害人谈婚论嫁、畅想未来,利用“购买礼物”“开业花篮”等理由进一步筛选潜在被害人。最后,嫌疑人会谎称家属住院需要高额手术费,并由嫌疑人仲某提供虚假身份证、病历。被害人往往会在层层套路中越陷越深,直至人财两空。
2025年1月,在当地警方支持下,上海闵行警方在广东、福建、山东等地开展集中收网行动。警方在嫌疑人租住的房屋内查获用于发布引流短视频和聊天的手机60余部、手机卡250余张,并发现嫌疑人使用的一套话术“剧本”和各地近千名潜在被害人的通讯录。
目前,犯罪嫌疑人杨某等4人因涉嫌诈骗罪已被检察机关批准逮捕,其余6名犯罪嫌疑人已被闵行警方依法采取刑事强制措施,案件还在进一步侦办中。
AI时代的头号安全威胁:机器身份
2025年以DeepSeek为代表的生成式AI技术迅猛发展,为企业带来了前所未有的创新机遇,也带来了新的安全风险。 其中,非人类身份(Non-Human Identities, NHI)——如API密钥、令牌、加密密钥和服务账户——已成为网络安全的重大盲点。 根据OWASP最新发布的《非人类身份十大风险》(NHI Top 10),NHI数量可能比人类身份多出10至50倍,是网络攻击的主要攻击面。
8分钟,Grok 3破解美国本科生最难数赛题!马斯克要用100万GPU反超「星际之门」?
上周,马斯克发布了其号称「地表最强」的Grok 3模型。 一经发布便引爆全网,经过网友实测,发现其性能果然强悍! 物理学家Luis Batalha在x上表示,2025年的普特南竞赛上,即使是前500名的顶尖选手,也无人能完整攻克下面这道难题。
南大钱超团队攻克百亿晶体管难题,斩获EDA顶会2025最佳论文!AI学院本硕博生联手
据南京大学人工智能学院网站报道,南大LAMDA组钱超教授团队在DATE 2025发表的芯片设计优化论文「Timing-Driven Global Placement by Efficient Critical Path Extraction」获会议最佳论文奖。 电子设计自动化(Electronic Design Automation,EDA)是芯片设计的基石产业,被誉为「芯片之母」。 欧洲设计自动化与测试会议(Design, Automation and Test in Europe Conference,DATE)是EDA领域的顶级国际学术会议。
从理论到实践:学会如何商用 DeepSeek,收藏这一篇就够了
Hi,大家好,我叫秋水,当前专注于 AI Agent 和 AI 工作流自动化。 近期 DeepSeek,全球闻名,大家纷纷在讨论,我看过很多文章和视频,很多说的有点夸张,23 年 AI 刚来的那些内容,又重新说了一遍,只是把 AI 两个字母换成了 DeepSeek。 在我看来,DeepSeek 出圈的主要原因是能力强、价格低、开源、可以本地部署,这个好处在于企业在 AI 方面的应用会加速落地,我们国内的用户不需要那么麻烦的出海使用 ChatGPT 了。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
大型语言模型
AI设计
生成式AI
搜索
视频生成
亚马逊
AI模型
DeepMind
特斯拉
场景
深度学习
Transformer
架构
Copilot
MCP
编程
视觉