AI在线 AI在线

资讯列表

标点符号成大模型训练神器!KV缓存狂减一半,可处理400万Tokens长序列,来自华为港大等 | 开源

文字中貌似不起眼的标点符号,竟然可以显著加速大模型的训练和推理过程? 来自华为、港大、KAUST和马普所的研究者,就提出了一种新的自然语言建模视角——SepLLM。 起因是团队发现某些看似无意义的分隔符,在注意力得分中占据了不成比例的重要地位。
3/4/2025 9:00:00 AM
量子位

国内第一波弃用 DeepSeek 的公司:潞晨科技官宣暂停相关 API 访问

3 天前,DeepSeek 官方公布线上系统理论成本利润率达 545%。几乎同一时间,“清华系”AI Infra 企业 —— 潞晨科技,突然宣布暂停 DeepSeek API 访问服务。
3/4/2025 8:57:38 AM
周文猛

Anthropic融资35亿美元,估值飙升至615亿美元

Anthropic宣布完成一轮35亿美元的 E 轮融资,融资后估值达到615亿美元。 这轮融资由 Lightspeed Venture Partners 领投,贡献10亿美元,进一步巩固了Anthropic作为全球最有价值的私营公司之一的地位。 这表明,尽管当前 AI 公司的估值已经高企,投资者仍然对领先的 AI 开发公司保持着强烈的投资兴趣。
3/4/2025 8:57:00 AM
AI在线

Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场

LLM评估基准的「黄金标准」,正在失效? 一大早,AI大神Karpathy发出质疑,「目前存在一种评估危机,我真的不知道现在该看哪些指标了」。 诸如MMLU、SWE-Bench Verified、Chatbot Arena等这些基准,各有自己的优劣之处。
3/4/2025 8:40:00 AM
新智元

Hinton怒斥马斯克「电锯」屠遍美国科学界!3410位大佬联名将其从英国皇家学会除名

AI教父Hinton和马斯克吵起来了! 今天,Hinton公开叫板,「马斯克应该被英国皇家学会除名,最关键原因是他正在对美国科学机构造成巨大损害」。 这番言论如同一枚重磅炸弹,瞬间点燃了舆论战场。
3/4/2025 8:30:00 AM
新智元

AI优先事项:IT领导者强调生产力而非创新

随着AI技术的飞速发展,IT领导者对其的投资热情日益高涨,然而,在AI的应用焦点上,IT领导者们却存在不小的争议。 是专注于提高员工生产力,还是探索更高级的应用如推动创新?这一选择将直接影响企业的未来发展。 一项新调查显示,IT领导者在使用AI时仍然瞄准的是低垂的果实,专注于提高员工生产力,而非更高级的应用,如推动创新或增加收入。
3/4/2025 8:10:00 AM
Grant Gross

腾讯元宝下载量超DeepSeek 登顶苹果免费App下载榜第一

腾讯旗下的大模型AI应用——腾讯元宝,在苹果中国区App Store的免费App下载排行榜上实现了突破性进展,成功超越DeepSeek,占据了榜首位置。 目前,免费榜前五的App依次为腾讯元宝、DeepSeek、个人所得税、豆包以及红果短剧。 腾讯元宝自接入DeepSeek以来,腾讯公司便加大了对其的推广力度。
3/4/2025 8:05:00 AM
AI在线

QQ浏览器推出“AI作文辅导”功能 拍照即可提供解题思路

QQ浏览器推出了一项名为“AI作文辅导”的新功能,旨在帮助学生在写作过程中提升能力,而不仅仅是简单地提供答案。 这一功能的推出,正值新学期伊始,许多学生开始尝试使用AI工具完成作业,引发了家长和社会的广泛关注。 “AI作文辅导”功能通过全流程的写作技巧辅导,帮助学生在立意、提纲、素材和范文生成的每一步中获得指导。
3/4/2025 8:01:00 AM
AI在线

使用Rust构建高性能机器学习模型

译者 | 布加迪审校 | 重楼机器学习主要使用Python来完成。 Python之所以大受欢迎,是由于它易于学习,并且有许多机器学习库。 而现在,Rust正成为一种强有力的替代语言。
3/4/2025 8:00:00 AM
布加迪

秘塔AI搜索上线「视频」搜索功能

2025年3月3日,上海秘塔网络科技有限公司宣布其AI搜索功能新增“视频”搜索模块,进一步拓展了对多模态数据的覆盖范围。 这一新功能基于对上亿条视频内容的分析和理解,能够帮助用户更高效地找到所需的学习和娱乐视频资源。 用户可以通过秘塔AI搜索快速定位到感兴趣的视频内容。
3/4/2025 7:57:00 AM
AI在线

估值升至 615 亿美元,Anthropic 完成 35 亿美元 E 轮融资

Anthropic 本轮融资的参与者包括思科、Salesforce 的投资部门。Anthropic 表示这笔资金将推进其下一代 AI 系统的开发。
3/4/2025 7:43:50 AM
溯波(实习)

GCD-DDPM:用扩散模型重塑变化检测,精准捕捉细粒度变化

一眼概览GCD-DDPM 提出了一种 基于差分特征引导的去噪扩散概率模型(DDPM) 进行 变化检测(CD) 的方法,采用 生成式方式 直接生成变化检测(CD)图,而非传统的判别式分类方式。 在四个高分辨率遥感数据集上,该方法展现了优越的检测性能。 核心问题目前主流变化检测(CD)方法大多依赖 CNN 或 Transformer 进行判别式特征学习,但它们在 同时捕获局部细节信息和长距离依赖关系 方面存在局限,导致 变化检测精度不足,尤其是对于 复杂场景的细粒度变化 无法精准捕捉。
3/4/2025 4:00:00 AM
萍哥学AI

告别传统 SSE!fetch-event-source 让 AI 流式处理更高效

在 AI 大模型飞速发展的时代,前端开发者面临着如何高效处理实时数据流的挑战。 服务器发送事件(SSE)作为一种单向通信协议,能够让服务器主动向客户端推送实时更新,广泛应用于实时聊天、新闻推送等场景。 然而,标准的 EventSource API 存在诸多限制,例如只能使用 GET 请求、无法传递请求体等。
3/4/2025 3:00:00 AM
PIG AI

23个超强的DeepSeek提示词指令,一看就懂

给大家分享几个超强的DeepSeek提示词,大家也可以模仿提示词的结构去书写自己需要的DeepSeek指令。 文中[...]内的只是示例,大家可以根据自己实际需求进行替换。 一、知识管理类请用康奈尔笔记法整理[会议记录/课程内容],左侧提炼关键词,右侧记录案例证据,底部总结行动要点,最后将知识关联绘制成概念网络图。
3/4/2025 2:00:00 AM
丶平凡世界

科大讯飞出品!人人都能懂的AI大模型科普课

在当今科技飞速发展的时代,一个名为"AIGC"(Al Generated Content,人工智能生成内容)的概念正逐渐走进公众视野,并迅速成为各界热议的话题。 无论是社交媒体上的讨论,还是专业论坛中的交流,AIGC都成为了不可忽视的存在。 它不仅代表着技术进步的一个重要里程碑,更是预示着未来内容创作方式的一场深刻变革。
3/4/2025 1:06:18 AM
团队iFlytek STC UXD

LLM 大语言模型定义以及关键技术术语认知

大语言模型定义LLM(Large Language Models)是基于 Transformer 架构(可以理解为不同寻常的大脑)的深度神经网络,通过海量文本数据训练获得语言理解和生成能力。 其核心特征包括:参数规模达数十亿级别(GPT-3 175B参数)知识储备惊人,可以理解为脑细胞数量是普通人的千亿倍(1750亿参数),相当于把整个图书馆的书都装进大脑自回归生成机制(逐词预测)说话方式像接龙,当它写作文时,就像我们玩词语接龙:先写"今天",然后根据"今天"想"天气",接着根据"今天天气"想"晴朗",逐字逐句生成内容。 注意力机制实现长程依赖建模特别会抓重点就像我们读小说时,会自动记住关键人物关系(比如注意到"陈平安喜欢宁姚"),它能自动捕捉文字间的深层联系。
3/4/2025 1:00:00 AM
山河已无恙

DeepSeek提示词超能手册:五大核心技巧,榨干AI生产力!

🎯 技巧1:R-T-F黄金三件套——角色 任务 格式锁定AI身份,输出不跑偏! R (Role):角色,明确AI需要扮演的身份或专家领域。 T (Task):任务,清晰定义AI需完成的具体目标。
3/4/2025 12:35:00 AM
新叔

用上DeepSeek,改简历快人一步:AI简历优化保姆级教程

作为科技博主,我测评过上百款AI工具,今天给大家安利一个简历优化的"外挂神器"——DeepSeek。 它能让你的简历从"已读不回"变成"收割offer",操作比美图秀秀还简单,特别适合没经验的应届生和转行小白。 一、为什么需要AI改简历?
3/4/2025 12:00:55 AM
架构师秋天