资讯列表
构建一个完全本地的语音激活的实用RAG系统
译者 | 布加迪审校 | 重楼本文将探讨如何构建一个RAG系统并使其完全由语音激活。 RAG(检索增强生成)是一种将外部知识用于额外上下文以馈入到大语言模型(LLM),从而提高模型准确性和相关性的技术。 这是一种比不断微调模型可靠得多的方法,可以改善生成式AI的结果。
2/24/2025 8:39:08 AM
布加迪
AI智能体结对编程秒杀人类,90分钟神作惊动OpenAI总裁!引全网140万围观
无需人类插手,AI智能体联手AI智能体竟完成了程序开发。 这简直太疯狂了! 最近,AI开发者Lamar将OpenAI Operator和Replit Agent配对后,让其构建应用程序。
2/24/2025 8:36:00 AM
新智元
DeepSeek、OpenAI、Kimi视觉推理到底哪家强?港中文MMLab推出推理基准MME-COT
OpenAI o1和DeepSeek-R1靠链式思维(Chain-of-Thought, CoT)展示了超强的推理能力,但这一能力能多大程度地帮助视觉推理,又应该如何细粒度地评估视觉推理呢? 为此,来自港中文MMLab的研究者们提出了MME-CoT。 这是一个全面且专门用于评估LMMs中视觉推理能力的Benchmark,包括了数学、科学、OCR、逻辑、时空和通用场景。
2/24/2025 8:30:00 AM
量子位
DeepSeek热度正盛,被神话还是确有实力?
2025年年初,中国初创公司DeepSeek以一种近乎现象级的速度崛起,引发了全球科技界的热议。 其模型在苹果应用商店的下载量超越ChatGPT、训练成本仅为竞争对手的零头、技术能力被冠以“颠覆性”标签……这些标签让DeepSeek迅速成为舆论焦点。 然而,在铺天盖地的赞誉与争议中,一个核心问题亟待回答:DeepSeek的“神话”究竟是资本市场的造势,还是AI实力的真实体现?
2/24/2025 8:28:30 AM
Yu
内测即爆火!一键超清修复老视频的AI神器Starlight
经常有群友问我有没有什么把视频修复的工具。 而我过去最推荐的,也是我心中目前最牛逼的视频修复工具,自然就是 TopazVideoAI 了。 这玩意儿我 2023 年就写过教程。
2/24/2025 8:28:15 AM
卡兹克
如何用 11 款 AI 工具让工作效率提升 300 倍
爱因斯坦有句名言:「如果还在重复做同样的事情,却期待会有不同结果,那么就等于疯狂。 」如果想在接下来的日子里提高效率,不妨往下看看。 Promptmetheus —— 不再花时间“修饰”Promptimage.png如果你玩过 ChatGPT,就知道写出好的 Prompt 有时像玄学。
2/24/2025 8:24:39 AM
dev
小米超级小爱已重新接入DeepSeek R1大模型
根据最新消息,小米超级小爱已重新接入DeepSeek R1大模型,并可以正常使用。 用户现在可以通过对超级小爱说“打开深度思考”来启用DeepSeek-R1,享受其提供的写代码、写文章以及逻辑推理等功能。 尽管小米尚未对此事进行官方宣布,但超级小爱的覆盖范围已经明确,涵盖了超过25款小米及Redmi机型。
2/24/2025 8:22:00 AM
AI在线
解决 NLP 任务的 Transformer 为什么可以应用于计算机视觉?
几乎所有的自然语言处理任务,从语言建模和masked词预测到翻译和问答,在2017年Transformer架构首次亮相后都经历了革命性的变化。 Transformer在计算机视觉任务中也表现出色,只用了2-3年的时间。 在这篇文章中,我们探索了两种基础架构,它们使Transformer能够闯入计算机视觉的世界。
2/24/2025 8:20:00 AM
二旺
AI写代码新姿势:一个截图,代替千行代码
现在写代码,最fashion的“姿势”应该是什么? 答案或许就是:截图。 没错,就像这样,先随便找个网页,截取想要的那部分界面,然后“喂”给AI,并附上一句Prompt:参考这个页面,生成一个类似的HTML页面。
2/24/2025 8:20:00 AM
量子位
超 2000 名文化界人士呼吁英国政府:不要将我们的作品白送给 AI 富豪
信中指责英国政府即将出台的《AI机会行动计划》中的一项条款。IT之家获悉,该条款被指控试图废除版权和知识产权法律,以便进行更广泛的数据挖掘。
2/24/2025 8:19:04 AM
清源
谷歌Fellow级大佬出走!17年老将吴永辉加盟字节,亲自操刀大模型研发
谷歌17年老将,正式加入字节跳动。 据报道,吴永辉博士已确认离职谷歌,加盟字节负责AI基础研究领域的工作。 他将在字节担任大模型团队Seed基础研究负责人,专注于大模型基础研究搜索、AI for Science科研工作,直接向CEO梁汝波汇报。
2/24/2025 8:15:00 AM
新智元
忘掉 DeepSeek:Qwen 2.5 VL 与 Qwen Max 来了
Qwen 系列又推出了两款令人瞩目的新模型:Qwen 2.5 VL 和 Qwen 2.5 Max。 如果还停留在“DeepSeek 是最强”那一档,就可能要重新考虑一下,因为这两款模型的实力相当惊艳。 什么是 Qwen 2.5 VL?
2/24/2025 8:10:00 AM
de
使用共享神经网络扩展机器学习模型
译者 | 崔皓审校 | 重楼随着机器学习模型的复杂性和规模不断增长,任何企业或者组织在部署、扩展模型上都面临着巨大的挑战。 迫在眉睫的挑战是如何在内存限制与模型规模之间取得平衡,并保持高性能和成本效益。 本文探讨了一种创新的架构解决方案,通过将共享神经编码器与专门的预测头结合的混合方法来应对这些挑战。
2/24/2025 8:00:00 AM
崔皓
谷歌 AI 视频生成模型 Veo 2 使用费用公布:每分钟 30 美元
谷歌近期在其定价页面上低调公布了新一代 AI 视频生成模型 Veo 2 的使用费用。该模型于去年 12 月首次亮相,旨在通过人工智能技术快速生成高质量的视频内容。根据官方信息,使用 Veo 2 的成本为每秒 50 美分(IT之家备注:当前约 3.6 元人民币),换算下来,每分钟的费用为 30 美元(当前约 218 元人民币),每小时则高达 1800 美元(当前约 13060 元人民币)。
2/24/2025 7:59:41 AM
远洋
DeepSeek-R1 成 Hugging Face 最受欢迎大模型,力压近 150 万个“对手”
Clement Delangue今日凌晨发文宣布:DeepSeek-R1在Hugging Face上获得了超过10000个赞,成为该平台近150万个模型之中最受欢迎的大模型,“太令人震惊了!”
2/24/2025 7:59:13 AM
清源
美国多个学区用上“AI 心理健康助手”,应对真人心理辅导员匮乏
Sonny是由Sonar Mental Health公司开发的一款AI辅助“心理健康伴侣”,许多人类心理辅导员匮乏学区正在推广这一混合模式,以帮助应对学生日益增加的心理健康需求。
2/24/2025 7:35:52 AM
清源
微软 CEO 纳德拉:Xbox 将借助生成式 AI 技术开发多款视频游戏
纳德拉在本周的采访中提到 Muse 时,将其与自己首次接触其他生成式 AI时的震撼体验相提并论。他表示,微软已经计划将这一技术应用于多个游戏项目。
2/24/2025 7:08:21 AM
清源
彻底解放双手!如何用DeepSeek结合Stable Diffusion快速出图?
我们热衷探索 Stable Diffusion 是因为它的开源生态与极大的自由度和控制力。 尽管 Stable Diffusion 在图像控制精度上远超 Midjourney,但其复杂操作流程总让创作者望而却步。 然而,最近情况出现了转机。
2/24/2025 6:34:36 AM
Infinite AI