工具
告别 DeepSeek 系统繁忙,七个 DeepSeek 平替入口,官网崩溃也能用!
前言DeepSeek作为一款备受瞩目的国产大模型,以其强大的功能和卓越的性能赢得了众多用户的青睐。 然而,随着用户量的激增,DeepSeek官网近期频繁遭遇服务器繁忙甚至崩溃的问题,给广大用户带来了不小的困扰。 面对这一现状,许多用户急于寻找能够替代或绕过官网限制的方法,以继续享受DeepSeek带来的便捷与高效。
2/11/2025 8:06:43 AM
大姚
1分钟学会DeepSeek本地部署,小白也能搞定!
DeepSeek 是国内顶尖 AI 团队「深度求索」开发的多模态大模型,具备数学推理、代码生成等深度能力,堪称"AI界的六边形战士"。 DeepSeek 身上的标签有很多,其中最具代表性的标签有以下两个:低成本(不挑硬件、开源)高性能(推理能力极强、回答准确)一、为什么要部署本地DeepSeek? 相信大家在使用 DeepSeek 时都会遇到这样的问题:图片这是由于 DeepSeek 大火之后访问量比较大,再加上漂亮国大规模、持续的恶意攻击,导致 DeepSeek 的服务器很不稳定。
2/10/2025 12:00:10 AM
磊
英特尔开源RAG Foundry 框架,可增强多种RAG用例
英特尔实验室的研究人员开源了RAG Foundry,这是一个专门用于开发、增强大模型RAG框架。 Foundry很高的灵活性和扩展性,支持设计和实验各种RAG用例,这包括数据选择、聚合、过滤、检索、文本处理、文档排名、少样本生成、提示设计、微调、推理和模型评估等。 例如,开发人员通过RAG Foundry可以选择不同的检索算法和工具,以获取与问题相关的外部信息,基本上可以实现一站式开发RAG。
2/6/2025 11:20:00 AM
AIGC开放社区
两分钟完成论文调研!ByteDance Research推出论文检索智能体PaSa,远超主流检索工具
2025 被称为 Agent 元年,新年伊始,ByteDance Research 就推出了一款基于强化学习的智能体应用:论文检索智能体。 它可以模仿人类研究者调用搜索引擎、看论文、查参考文献。 繁琐冗长的论文调研,现在,只需要两分钟。
1/24/2025 8:45:00 AM
机器之心
微软开源Markdown工具爆了:支持Office文档,可接多模态LLM直出报告
微软官方开源了一款文件格式转换工具——MarkItDown! 它不仅可以将常见的Office文档(Word、PowerPoint、Excel)、PDF、图像、音频等转换为对大模型更友好的Markdown格式。 而且还支持集成像GPT-4o这样的多模态LLM,可以直接对图片、音频文件进行更高级的处理,比如快速输出商业报告。
1/20/2025 1:10:22 PM
量子位
o1不是聊天模型!前SpaceX工程师:这样用o1才能解决复杂问题
「我是如何从讨厌o1到每天用它来解决我最重要的问题的? 我学会了如何正确使用它。 」Ben Hylak曾是SpaceX软件工程师、苹果VisionOS人机交互设计师,后来离职创立了Dawn Analytics。
1/20/2025 9:28:00 AM
新智元
5090跑《黑神话》飙到200+帧,英伟达DLSS也用上Transformer了
现在,打个游戏都用上Transformer了? 老黄的DLSS进行了一波大升级,换上了基于Transformer的新大脑。 用上新模型之后,光线重建和超分辨率,效果都变得更细腻了。
1/20/2025 7:00:00 AM
量子位
打脸!GPT-4o输出长度8k都勉强,陈丹琦团队新基准测试:所有模型输出都低于标称长度
很多大模型的官方参数都声称自己可以输出长达32K tokens的内容,但这数字实际上是存在水分的? ? 最近,陈丹琦团队提出了一个全新的基准测试工具LONGPROC,专门用于检测长上下文模型处理复杂信息并生成回复的能力。
1/16/2025 9:00:00 AM
量子位
奥特曼年终总结,明确AGI如何实现,2025奔向超级智能
刚刚,奥特曼发布了自己的年终总结。 图片有过去创业经历的回溯:这些年是我迄今为止人生中最有价值、最有趣、最好、最有意思、最累、最有压力的几年,尤其是最近两年,也是段最不愉快的时光。 他回顾一年多以前毫无征兆被炒鱿鱼的经历,当时他在酒店房间视频电话突然被通知解雇,“就像是一场梦境破灭了”。
1/6/2025 11:45:08 AM
字节整活!1.58比特FLUX:手机也能流畅运行的顶尖AI画图神器来了
自字节跳动和POSTECH的研究团队发布了一项名为“1.58-bit FLUX”的突破性研究成果,该成果成功将最先进的文本到图像(T2I)生成模型FLUX.1-dev的权重参数量化至1.58比特,同时保持了生成1024x1024图像的质量,为在资源受限的移动设备上部署大型T2I模型开辟了新的道路,这项研究成果已发布在arXiv上,并配有开源代码库(代码目前还没有上传)AI画图模型也能“减肥”? 简单来说,就是把 FLUX(由Stable Diffusion作者团队成立的黑森林实验室Black Forest Lab推出) 的超强AI画图模型进行了“压缩”。 大家都知道,现在的AI画图模型,像DALLE 3、Stable Diffusion 3、Midjourney等,展现出强大的图像生成能力,在现实应用中潜力巨大。
1/2/2025 1:50:00 PM
AI寒武纪
解码通用 AI Agent:七步构建你的智能系统
LLM Agent 高层次概述(图片由原文作者提供)为什么要构建通用 Agent? 因为这是一个很好的工具,可以为我们的目标使用场景提供原型,并为设计我们自己的定制 Agent 架构奠定基础。 在我们继续深入之前,先快速介绍一下 LLM Agent。
12/19/2024 9:50:04 AM
Baihai IDP
Ilya宣判:预训练即将终结!NeurIPS现场沸腾
继李飞飞、Bengio、何恺明之后,在刚刚的NeurIPS 2024中,Ilya Sutskever最新演讲也来了。 虽然时长仅有15分钟左右,但内容依旧看头十足。 例如这一句:Pre-training as we know it will end.我们所熟知的预训练即将终结。
12/16/2024 8:20:00 AM
量子位
原来机器学习那么简单—SVR
一、算法介绍 支持向量回归(SVR)是一种监督学习算法,用于解决回归问题。 其核心思想是找到一个超平面,这个超平面能够以最小的误差包含所有的训练样本。 与支持向量机处理分类问题类似,支持向量回归的目标是确保尽可能多的数据点位于由超平面决定的边界内。
12/13/2024 9:11:12 AM
BBSM
MidJourney 上线 Patchwork:用户化身“造物主”,AI 构造故事宇宙
Midjourney 公司最新推出名为“Patchwork”的全新叙事工具,将业务拓展至 AI 图像创作和编辑以外的领域,目标打造 AI 驱动的沉浸式故事世界。
12/12/2024 2:38:17 PM
故渊
让AI一键写系统性综述,难!Nature专栏:ChatGPT远远不够,一百年以后再看看
网络的普及,加上文献数量的爆炸式增长,如今的科研人员要面临的一个主要难题就是,尽管可能已经收集了足够的数据来帮助理解某个复杂的领域或系统,但由于信息量的巨大,人类无法全面地阅读和理解所有文献。 就像是面对一个巨大的图书馆,虽然每本书都包含了宝贵的知识,但没有人能够阅读所有的书籍并从中获得一个完整的认知。 因此,尽管科学的进步为我们提供了大量的数据,但如何有效地整合和理解这些数据仍然是一个亟待解决的问题。
12/6/2024 9:15:00 AM
新智元
吴恩达开源大模型套件:11个模型平台一种方式调用,已获星标超1.2K
吴恩达发布的开源大模型套件aisuite,不到半天就斩获了1200 星标。 它把11家知名大模型平台集中到了一起,统一了接口,可以用相同的方式调用不同模型。 切换模型时,只需要改动一个字符串,不用在不同的API之间摸不着头脑了。
11/26/2024 2:20:00 PM
量子位
Nature:谷歌学术正在被AI工具颠覆
曾经每天都用谷歌学术的科学家们,正在转向新的AI工具。 就在谷歌学术迎来20岁生日之际,Nature却担忧发文:谷歌学术能否在人工智能变革中活下来? 没错,每月访问量超过1亿次的谷歌学术,正在被AI工具悄然颠覆。
11/25/2024 9:00:00 AM
量子位
AI自动操作VS Code,自然语言搞定各种配置,来自阿里通义智能计算实验室 | 开源
国产AI已经学会直接操纵编程软件了! 阿里通义智能计算实验室在推出了一款专门针对VSCode的AI助手工具——SmartVscode。 通过自然语言指令,不仅可以让它帮你编程,还能搞定各种配置的控制和修改。
11/20/2024 9:38:40 AM
量子位
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
英伟达
Anthropic
代码
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
LLM
苹果
神经网络
Claude
AI新词
3D
研究
生成
机器学习
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
LLaMA