API
在 TKE 上部署 AI 大模型(以DeepSeek-R1为例)
概述本文介绍如何在 TKE 上部署 AI 大模型,以 DeepSeek-R1 为例。 部署思路使用 Ollama 运行 AI 大模型,再通过 OpenWebUI 暴露一个聊天交互的界面,OpenWebUI 会调用 ollama 提供的 API 来与大模型交互。 Ollama 与 OpenWebUI 介绍Ollama 是一个运行大模型的工具,可以看成是大模型领域的 Docker,可以下载所需的大模型并暴露 API。
2/6/2025 10:18:45 AM
I am roc roc
谷歌重磅发布Gemini 2.0全系列模型 三款模型性能、成本双双突破
谷歌扩展了其人工智能模型家族,推出了三款新版本的 Gemini2.0模型,分别为基础版 Gemini2.0Flash、经济版 Gemini2.0Flash-Lite 以及实验版 Gemini2.0Pro。 这些新模型旨在满足不同的使用需求,并在性能和成本之间提供多样化的平衡。 基础版 Gemini2.0Flash 在去年12月首次推出,现在已全面上线,具备了更高的使用频率限制和改进的性能。
2/6/2025 8:50:00 AM
AI在线
AI创业踩坑!YC合伙人警告:“仅仅在业务中调用OpenAI API,并不会改变创业公司的命运!”,建议创始人来湾区定居
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)“创业者们仍然需要做的基本工作,才能让技术为客户创造价值。 如果你不做这些,仅仅把你的想法转向调用OpenAI的东西,并不会改变你作为创业公司的命运。 ”AI赋予了一个人进化成“超级个体”的机会,也让许多“一人公司”等小团队实现高收入神话。
2/3/2025 1:18:01 PM
伊风
硅基流动×华为云联合推出基于昇腾云的DeepSeek R1&V3推理服务
2月1日,硅基流动和华为云团队为国内用户推出了基于华为云昇腾云服务的 DeepSeek-R1 和 DeepSeek-V3 大模型推理服务,并在 SiliconCloud 云平台首发上线。这两款模型具有五大特点:支持华为云昇腾云服务,联合创新推理加速,提供稳定的生产级服务,零部署门槛,且有优惠价格。
开发者可以通过 SiliconCloud API 轻松集成这些模型,体验加速效果并提高应用开发效率。平台支持多种大模型和应用,帮助开发者降低算力成本并实现更高效的生成式 AI 应用开发
2/1/2025 4:03:00 PM
新闻助手
API存在安全风险:如何在不断发展的数字环境中保护数据
云计算和人工智能技术彻底改变了企业的运营方式。 这两种技术都提供了更高的灵活性和可扩展性。 基于云的基础设施使组织能够更快地进行创新。
1/22/2025 3:55:23 PM
AI情报室
OpenAI的停机事件教会我们要构建更具弹性的系统
译者 | 李睿审校 | 重楼2024年12月11日, OpenAI公司提供的服务由于新部署的遥测服务出现问题而遭遇重大停机。 此次事件影响了API、ChatGPT和Sora服务,导致持续数小时的服务中断。 作为一家致力于提供准确高效的人工智能解决方案的供应商,OpenAI公司为此发布一份详细的事后分析报告,公开地讨论了出现问题的原因,以及他们如何计划防止在未来发生类似事件。
12/27/2024 4:03:38 PM
李睿
奥特曼承认:模型API业务将走向枯竭!微软秘密协曝光:给OpenAI的AGI新定义,至少能赚到1000亿美元利润!十年完不成!
编辑 | 伊风震惊! OpenAI和微软的秘密协议被曝光,其中定下了AGI的含义:至少能赚到1000亿美元利润的AI系统! 1000亿美元是个极其庞大的数字。
12/27/2024 1:01:50 PM
伊风
集中接入:将大模型统一管理起来,你觉得怎么样?
为什么要集中接入? 集中接入,就是把大模型的接入统一到一个地方管理起来,下面这张图可以很好地帮我们理解集中接入:图片从这个图上,你已经看出来了,所谓的集中接入,其实就是构建了一个代理,我们后面就称它为大模型代理。 到这里,你可能产生这样的疑问:我直接用大模型不好吗?
12/27/2024 8:27:27 AM
greencoatman
AI圈卷疯了!xAI、Anthropic同日上线API:Grok免费公测,Claude 3.5 Haiku价格暴涨
就在刚刚,Anthropic宣布,Claude 3.5 Haiku已经可以通过API访问。 图片与此同时,就在今天,Grok API也官宣正式开启公测。 图片Claude 3.5 Haiku正式开放APIClaude 3.5 Haiku现已在Anthropic的API、Amazon Bedrock和Google Cloud的Vertex AI上提供。
11/5/2024 1:52:29 PM
新智元
马斯克的 xAI 正式发布 API,开发者可将 Grok 集成到其他应用
埃隆・马斯克的人工智能公司 xAI 正式发布了其应用程序编程接口(API),允许开发者将 Grok 集成到其他应用程序中。马斯克在周一宣布了这一消息,并同时在 xAI 网站上发布了该接口的链接。此前,马斯克曾在 8 月份确认将为 Grok 提供 API 的计划,并在 3 月份开源了该软件的权重。
10/22/2024 7:42:42 AM
远洋
快手可灵 AI 新增“对口型”功能:生成人物口型与上传音频同步
感谢快手旗下可灵 AI 官方宣布,新增对口型功能,并面向所有用户开放 API 服务。在可灵 AI 生成人物视频后,上传音频,即可让视频人物口型和音频同步。可灵 1.0 及 1.5 模型生成的视频,只要满足视频画面的人脸条件,均支持对口型(目前仅支持人物类角色(真实 / 3D / 2D)进行对口型,动物类角色对口型暂不支持)。AI在线获悉,可灵 AI 正式面向所有用户开放 API 服务,支持在平台自助购买 API 资源包。官方表示,API 的效果与平台效果完全一致,1.5 模型和运动笔刷目前暂不支持 API,会尽快迭
10/3/2024 4:56:28 PM
沛霖(实习)
OpenAI 发布 Realtime API,助力第三方应用集成其语音合成技术
科技媒体 The Decoder 昨日(10 月 1 日)发布博文,报道称 OpenAI 在旧金山开发者大会(DevDay)上,发布了 Realtime API,可以让开发者调用该 API 在第三方应用中集成语音合成技术。OpenAI 表示开发者通过调用新的 Realtime API,可以在其应用中添加 6 种 AI 语音,AI在线注:OpenAI 为了避免法律问题,开发者不能使用第三方语音。OpenAI 还展示了其它应用场景,表示可用于客户支持、语言学习、教育软件等,开发者可以利用语音交互增强用户体验:OpenA
10/2/2024 1:41:37 PM
故渊
智谱 AI 宣布 10 月最低 1 折开放全部官方模型 API,每位用户可获 1 亿 tokens 额度
智谱 AI 今天下午发布 10 月最新促销活动,最低 1 折调用开放平台 bigmodel.cn 所有官方模型 API,期间每位用户均可获赠 1 亿 tokens 额度。此外,在 10 月内,根据用户前一天的 token 用量,次日可享阶梯折扣。日消耗超 1 亿 token,次日所有 API 调用 5 折优惠日消耗超 10 亿 token,次日所有 API 调用 3 折优惠日消耗超 100 亿 token,次日所有 API 调用 1 折优惠据AI在线此前报道,今年 8 月,智谱 AI 在 KDD 2024 大会上发
9/29/2024 9:10:13 PM
清源
OpenAI 发布“学院”计划:为开发者提供 100 万美元 API 信用额度及技术指导
OpenAI 今天宣布推出“OpenAI 学院”,旨在帮助开发者和组织利用 AI 解决难题,并推动社区经济增长。该平台将确保生成式 AI 的强大功能在全球范围内广泛普及,包括中低收入国家。OpenAI 表示,许多国家的科技行业发展迅速,拥有才华横溢的开发者和创新型组织,但仍然缺乏高级培训和技术资源的支持。通过投资于本地 AI 人才的发展,可以促进包括医疗、农业、教育和金融等行业的经济增长与创新。该项目将提供如下方面的支持:培训与技术指导:OpenAI 专家将为利用 AI 的开发者和使命驱动型组织提供支持。API 使
9/23/2024 11:38:16 PM
清源
OpenAI 宣布 10 月起举办第 2 届 DevDay 开发者大会:无新 AI 模型,聚焦 API 和开发工具
OpenAI 公司宣布将于 2024 年 10 月 1 日起,在旧金山、伦敦和新加坡举办 2024 年度 DevDay 活动,遗憾的是本次活动不会发布新的 AI 前沿模型。OpenAI 计划在旧金山、伦敦和新加坡分别举办活动,AI在线附上具体日程如下:旧金山:10 月 1 日伦敦:10 月 30 日新加坡:11 月 21 日OpenAI 公司于 2023 年 11 月举办了首届 DevDay 开发者大会,公布了具有 128K 上下文和更低价格的 GPT-4 Turbo、新的 Assistants API、GPT-4
8/6/2024 2:43:53 PM
故渊
口袋 AI 设备 Rabbit R1 身陷负面漩涡:API 被曝漏洞,可暴露用户信息
Rabbit R1 再次陷入舆论漩涡,继 App 被批评套壳安卓,主推的大动作模型 LAM 依赖 OpenAI 接口之外,其 API 被曝存在安全漏洞,有泄露用户数据的风险。Rabbit R1 亮相于今年 CES 大展,其定位为口袋 AI 设备,这款产品拥有 2.88 英寸触摸屏、一个可旋转摄像头和一个交互滚轮,搭载 Rabbit 自研操作系统。该设备最大的亮点在于内置“大型操作模型(Large Action Model,LAM)”,堪称“万能应用控制器”,无需使用手机,就能集播放音乐、购物、发信息等多种功能于一身
6/27/2024 12:12:46 PM
故渊
OpenAI 断供中国大陆市场,零一万物 Yi API 二折平替 GPT-4o
6月25日,有多名开发者收到了来自 OpenAI 的公告,公告中显示,OpenAI 将于7月9日开始封锁来自非支持国家和地区的 API 流量。 在 OpenAI 给出的“支持访问国家和地区”名单上(),中国大陆、中国香港等地均未在列。 在审视 OpenAI 与中国大陆市场互动的历史脉络时,可以观察到其一贯持有的审慎姿态。
6/26/2024 10:52:00 AM
我在思考中
阿里云、智谱多家国产大模型公司宣布提供 OpenAI API 服务替代方案
感谢昨天陆续有 API 开发者在社交媒体上表示,他们收到了来自 OpenAI 的“警告信”,信中表示将采取额外措施停止其不支持的地区的 API 使用,IT之家此前已进行详细报道。此后,多家国产大模型公司宣布为开发者提供 OpenAI API 服务的替代方案,包括智谱、阿里云、百度智能云等。智谱:推出 OpenAI API 用户“特别搬家计划”,帮助用户切换至国产大模型。其 GLM 大模型号称全面对标 OpenAI 产品体系,且全链路技术自研、安全可控。为开发者提供:1.5 亿 Token(5000 万 GLM-4
6/26/2024 8:32:42 AM
清源
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
Gemini
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
DeepMind
特斯拉