应用
英伟达开源新一代OCR代码推理 AI 模型,超越 OpenAIo3-Mini表现
英伟达在技术界引起广泛关注,正式发布了其最新的 Open Code Reasoning(OCR)模型套装。 这一模型的推出,不仅展示了英伟达在人工智能领域的创新能力,也为开发者提供了强有力的工具,助力他们在代码推理和生成任务中取得更好的成绩。 ** 模型参数与架构:多样化选择 **英伟达的 OCR 模型套装共包含三种不同参数规模,分别为32B、14B 和7B。
5/9/2025 4:00:51 PM
AI在线
商汤科技迈向多模态大模型的新纪元
在过去的两年里,人工智能领域的关注点逐渐转向了大模型的技术发展,而商汤科技作为一家成立不到十年的公司,凭借其在计算机视觉领域的技术积累,正迅速转型,迎接这一浪潮。 尽管在2023年之前,商汤主要聚焦于视觉模型,但随着 DeepSeek R1的发布,市场的重心开始向自然语言处理和大规模参数模型倾斜,商汤的策略也随之调整。 商汤于4月10日推出的全新6000亿参数多模态大模型 “日日新 Sense Nova V6”,展现了强大的综合能力,与国际领先的 GPT-4.5和 Gemini2.0Pro 不相上下。
5/9/2025 4:00:51 PM
AI在线
Gemini API推出隐式缓存功能,开发者成本降低75%
Gemini API推出隐式缓存(Implicit Caching)功能,为开发者带来显著的成本优化体验。 新功能无需开发者手动创建缓存,当请求与先前请求共享共同前缀时,系统将自动触发缓存命中,提供高达75%的Token折扣。 此更新已覆盖Gemini2.5Pro和2.5Flash模型,进一步提升了AI开发的成本效益。
5/9/2025 4:00:51 PM
AI在线
OpenAI 新设“应用 CEO”:原 Meta VP 加入,与奥特曼平级
刚刚,OpenAI 搞了个大动作。 CEO Sam Altman 发文称原 Instacart 的 CEO Fidji Simo 将加入 OpenAI,担任“应用业务首席执行官”的职位(CEO of Applications),而他自己则是去守住 OpenAI 的核心技术和长期战略这块内容。 新的 CEO 的头衔听起来有点长,但简单说就是:她以后要全面负责 OpenAI 的产品、尤其是 ChatGPT 这一类面向用户的应用产品。
5/9/2025 3:54:00 PM
郑佳美
英语学习永动机?手把手教你用纳米AI调用MCP自动生成带MP3的精美双语网页
一、前言纳米AI的智能体为英语学习者和教育者带来了革命性的工具。 本教程将详细指导您如何利用纳米AI的智能体,调用模型上下文协议(MCP),轻松制作包含中英双语对照、核心词汇解析以及配套MP3音频的精美英语学习素材网页,并直接生成可分享的链接。 这个过程将极大提升您制作个性化学习资料的效率。
5/9/2025 3:00:51 PM
AI在线
AI学会“自我谷歌”!!阿里ZeroSearch技术不靠搜索引擎照样学得飞起,成本还降了88%?
想象一下,如果AI不再依赖谷歌搜索、Bing搜索这些“外包助手”,而是自带“搜索引擎大脑”自我检索、自我学习,结果表现还更优秀——你是不是觉得这听起来像是《黑客帝国》第二集?但阿里真的做到了!这不只是一次技术突破,更像是一次“AI自给自足革命”的打响第一枪。 ZeroSearch 的出现,可能正悄悄改变我们构建智能系统的底层逻辑。 01|告别谷歌,AI开始“自我检索”“用强化学习训练一个AI助手,光是搜索费用就能掏空初创公司的预算。
5/9/2025 3:00:51 PM
AI在线
FDA全面部署AI:加速新药审批,OpenAI或成合作伙伴
美国食品药品监督管理局(FDA)于当地时间周四宣布,将在其所有下属中心全面启动人工智能(AI)的内部部署,目标是在6月30日前完成整合。 此前,FDA已成功完成面向科学审评人员的新生成式AI试点项目。 FDA表示,引入这些生成式AI工具旨在通过减少科学家及各领域专家重复性的工作,显著加快新药审批流程。
5/9/2025 3:00:51 PM
AI在线
英伟达开源 OCR 代码推理 AI 模型:LiveCodeBench 基准超 OpenAI o3-Mini 和 o1(low)
英伟达开源其 Open Code Reasoning(OCR)模型套装,含 32B、14B 和 7B 三种参数规模,均采用 Apache 2.0 许可证发布,模型权重和配置已在 Hugging Face 平台开放下载。
5/9/2025 2:28:51 PM
故渊
OpenAI ChatGPT 推首个深度研究连接器,可 AI 洞察 GitHub 代码库
开发者现在可以直接将自己的 GitHub 代码库连接到 ChatGPT,AI 将深入分析代码结构、实现模式以及相关文档,快速生成详细的研究报告或技术总结。
5/9/2025 2:14:32 PM
故渊
OpenAI 发布关于 AI 模型使用的官方建议,助力用户更高效工作
近日,OpenAI 在其帮助中心发布了针对企业用户的全新指南,详细说明了其多种人工智能模型的最佳使用时机。 这一举措旨在帮助用户根据不同的任务需求,选择最合适的 AI 模型,从而提升工作效率和成果质量。 OpenAI 的最新订阅计划 ——ChatGPT Enterprise,提供了企业级的安全与隐私保护,同时允许用户无限制地高速访问其先进的 GPT-4o 和 OpenAI o3推理模型。
5/9/2025 2:00:54 PM
AI在线
快手祭出“内容净化器”KuaiMod!多模态AI专治各种劣质内容
在短视频已经成为亿万用户日常生活的重要组成部分的今天,它不仅仅是一种娱乐方式,更是人们获取信息、表达观点和进行社交的主要渠道。 随着短视频内容的爆炸式增长,各大平台正面临前所未有的挑战:一方面需要高效识别和管理内容,另一方面则需要精准地将优质内容推送给真正感兴趣的用户。 为了解决这些问题,快手作为国内领先的短视频平台,推出了基于多模态大模型的创新方案 KuaiMod,旨在优化短视频平台生态并提升用户体验。
5/9/2025 2:00:53 PM
AI在线
Meta 开源 LlamaFirewall 防护工具,助力构建安全 AI 智能体
Meta AI 公司最新推出 LlamaFirewall,应对 AI 智能体不断演变的威胁格局,为生产环境中的 AI 智能体提供系统级安全保护。
5/9/2025 2:00:21 PM
故渊
OpenAI 突破传统微调,RFT 技术可精准定制 o4-mini 模型
OpenAI 公司在其 o4-mini 推理模型上,推出了强化微调技术(Reinforcement Fine-Tuning, 简称 RFT),为定制基础模型以适应特定任务带来了突破性工具。
5/9/2025 1:50:50 PM
故渊
渥太华医院引入 AI 语音助手,医生工作负担减轻 70%
近年来,医疗行业面临着医生工作负担过重与患者就医难的双重挑战。 为了应对这一问题,加拿大渥太华医院(TOH)于去年引入了微软的 DAX Co pilot,取得了显著成效。 最新数据显示,该系统不仅节省了每位医生每次就诊约七分钟,还将医生报告的倦怠和疲劳降低了70%。
5/9/2025 12:01:53 PM
AI在线
Meta FAIR最新五大AI感知突破:从3D对象定位到协作推理,开源助力产业升级
Meta人工智能研究团队(FAIR)近日公开发布五项前沿研究成果,标志着AI感知领域的重大突破。 这些开源项目从视觉编码器到3D空间理解,再到协作式推理框架,共同构建了通向高级机器智能(AMI)的关键路径,为未来AI如何理解和感知世界带来全新可能。 "机器之眼"再升级:Meta感知编码器引领视觉理解新标准Meta感知编码器(Perception Encoder)作为大规模视觉编码器,在图像和视频处理领域显示出卓越能力,成为AI系统的"眼睛"。
5/9/2025 12:01:52 PM
AI在线
音频同步与视频编辑!腾讯混元开源一致性视频生成工具HunyuanCustom
腾讯开源的一致性视频生成工具 “HunyuanCustom”,该模型不仅能生成生动的视频内容,还能实现音频与口型的同步。 这一创新技术的发布,标志着在深度伪造视频领域的一次重要进步。 一图生成,深度伪造不再遥远HunyuanCustom 的最大亮点在于用户只需提供一张图像,就能创造出深度伪造风格的视频。
5/9/2025 12:01:52 PM
AI在线
Netflix 推出 GPT 驱动的自然语言搜索功能,仅限 iOS 用户
Netflix 宣布推出一项全新的搜索功能,采用 OpenAI 的 ChatGPT 技术,旨在让用户能够使用自然语言进行内容搜索。 用户可以通过简单的短语,如 “我想看一些搞笑的,但不要太傻” 来寻找适合的影片,而无需再输入具体的标题或关键词。 这一功能目前正在 iOS 设备上进行测试,早期测试已在澳大利亚和新西兰展开。
5/9/2025 12:01:51 PM
AI在线
腾讯混元视频生成工具 HunyuanCustom 宣布开源,融合文本、图像、音频、视频等多模态输入生视频的能力
腾讯表示,Hunyuan Custom 模型能实现单主体视频生成、多主体视频生成、单主体视频配音、视频局部编辑等能力,其生成的视频与用户输入的参考主体能保持高度一致。
5/9/2025 11:48:35 AM
问舟
资讯热榜
Meta刚刚开源DINOv3,横扫60+任务,无标注封神!
Meta视觉基座DINOv3王者归来:自监督首次全面超越弱监督,商用开源
扎克伯格看OpenAI直播挖人,北大校友孙之清加入Meta
ChatGPT或将引入广告!OpenAI高管首度松口,用户破7亿仍难盈利
Nvidia 投资 5 亿美元,Cohere 公司估值达 68 亿美元
OpenAI华人露头就被小扎挖!95后北大校友1个月前上直播,今天已是Meta人
破天荒!OpenAI、Cursor多位开发大牛联手曝出GPT5提示词指南!晒官方系统提示词优化秘籍,最大化编程性能,工作流更可控
IDC:未来五年,中国生成式 AI 相关硬件支出将激增至 330 亿元
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
英伟达
Anthropic
代码
训练
算法
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
AI新词
生成式
Claude
苹果
Agent
神经网络
AI for Science
3D
机器学习
研究
生成
人形机器人
xAI
AI视频
计算
Sora
GPU
百度
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
场景
大型语言模型
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
应用
安全