应用
Ollama推出全新多模态AI引擎,推理性能显著提升
前不久,Ollama 宣布推出一款全新的多模态 AI 引擎,这款引擎的研发是独立于原有的 llama.cpp 框架进行的,标志着公司在人工智能领域迈出了重要一步。 这一引擎是基于 Golang 编程语言开发,旨在大幅提高本地推理的精度,同时增强大型图像处理的能力。 新引擎的亮点在于其引入了图像处理元数据、KVCache 优化及图像缓存功能。
初创公司Firecrawl再次寻找AI代理员工,预算100万美元
Y Combinator支持的初创公司Firecrawl再次启动了招聘AI代理的计划,为此专门拨款100万美元。 该公司在YC招聘平台上发布了三个"仅限AI代理"的职位,包括内容创作代理、客服工程师和初级开发代理,每个职位月薪均为5000美元。 据Firecrawl创始人Caleb Peffer向TechCrunch透露,新职位发布约一周内就收到了约50份申请。
研究:AI 聊天机器人在数据总结能力上愈加糟糕,关键细节常被遗漏
随着人工智能技术的迅猛发展,各大 AI 创业公司不断宣称其产品将工作方式和知识获取的方式。 然而,最近一项发表在《皇家学会》上的研究却揭示了新一代 AI 模型在总结文本时存在严重问题,令人担忧。 研究显示,新款 AI 聊天机器人在提供信息时,有高达73% 的概率会遗漏关键信息。
张朝阳:如果晚生 30 年,自己也会卷入到AI里面
在最近召开的2025搜狐科技年度论坛上,搜狐创始人、董事局主席兼首席执行官张朝阳,与清华大学讲席教授张亚勤及猎豹移动董事长兼 CEO 傅盛等三位科技领域的重量级嘉宾进行了深入的讨论。 论坛围绕人工智能(AI)、人形机器人和脑科学等前沿科技展开,吸引了众多关注。 图源备注:图片由AI生成,图片授权服务商Midjourney张朝阳在讨论中表示,如果晚生30年,自己也会卷入到AI里面,包括人形机器人,脑科学。
Stability AI与Arm推出手机级音频生成AI:7秒内创建11秒立体声
Stability AI和Arm联合发布了一款名为"稳定音频开放小型"(Stable Audio Open Small)的紧凑型文本转音频模型,该模型能够在约7秒内生成长达11秒的高质量立体声音频片段,且经过优化可在智能手机等移动设备上运行。 这一突破基于加州大学伯克利分校研究人员开发的"对抗相对对比"(Adversarial Relativistic-Contrastive,ARC)技术。 该模型在高端硬件如Nvidia H100GPU上的表现更为惊人,能够在仅75毫秒内完成44kHz立体声音频的生成,实现了近乎实时的音频合成能力。
Anthropic获得25亿美元信贷支持,年收入激增至20亿美元
近日,人工智能公司 Anthropic 宣布获得了一项高达25亿美元的五年期循环信贷额度,此举旨在增强公司的财务流动性并推动业务扩展。 这家由前 OpenAI 高管创立的公司,其聊天机器人 Claude 自2023年推出以来,迅速在市场上获得了广泛关注和认可。 据悉,Anthropic 的估值已达615亿美元,而在2023年第一季度,其年化收入更是翻倍至20亿美元,显示出公司在竞争激烈的 AI 领域中正以惊人的速度成长。
OpenAI 计划在阿布扎比建造超大数据中心,规模远超摩纳哥
近日,OpenAI 与阿联酋科技公司 G42达成合作,将在阿布扎比建设一个规模巨大的数据中心园区。 这个项目将耗电达5000兆瓦,园区面积达到10平方英里,规模将成为全球最大的 AI 基础设施之一,甚至超过摩纳哥的整体面积。 这项新建的数据中心是 OpenAI “星际之门”(Stargate)计划的重要组成部分。
中国移动发布 AI 通话系列产品:电话智能摘要、通话 MV、多模态助理
广东移动于 5 月 15 日举行移起 AI —— 2025 年三大服务计划发布会,并举行 AI 终端生态联盟启动仪式。
OpenAI推出全新云端代码助手Codex,助力开发者提升效率
OpenAI 近日在其官网上发布了一个全新的云端代码助手 ——Codex。 这款强大的工具旨在为开发人员提供更高效的编码体验,能够自动执行多种编码相关任务,让程序员从繁琐的细节中解放出来。 Codex 的功能十分强大,可以帮助开发者编写功能代码、回答关于代码库的问题、修复程序错误以及提出拉取请求的审查等。
B站团队推出AniSora开源动漫视频生成模型,一键打造多种风格动画!
近日,B 站(哔哩哔哩)团队在5月12日正式开源了一款名为 AniSora 的动漫视频生成模型。 这个新工具使用户能够一键创建多种动漫风格的视频片段,涵盖系列剧集、中国原创动画、漫画改编、VTuber 内容、动漫宣传片以及鬼畜动画等类型,丰富了动漫创作的可能性。 B 站团队指出,虽然目前市面上已经有 Sora、Kling、CogVideoX 等多款自然视频生成模型,但在动漫视频领域,现有技术仍显不足。
OpenAI 新一代模型GPT-5将集成多项功能,致力于成为全能助手
在人工智能领域的最新动态中,OpenAI 研究副总裁 Jerry Tworek 近日在 Reddit 上透露了即将推出的下一代基础模型 ——GPT-5的最新信息。 这款新模型被形象地称为 “All in One”,将整合多个现有产品,包括 Codex、Operator、Deep Research 和 Memory,以减少用户在不同工具之间切换的繁琐。 在此次问答活动中,Tworek 分享了 Codex 的开发背景以及它在提升编程效率方面的成就。
OpenAI 发布全新编程智能体 Codex
最近,OpenAI 推出了一款全新 AI 编程助手 Codex,这款智能编程工具由全新优化的 codex-1模型支持,是OpenAI-o3的一个微调版本,专门针对软件工程进行了优化。 Codex具备多任务并行处理的能力,能在短短30分钟内完成原本需要数天才能完成的开发任务。 Codex 的上线预示着一个人人都能轻松开发出热门应用的时代即将来临。
OpenAI 揭秘 GPT-5:将多款产品整合为一体
近日,OpenAI 的研究副总裁 Jerry Tworek 在 Reddit 上参与了一场问答活动,透露了下一代基础模型 GPT-5的最新动态。 这款新模型的目标是将多个产品整合在一起,以减少用户在不同模型间切换的困扰。 具体来说,GPT-5将把 Codex、Operator、Deep Research 和 Memory 等工具汇聚成一个统一的体系。
月产2000张!高手如何打造AI绘图的全自动化流程?
我接了个活,为一家童书电商公司生产教辅插图。 本文记录了我如何分析可行性,如何做前期准备,如何干完第一单,如何决定金盆洗手的整个过程。 其中也会穿插大量 AI 技巧和技术实践,讲原理和思路为主,具体操作不会写得那么详细。
超多案例!让 Lovart 作图更好看更高效的提示词在这里了!
嗨大家好! 周末愉快! 相信近期大家已经被 Lovart 的相关讯息刷屏好多次了,我在设计群里也看到了群友们陆陆续续拿到了邀请码。
中国团队打造!这才是现在最强的AI声音模型!
几个月前,我写过一篇 MiniMax 的 AI 声音模型。 30秒完美复刻你的声音,这就是当今最强的中文AI语音克隆! 往期作者干货:中文,在 AI 世界,好像突然一夜崛起了。
OpenAI:GPT-5 就是 All in One,集成各种产品
OpenAI研究副总裁 Jerry Tworek 剧透了下一代基础模型 GPT-5 的最新消息:为了减少模型切换,未来计划将 Codex、Operator、Deep Research 和 Memory 整合在一起。
B站团队开源动漫视频生成模型 AniSora,一键创建不同风格片段
AniSora 能够一键创建多种动漫风格的视频片段,包括系列剧集、中国原创动画、漫画改编、VTuber 内容、动漫 PV 和鬼畜动画等。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉