应用
Character.AI 推出 AvatarFX 模型:让静态图片中的人物“开口说话”
Character.AI 近日宣布推出全新视频生成模型 AvatarFX,这一突破性技术能够将静态图片转化为具有真实感的可说话视频角色,赋予图像中的人物动态表情、唇部同步以及自然肢体动作。 AvatarFX 的核心是其最先进的基于扩散模型的动态生成技术。 该技术依托经过精心筛选的数据集进行训练,融合了创新的音频条件化、蒸馏和推理策略,使得用户能够以极高的速度生成高保真、时间一致性强的视频。
4/23/2025 10:00:42 AM
AI在线
告别 AI 数据盲区!Relyance AI 新平台实现端到端流向可视化
数据治理平台提供商 Relyance AI 在去年10月获得3210万美元 B 轮融资后,推出了全新的 Data Journeys 平台,旨在解决企业采用 AI 时面临的关键挑战:准确了解数据在复杂系统中的流转。 该平台能够追踪数据在应用程序、云服务和第三方系统中的使用方式和原因,填补了传统数据沿袭方法的空白。 Relyance AI 首席执行官兼联合创始人 Abhi Sharma 强调,Data Journeys 提供了 AI 原生的、情境感知的数据全生命周期视图,从原始数据收集到每次转换和用例都清晰可见。
4/23/2025 10:00:20 AM
AI在线
Character.AI 推出 AvatarFX 模型:AI 实现静转动,让图片角色开口说话
Character.AI 公司今天(4 月 23 日)在 X 平台发布推文,宣布推出 AvatarFX 模型,能够让静态图片中的人物“开口说话”。
4/23/2025 9:04:27 AM
故渊
Manus开源平替!Kortix-AI正式发布开源通用AI智能体平台Suna
Kortix-AI正式发布开源通用AI智能体平台Suna,定位为热门AI工具Manus的开源替代品。 据AIbase了解,Suna集成了浏览器自动化、文件管理、网络爬虫、扩展搜索、命令行执行、网站部署及API集成等功能,通过自然语言对话实现复杂任务的自动化处理。 项目已在GitHub上线,凭借其强大的功能集与开源特性,迅速成为AI开发者和自动化爱好者的关注焦点。
4/23/2025 9:00:42 AM
AI在线
Grok大更新!视觉能力、多语言音频处理与实时搜索功能震撼上线
由xAI打造的生成式人工智能聊天机器人Grok迎来了一次里程碑式的更新,其功能全面升级,不仅新增了视觉处理能力,还实现了多语言音频处理以及语音模式下的实时搜索功能。 这一更新标志着Grok在多模态AI领域的重大突破,为用户提供了更智能、更便捷的交互体验。 以下,AIbase将为您详细解析此次更新的亮点与意义。
4/23/2025 9:00:42 AM
AI在线
苹果 Siri 团队大换血:AI 浪潮下,新负责人能否力挽狂澜?
彭博社今天(4 月 23 日)发布博文,报道称苹果新任 Siri 工程负责人 Mike Rockwell 正在对语音助手 Siri 的开发管理团队进行大刀阔斧的改革。
4/23/2025 6:37:21 AM
故渊
7个AI视频照明样式提示词+效果展示
在AI视频创作中,精准的照明样式是提升作品质感的关键。 本文系统解析7种专业级照明样式提示词,结合视觉效果对比,为创作者提供直观的应用指南。 上期回顾:.
4/23/2025 12:10:08 AM
AI设计师Lena
AI生物大模型ProGen3:重新定义蛋白质设计的未来
在生命科学的前沿,AI 技术正在引发一场革命。 最近,生物计算公司 ProFluent 推出了 ProGen3,一款强大的生成式蛋白质语言模型(PLM),它有望在抗体、工业酶及基因编辑领域带来重大突破。 研究显示,ProGen3的规模和设计优化能够生成功能强大的新型蛋白质,甚至重塑我们对生物学的理解。
4/22/2025 6:00:42 PM
AI在线
腾讯云发布座舱端侧大模型,车载 AI 迎来“边开边提醒”时代
在4月22日上海车展开幕前夕的 TIME DAY 腾讯智慧出行技术开放日上,腾讯云重磅推出全新的座舱端侧大模型。 该模型基于腾讯混元2B 小参数模型打造,并结合汽车行业专业知识数据进行精细调整和本地知识检索增强(RAG),旨在实现通用及车载知识领域的精准问答。 借助该座舱端侧大模型,车辆能够为用户提供包括驾驶行为建议、车辆操作指导、故障处理以及潜在驾驶安全风险提醒等实时服务,真正实现“边开边提醒”的智能体验。
4/22/2025 6:00:42 PM
AI在线
腾讯混元3D AI引擎2.5即将揭晓,3D生成技术再升级
腾讯宣布将于明日正式揭晓混元3D AI引擎2.5(Hunyuan3D AI Engine2.5),进一步推动AI驱动的3D内容创作革新。 据AIbase了解,作为混元3D2.0的升级版本,2.5预计在几何生成、纹理合成与生成速度上实现重大突破,为游戏开发、虚拟现实与创意设计等领域带来更高效的解决方案。 腾讯官方预告引发了全球开发者与创作者的热烈期待,相关细节将在明日发布会公布。
4/22/2025 6:00:42 PM
AI在线
谷歌 Gemini 推出视频分析功能,能准确识别视频拍摄场所
近日,科技媒体 Android Authority 报道称,谷歌最新的 Gemini 聊天机器人引入了一项引人注目的新功能 —— 视频分析。 用户现在可以轻松上传视频并提问,Gemini 会基于视频内容进行智能分析,回答相关问题。 这一创新功能无疑为视频内容的处理带来了新的可能性,吸引了广大用户的关注。
4/22/2025 5:00:42 PM
AI在线
初探谷歌 Gemini 视频解析功能,AI 准确识别视频拍摄场所
科技媒体 Android Authority 今天(4 月 22 日)发布博文,报道称谷歌 Gemini 聊天机器人被发现新增视频分析功能。用户可上传视频并提出相关问题,Gemini 能够基于视频内容进行精准分析。
4/22/2025 3:37:04 PM
故渊
AI治理能力提升!抖音一季度封禁黑产账号260万个
抖音发布《2025第一季度黑产治理数据报告》,显示其在打击黑色产业链方面取得显著成效。 报告显示,抖音在第一季度封禁了260万个涉及水军、欺诈和违规导流的黑产账号,并将涉嫌违法犯罪的线索上报给有关部门。 抖音通过构建以 AI 为核心的治理体系,显著提升了在黑产违规场景的巡检、预警、研判等环节的效率。
4/22/2025 3:00:42 PM
AI在线
全球首款!Ainos AI 鼻成功植入ugo人形机器人,机器拥有“嗅觉”
人工智能气味数字化领导者 Ainos.宣布,其专有的 AI Nose 嗅觉模块已成功安装到日本顶级服务机器人公司 ugo, Inc. 开发的人形机器人上。 此次于2025年4月9日完成的安装,标志着全球首个具备功能性嗅觉的机器人诞生,为机器人技术、人工智能和人机交互开创了全新纪元。
4/22/2025 3:00:42 PM
AI在线
日本公司为人形机器人装上“AI 鼻子”,赋予其嗅觉能力
日本Ainos与ugo合作,首次将AI鼻子系统集成到商业人形机器人中,让机器人具备嗅觉感知能力。这一技术突破将在工业、医疗和日常生活等领域带来革命性变化。#AI鼻子技术# #机器人嗅觉#
4/22/2025 2:06:46 PM
远洋
真我推出首款 AI 翻译耳机 Bud Air7 Pro,支持 32 种语言翻译!
真我手机官方微博宣布,其首款 AI 翻译耳机 Bud Air7Pro 即将于4月23日下午16时正式上市。 这款耳机将搭载讯飞的星火认知大模型4.0Ultra,具备强大的翻译能力,不仅能够支持中文与32种语言的面对面翻译,还具备同声传译功能,为用户的跨语言交流提供了极大的便利。 这款耳机的发布将与真我 GT7手机的新品发布会一起进行,届时将展示更多创新技术。
4/22/2025 2:00:41 PM
AI在线
RAG增强系统Node:AI检索革命,效率飙升30%!
随着生成式人工智能技术的飞速发展,检索增强生成(Retrieval-Augmented Generation, RAG)系统正成为提升大语言模型(LLM)准确性和上下文相关性的关键技术。 近日,一款名为NodeRAG的创新RAG增强系统引起了业界广泛关注,其独特的异构图结构为RAG工作流带来了革命性突破。 NodeRAG:异构图驱动的RAG新范式NodeRAG是一个以图结构为核心的RAG框架,通过引入异构图(Heterogeneous Graph)技术,将文档分解信息与大语言模型提取的洞察力统一为图中的节点。
4/22/2025 2:00:41 PM
AI在线
OpenAI o3 / o4-mini 模型 AI 生成文本含特殊符号,推测为隐形水印
AI 初创公司 Rumi 发现 OpenAI 公司在 o3 和 o4-mini 模型中,嵌入了窄不换行空格(Narrow No-Break Space, NNBSP, U+202F)等特殊 Unicode 字符。
4/22/2025 12:19:13 PM
故渊
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
LLaMA
Copilot
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind