应用
昆仑万维宣布开源 Matrix-Game 大模型:工业界首个开源的 10B+ 空间智能大模型,支持《我的世界》
昆仑万维表示,Matrix-Game 是 Matrix 系列在交互式世界生成方向的正式落地,也是工业界首个开源的 10B+ 空间智能大模型,它是一个面向游戏世界建模的交互式世界基础模型,专为开放式环境中的高质量生成与精确控制而设计。
5/13/2025 10:16:15 AM
问舟
阿里MNN神更新!移动端开源多模态AI支持Qwen-2.5,文本图像语音全搞定!
阿里巴巴开源项目MNN(Mobile Neural Network)发布了其移动端多模态大模型应用MnnLlmApp的最新版本,新增对Qwen-2.5-Omni-3B和7B模型的支持。 这款完全开源、运行于移动端本地的大模型应用,支持文本到文本、图像到文本、音频到文本和文本到图像生成等多种模态任务,以其高效性能和低资源占用引发开发者广泛关注。 AIbase观察到,MNN的此次更新进一步推动了多模态AI在移动端的普及。
5/13/2025 10:01:07 AM
AI在线
AI药物研发神器DiffSMol上线!3秒生成候选药物,成功率暴涨5倍!
5月12日,俄亥俄州立大学研究团队推出DiffSMol,一款生成式人工智能模型,专为生成候选药物的3D结构设计()。 DiffSMol通过分析已知配体(与蛋白质靶点结合的分子)的形状,仅需数秒即可生成具有优异结合特性的新型3D分子,成功率高达61.4%,远超此前研究仅12%的水平。 AIbase观察到,这一突破性进展有望重塑长达十年的药物研发流程,显著提升效率与成本效益。
5/13/2025 10:01:03 AM
AI在线
Lovart震撼发布:全球首个设计Agent,一键从创意到成品
人工智能设计领域迎来里程碑式突破!一款名为Lovart的AI设计Agent于近日正式亮相,被誉为“全球首个设计Agent”。 这一产品以其从文本提示到专业视觉设计的端到端能力,引发了业内广泛关注。 产品亮点:一键从创意到成品Lovart的核心在于其全链路设计能力,能够将用户的模糊创意或简单文本描述转化为像素级精度的专业设计作品。
5/13/2025 10:01:02 AM
AI在线
月之暗面Kimi界面升级:气泡样式优化 改为无边界内容展示
月之暗面科技有限公司旗下的智能助手Kimi宣布对其产品界面进行了一次重大升级。 此次升级的核心目标是打破传统对话框的限制,将Kimi从一个简单的聊天工具转变为一个功能更强大、信息呈现更丰富的多模态容器。 Kimi的界面重构包括了多项重要更新。
5/13/2025 10:01:02 AM
AI在线
OpenAI推出深度研究报告一键导出PDF功能
人工智能领域的领军企业OpenAI宣布,为其ChatGPT深度研究(Deep Research)工具新增了一项重要功能——一键将深度研究报告导出为PDF。 此功能不仅提升了研究报告的实用性,还进一步推动了AI在企业场景中的落地应用。 功能亮点:完整保留格式,专业输出OpenAI的深度研究工具能够通过多步骤网络搜索和信息整合,生成包含引用、表格和图片的详尽报告。
5/13/2025 10:01:02 AM
AI在线
OpenAI 与软银的百亿 AI “星际之门”计划进展缓慢,融资难题悬而未决
在人工智能领域,OpenAI 与软银共同推出的星际之门(Stargate)项目一度引起了广泛关注。 该项目计划投资高达1000亿美元,目标是建立全球领先的人工智能基础设施,并希望在未来将投资额提升至5000亿美元。 然而,随着时间的推移,融资进展的缓慢和市场环境的变化使得这一宏伟计划面临挑战。
5/13/2025 10:01:02 AM
AI在线
全球首款设计Agent Lovart内测!一句话搞定Logo、视频、品牌全套
5月12日,Lovart AI正式宣布推出全球首款设计Agent,定位为文生图领域最具创新性的产品形态。 作为一款集成图像、视频和音乐模型的AI设计工具,Lovart通过自然语言指令实现从任务拆解到最终输出的全链路自动化设计,彻底颠覆传统设计工作流。 AIbase观察到,Lovart的Beta测试已在全球引发热烈反响,吸引了设计师、营销团队和初创企业的广泛关注。
5/13/2025 10:01:02 AM
AI在线
颠覆传统ISP,Glass Imaging用AI“重塑摄影”:AR、手机、无人机市场全面瞄准
人工智能成像技术公司 Glass Imaging 宣布完成2000万美元A轮融资,由全球知名软件投资机构 Insight Partners 领投,GV(谷歌风投)、Future Ventures 和 Abstract Ventures 等老股东继续加码。 此轮融资将用于加速 GlassAI 技术的开发,并拓展其在智能手机、无人机、可穿戴设备等平台的应用。 Glass Imaging 总部位于加州洛斯阿尔托斯,致力于通过人工智能技术解决镜头像差、传感器缺陷和光学模糊等问题,以显著提升图像质量。
5/13/2025 10:01:02 AM
AI在线
字节跳动发布统一图像定制框架DreamO:集成换装、换脸与风格迁移
字节跳动在Hugging Face平台正式开源了全新图像定制框架DreamO,这一框架集成了图像换装、换脸、造型调整、风格迁移以及多主体组合等多种功能,为AI图像编辑领域带来了全新的技术突破。 AIbase编辑部整理了最新信息,深入解析DreamO的核心亮点及其对行业的潜在影响。 框架亮点:一站式图像定制解决方案DreamO被设计为一个统一的图像定制框架,支持多样化的编辑任务,并通过灵活的参数设置实现无缝整合。
5/13/2025 10:01:02 AM
AI在线
知名女演员强烈要求 Meta 删除 AI 伪造广告,强调肖像权的重要性
近日,知名女演员杰米・李・柯蒂斯(Jamie Lee Curtis)在社交媒体上对 Meta 公司 CEO 马克・扎克伯格(Mark Zuckerberg)发出强烈呼吁,要求其立即删除一则使用 AI 深度伪造技术制作的虚假广告。 这则广告通过修改柯蒂斯接受 MSNBC 采访的视频片段,歪曲她的言论来推销一款未公开的产品。 柯蒂斯在声明中指出,她从未授权或同意这则广告的制作和发布,认为这种行为严重侵犯了她的肖像权和个人信誉。
5/13/2025 9:00:52 AM
AI在线
合合信息推出 MCP 服务,助力大模型高效智能文档处理
在人工智能和大模型技术飞速发展的今天,如何高效调用外部工具已成为开发者们面临的新挑战。 不同大模型的调用结构和参数格式各不相同,导致开发者不得不为每种模型单独编写工具调用逻辑,进而影响了集成的效率。 为了解决这一难题,合合信息近日推出了文档处理领域首批 MCP(Model Context Protocol)服务,为企业和开发者提供了一个 “万能接口”。
5/13/2025 9:00:52 AM
AI在线
谷歌启动人工智能初创企业基金
谷歌宣布推出一项新的投资基金,旨在支持人工智能领域的初创企业。 这一名为 “人工智能未来基金” 的项目,将为符合条件的初创公司提供多方面的支持,包括资金投资、提前体验谷歌最新人工智能模型的机会,以及来自谷歌团队的专业指导。 在发布的博客文章中,谷歌表示,这项基金不仅仅是财务上的支持,还包括使用谷歌云服务的积分。
5/13/2025 9:00:52 AM
AI在线
Google Gemma AI 模型下载量突破 1.5 亿次
Google 近期宣布,其人工智能模型集合 Gemma 的下载量已经突破1.5亿次,标志着该项目取得了显著进展。 Google DeepMind 的开发者关系工程师 Omar Sanseviero 在社交平台 X 上分享了这一消息,并透露,目前在人工智能开发平台 Hugging Face 上,开发者们已经创造出了超过7万个不同版本的 Gemma 模型。 Gemma 于2024年2月正式发布,旨在与 Meta 的 Llama 等其他开放模型系列进行竞争。
5/13/2025 9:00:52 AM
AI在线
Kimi与小红书联手,推出21天打卡挑战吸引用户
近日,人工智能公司 Kimi 宣布与社交电商平台小红书达成市场营销合作,双方共同推出了一项名为 “21天打卡挑战” 的活动,旨在鼓励用户深入体验 Kimi 的核心功能。 小红书作为一个以年轻用户为主的社交平台,这次合作为 Kimi 提供了提升品牌认知的良机。 然而,在行业竞争愈发激烈的背景下,Kimi 面临着越来越大的商业化压力。
5/13/2025 9:00:52 AM
AI在线
0.33秒生成1秒音频!Muyan-TTS 开源上线,播客、有声书场景完美适配
开源语音合成迎来新突破!近日发布的开源 TTS 模型 Muyan-TTS 专为播客、有声书、长视频等场景设计,具备零样本语音合成、极速生成与高连贯性朗读能力,是当前最适合批量化长语音生成的模型之一。 Muyan-TTS 基于超10万小时播客数据预训练,仅需 0.33秒即可生成1秒高质量音频,支持无需打断地朗读数分钟文本,语音自然流畅。 更支持说话人定制,任意声音克隆,一键生成具有个性化语气与节奏的语音内容。
5/13/2025 9:00:52 AM
AI在线
苹果 iOS 19 将推出AI电池管理新功能
据彭博社的最新报道,苹果公司在即将推出的 iOS19更新中,将引入一项由人工智能驱动的电池管理功能,旨在帮助用户更有效地延长 iPhone 的电池寿命。 这一新功能将能够分析用户的使用习惯,并相应地优化设备设置,以减少电池的耗损。 iOS19中的电池管理选项将作为 Apple Intelligence 功能套件的一部分。
5/13/2025 9:00:52 AM
AI在线
ChatGPT神更新!Deep Research报告一键导出PDF,表格图像全保留,效率翻倍!
ChatGPT的Deep Research功能正式上线PDF导出功能,为用户提供更便捷的报告分享与存档体验()。 用户现可通过点击分享图标并选择“下载为PDF”,将研究报告导出为包含表格、图像、链接引文和来源的格式化文档。 这一功能不仅适用于新生成的研究报告,还支持历史报告的导出,显著提升了Deep Research的实用性与企业适用性。
5/13/2025 9:00:52 AM
AI在线
资讯热榜
Meta刚刚开源DINOv3,横扫60+任务,无标注封神!
Meta视觉基座DINOv3王者归来:自监督首次全面超越弱监督,商用开源
扎克伯格看OpenAI直播挖人,北大校友孙之清加入Meta
ChatGPT或将引入广告!OpenAI高管首度松口,用户破7亿仍难盈利
Nvidia 投资 5 亿美元,Cohere 公司估值达 68 亿美元
OpenAI华人露头就被小扎挖!95后北大校友1个月前上直播,今天已是Meta人
破天荒!OpenAI、Cursor多位开发大牛联手曝出GPT5提示词指南!晒官方系统提示词优化秘籍,最大化编程性能,工作流更可控
IDC:未来五年,中国生成式 AI 相关硬件支出将激增至 330 亿元
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
英伟达
Anthropic
代码
训练
算法
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
AI新词
生成式
Claude
苹果
Agent
神经网络
AI for Science
3D
机器学习
研究
生成
人形机器人
xAI
AI视频
计算
Sora
GPU
百度
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
场景
大型语言模型
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
应用
安全