资讯列表
「6月30日AI日报」百度开源文心大模型4.5系列;通义千问多模态生成模型Qwen VLo
欢迎来到AIbase【AI日报】栏目!每天三分钟了解当日AI大事件,助你洞悉AI行业趋势、创新AI产品应用。 更多AI资讯访问:,十款新模型亮相!百度正式发布文心大模型4.5系列并完全开源,包含多种参数配置的十款新模型,使用飞桨框架训练推理,FLOPs利用率47%,在文本多模态基准测试中表现优异,提供一站式使用指南和工具,方便开发者精调部署,已上传至Hugging Face、GitHub等平台。 体验地址: Hugging Face:)GitHub: VLoQwen VLo多模态大模型发布,基于Qwen-VL系列升级,采用渐进式生成方式,精准看懂世界并高质量再创造,支持开放指令编辑修改生成,具备多语言指令能力,可进行图文输入输出,目前处于预览阶段,体验地址为Qwen Chat平台。
6/30/2025 5:00:50 PM
AI在线
重磅发布!新华医院联合商汤医疗推出AI儿童全科医生,“深思考”大医赋能儿科发展
2025 年 6 月 28 日,上海交通大学医学院附属新华医院奉贤院区正式起航。 在开业仪式上,新华医院联合商汤医疗重磅发布基于商汤“深思考”大医·医疗大模型的AI 儿童全科医生,为基层儿科医生诊疗与儿童居家养护赋能,将顶尖医院的儿科临床诊治经验转化为交互式“AI向导”。 作为基于“临床经验数字化 人工智能应用场景化”理念构建的全场景解决方案,AI儿童全科医生是双方以医疗大模型深度赋能临床的突破性实践,为全国儿童健康服务的高质量发展打造智慧医疗新范式。
6/30/2025 4:50:00 PM
陈彩娴
知乎“直答”升级知识库功能,深度融合社区内容打造沉浸式AI问答体验
知乎近日发布了其AI搜索工具“知乎直答”的最新版本,核心亮点在于知识库功能的重要升级。 此次更新不仅支持用户订阅和分享内容,更实现了与知乎社区的深度融合,旨在为用户提供沉浸式、多场景的AI问答体验。 据了解,升级后的“知乎直答”知识库将带来一系列创新功能,包括沉浸式阅读、边看边问、精准提问、多文档提问以及引用提示词等。
6/30/2025 4:00:40 PM
AI在线
酷派集团 × 影目科技达成合作,聚焦 AI & AR 智能眼镜领域
据酷派 coolpad 消息,酷派集团今天与影目科技达成深度战略合作关系,将聚焦 AI&AR 智能眼镜领域。酷派表示,这是其智能终端生态布局的关键一步,也是与伙伴共同定义未来智能生活的里程碑时刻。
6/30/2025 3:36:18 PM
归泷
豆包上线“深入研究”:长途旅行攻略、政策解读、科技趋势分析都能处理
豆包公众号今日宣布,“深入研究”功能已经在豆包App、网页端、电脑版正式开启测试,用户可免费体验。
6/30/2025 3:34:23 PM
清源
越疆科技批量交付全球首款“灵巧操作 + 直膝行走”具身智能人形机器人 Atom
越疆科技在日本名古屋发布全球首款“灵巧操作 + 直膝行走”人形机器人Atom,并开启批量交付。Atom具备工业级±0.05mm重复定位精度,可完成高精度任务。同期发布的CR 30H协作机器人刷新同类产品性能记录。#机器人技术# #越疆科技#
6/30/2025 3:09:10 PM
浩渺
新开源 AI 系统 OmniGen 2:像GPT-4o 一样融合了图像和文本生成
近日,北京人工智能研究院推出了全新的开源系统 ——OmniGen2。 这一系统专注于文本到图像的生成、图像编辑和上下文图像创作。 与2024年发布的第一代 OmniGen 相比,OmniGen2采用了两条独立的解码路径:一条用于文本生成,另一条用于图像生成,且各自拥有独立的参数和解耦的图像标记器。
6/30/2025 3:00:50 PM
AI在线
豆包「深入研究」功能在豆包APP、网页版及电脑版开启测试
近日,豆包APP、网页版及电脑版平台迎来新功能测试——「深入研究」功能已正式上线,供用户免费体验。 该功能旨在助力用户高效处理复杂任务,通过快速整合海量深度信息,生成详尽的研究报告或可视化网页结果。 无论是规划长途旅行、做出复杂购买决策,还是解读最新政策、追踪商业科技趋势,用户只需将豆包更新至最新版本,在App或PC端选择“深入研究”并输入具体指令,几分钟内即可获取定制化报告。
6/30/2025 3:00:50 PM
AI在线
百度重磅开源文心大模型 4.5 系列,国内大模型市场再掀波澜!
近日,百度正式宣布开源其文心大模型4.5系列,共推出了十款模型,包括47B、3B 激活参数的混合专家(MoE)模型,以及0.3B 参数的稠密型模型。 此次开源不仅实现了预训练权重的完整公开,还提供了推理代码,标志着百度在大模型领域的重大进展。 这些新发布的模型可以在飞桨星河社区、Hugging Face 等平台上下载和部署,同时,百度智能云千帆大模型平台也提供了相应的 API 服务。
6/30/2025 3:00:50 PM
AI在线
Gemini定时任务上线!一句话解锁AI自动干活,效率起飞
近日,谷歌Gemini推出全新功能“Scheduled Actions”(定时任务),允许用户通过简单的提示词设定未来或定期任务。 这一功能的发布标志着Gemini向更智能、更主动的数字助理角色迈出了重要一步。 AIbase整理了最新网络信息,为您深度解析这一功能如何重塑生产力工具的未来。
6/30/2025 3:00:50 PM
AI在线
小米“AI百宝箱”内测期结束,7月5日起停止服务
小米内部测试项目“AI百宝箱”于近日正式宣布内测阶段性结束,并计划于2025年7月5日起暂停服务。 “AI百宝箱”作为小米内部孵化的一个重要AI项目,旨在探索和整合前沿AI技术,为用户提供一系列创新功能和体验。 尽管具体的内测功能和应用场景并未完全公开,但其名称暗示了其作为一个多功能AI工具集的定位。
6/30/2025 3:00:26 PM
AI在线
OpenAI CEO 奥尔特曼示警:不要过度依赖人工智能
“人们对 ChatGPT 的信任度非常高,这挺有趣的。因为AI会‘产生幻觉’,它本应是一种你不太应该过度依赖的技术。”
6/30/2025 2:57:52 PM
清源
Claude 开便利亏麻了!AI 被忽悠商品、打折成瘾,最后精神错乱…
近日,人工智能公司 Anthropic 进行了一项实验。 他们让自家的人工智能模型Claude,在办公室里经营一家小型实体商店,目标是测试人工智能在现实经济中自主运行的能力。 该实验是 Anthropic 与人工智能安全评估公司 Andon Labs 合作,他们将这个项目命名为“Project Vend”。
6/30/2025 2:04:56 PM
用好视觉Attention局部性,清华、字节提出Token Reorder,无损实现5倍稀疏、4比特量化
赵天辰,清华大学电子工程系高能效计算实验室研究生,研究方向主要是:面向视觉生成的高效算法,与软硬件协同设计近年来,随着视觉生成模型的发展,视觉生成任务的输入序列长度逐渐增长(高分辨率生成,视频多帧生成,可达到 10K-100K)。 与输入序列长度呈平方复杂度的 Attention 操作,成为主要的性能瓶颈(可占据全模型的 60-80% 的开销),有明显的效率优化需求。 注意力的稀疏化(Sparse Attention)与低比特量化(Attention Quantization)为常用的 Attention 优化技巧,在许多现有应用中取得优秀的效果。
6/30/2025 2:02:00 PM
ChatGPT化身生活操作系统:奥特曼预告下一代顶级AI
OpenAI计划发布一个非常强大的开源模型。 它能够让人们在本地运行极其强大的模型,重新认识“本地部署”的可能性。 在旧金山AI初创学校对话中,奥特曼宣布了以上消息。
6/30/2025 2:00:36 PM
AI编程里程碑!谷歌AI自己写代码惊呆工程师,GPU内核算法反超人类21%
谷歌的AlphaEvolve,还在不断创造新的奇迹。 在5月中旬,谷歌扔出的这个炸弹(号称是数学界AlphaGo的「第37步」时刻),就在不断冲击人们的认知——AI,已经拥有了自我进化能力! 随后,不断有开发者用代码证实,AlphaEvolve的矩阵乘法突破为真!
6/30/2025 2:00:14 PM
RAG终极框架!港大开源RAG-Anything:统一多模态知识图谱
RAG-Anything的核心技术创新在于构建了统一的多模态知识图谱架构,能够同时处理并关联文档中的文字内容、图表信息、表格数据、数学公式等多种类型的异构内容,解决了传统RAG系统仅支持文本处理的技术限制,为多模态文档的智能理解提供了新的技术方案。 项目地址:: (RAG)系统,专注解决复杂场景下的智能问答与信息检索难题。 该系统提供完整的端到端多模态文档处理解决方案,能够统一处理文本、图像、表格、数学公式等多种异构内容,实现从文档解析、知识图谱构建到智能问答的全流程自动化,为下一代AI应用提供了可靠的技术基础。
6/30/2025 1:57:59 PM
百度文心大模型4.5系列正式开源,同步开放API服务
百度文心大模型开源,如期而至。 就在今天,百度官宣文心大模型4.5系列正式开源,还同步提供API服务。 此番,百度一次性推出10款开源模型,涵盖从47B参数的混合专家(MoE)模型到轻量级0.3B稠密型模型,覆盖文本、多模态等多种任务需求。
6/30/2025 1:54:34 PM