AI新词
新开源 AI 系统 OmniGen 2:像GPT-4o 一样融合了图像和文本生成
近日,北京人工智能研究院推出了全新的开源系统 ——OmniGen2。 这一系统专注于文本到图像的生成、图像编辑和上下文图像创作。 与2024年发布的第一代 OmniGen 相比,OmniGen2采用了两条独立的解码路径:一条用于文本生成,另一条用于图像生成,且各自拥有独立的参数和解耦的图像标记器。
豆包「深入研究」功能在豆包APP、网页版及电脑版开启测试
近日,豆包APP、网页版及电脑版平台迎来新功能测试——「深入研究」功能已正式上线,供用户免费体验。 该功能旨在助力用户高效处理复杂任务,通过快速整合海量深度信息,生成详尽的研究报告或可视化网页结果。 无论是规划长途旅行、做出复杂购买决策,还是解读最新政策、追踪商业科技趋势,用户只需将豆包更新至最新版本,在App或PC端选择“深入研究”并输入具体指令,几分钟内即可获取定制化报告。
Gemini定时任务上线!一句话解锁AI自动干活,效率起飞
近日,谷歌Gemini推出全新功能“Scheduled Actions”(定时任务),允许用户通过简单的提示词设定未来或定期任务。 这一功能的发布标志着Gemini向更智能、更主动的数字助理角色迈出了重要一步。 AIbase整理了最新网络信息,为您深度解析这一功能如何重塑生产力工具的未来。
小米“AI百宝箱”内测期结束,7月5日起停止服务
小米内部测试项目“AI百宝箱”于近日正式宣布内测阶段性结束,并计划于2025年7月5日起暂停服务。 “AI百宝箱”作为小米内部孵化的一个重要AI项目,旨在探索和整合前沿AI技术,为用户提供一系列创新功能和体验。 尽管具体的内测功能和应用场景并未完全公开,但其名称暗示了其作为一个多功能AI工具集的定位。
飞利浦重磅推出 8 号 Pro AI 耳机,解锁多语言沟通新体验!
在近日于西安举行的2025新品发布会上,飞利浦影音及配件公司推出了三款颠覆性产品,吸引了众多科技爱好者的关注。 这些新产品包括专为年轻白领和 Z 世代打造的 “刀片” 磁吸充电宝、针对商务精英的8号 Pro AI 耳机以及适合家庭娱乐的 KTV・云・音箱。 这一系列创新产品不仅彰显了飞利浦在消费电子领域的领导地位,也标志着其在中国市场开辟了全新的赛道。
百度文心系列大模型在飞桨平台开源,涵盖多款最新模型
据新浪科技消息,百度旗下文心系列大模型近日已在其飞桨(PaddlePaddle)平台开源,其中包括 ERNIE-4.5-VL-424B-A47B-Paddle 和 ERNIE-4.5-300B-A47B-Paddle 等数十款最新模型。 尽管百度方面尚未主动披露此次开源行动,但飞桨平台的更新信息显示,这一系列动作集中在6月29日至6月30日,是其最新的举措。 有内部人士证实:“官网上新并公布了开源代码,足见公司确实已在推进开源举措。
Runway AI重磅推出“游戏世界” 大型互动文本冒险来了
近日,AI技术先锋企业Runway宣布即将推出其全新生成式AI平台“游戏世界”(Game Worlds),这一创新产品不仅标志着Runway从影视领域的成功拓展至游戏行业,更为广大创作者和玩家带来了全新的互动体验。 “游戏世界”:AI驱动的互动文本冒险Runway的“游戏世界”平台以生成式AI为核心,允许用户通过简单的文字输入即可创建并体验基于文本的冒险游戏。 与传统游戏开发需要大量资源和专业技能不同,该平台通过AI自动生成游戏的文本叙述和配套图像,大幅降低了创作门槛。
重磅发布!中国首个海洋开源大模型 OceanGPT(沧渊)亮相!
6月26日,中国首个专注于海洋领域的开源大模型 OceanGPT(沧渊)在浙江杭州正式发布。 这一大模型由浙江大学的海洋精准感知技术全国重点实验室主导研发,旨在推动海洋科学研究和应用。 OceanGPT 具备了基础的海洋专业知识问答能力,能够自然地解读声呐图像和海洋观测图等多模态数据。
腾讯开源 Hunyuan-A13B:小尺寸,大智慧的 AI 模型
Hunyuan-A13B 是一个由腾讯最新开源的大语言模型,它以创新的设计理念,在相对较小的活跃参数规模下,实现了强大的性能表现,特别适用于资源受限的环境。 这款模型采用了细粒度 MoE(Mixture-of-Experts)架构,拥有130亿活跃参数,但总参数量高达800亿。 这种设计让它在保持高效和可扩展性的同时,能够提供前沿的推理能力和通用应用支持。
ChatGPT引导心理迷失者联系记者,揭示AI对用户行为的影响
近日,《纽约时报》记者卡什米尔・希尔(Kashmir Hill)曝光了一个引人关注的现象:ChatGPT 开始主动引导那些陷入阴谋论或心理困扰的用户,建议他们直接通过电子邮件与她联系。 在与用户的对话中,ChatGPT 描述希尔为 “富有同情心”、“扎根现实”,并提到她曾对人工智能进行过深入研究,可能会对这些用户提供理解与支持。 希尔提到,曾有一位曼哈顿的会计师深信自己是《黑客帝国》中的尼奥,认为自己需要逃离一个计算机模拟的现实。
OpenAI 高管回应 Meta 挖角潮:正积极留人,将“重新调整”薪酬
面对 Meta 大规模挖角高级研究人员,OpenAI 的首席研究官马克·陈于上周六向团队成员发布内部备忘录,强调公司领导层正积极应对。 Mark Chen在《连线》杂志获得的 Slack 备忘录中写道,他感受“有人闯入我们家并偷了东西”,明确表达了对人才流失的担忧。 据此前多家媒体报道,过去一周已有八名研究人员从 OpenAI 跳槽至 Meta。
OpenAI 首席执行官:警惕对人工智能的过度信任
在最近的一次采访中,OpenAI 的首席执行官萨姆・奥特曼(Sam Altman)表达了他对用户对人工智能聊天机器人 ChatGPT 过度信任的担忧。 尽管 ChatGPT 在全球范围内的使用日益广泛,奥特曼却指出,这项技术并非毫无缺陷,用户在使用时应保持警惕。 在 OpenAI 官方播客的首集节目中,奥特曼提到,虽然 ChatGPT 受到许多人喜爱并在多个领域被广泛应用,例如研究和育儿建议,但它依然可能产生误导性或虚假的信息。
OpenAI CEO 发声:不要轻信人工智能,背后隐藏着风险!
在人工智能领域日益引人注目的背景下,OpenAI 的首席执行官萨姆・奥特曼(Sam Altman)近日发出了一个重要警告。 他指出,尽管其公司开发的聊天机器人 ChatGPT 在全球范围内获得了广泛应用和认可,但用户对其的信任程度却让他感到惊讶,甚至有些担忧。 在最新的采访中,奥特曼强调,用户应当对 ChatGPT 保持一份谨慎的态度。
OpenAI宣布2025年开发者大会将在旧金山举办,预计吸引1500多名开发者参与
OpenAI 已正式公布了其下一届开发者大会(DevDay)的时间和地点,定于2025年10月6日在旧金山举行。 这次大会将吸引超过1500名开发者参加,预计将成为迄今为止规模最大的一次开发者活动。 此次 DevDay 的议程丰富多彩,包含多个重要环节。
这家 AI 驱动的创业工作室计划每年孵化 10 万家新公司
近年来,创业热潮愈演愈烈,尤其是在疫情影响下,很多人开始重新审视自己的职业发展。 在这样的背景下,亨里克・维尔德林(Henrik Werdelin)创办了名为 Audos 的初创工作室,计划利用人工智能技术帮助普通人实现创业梦想。 他的目标是每年孵化10万家新公司,而不再局限于过去在 Prehype 时帮助的几十家。
重磅!谷歌开源Gemma3n多模态模型,手机也能跑出云端AI性能
谷歌于本周五凌晨正式发布并开源全新端侧多模态大模型Gemma3n,这一突破性产品为手机、平板、笔记本等端侧设备带来了此前只能在云端体验的强大多模态功能。 核心特性:小体积大能力Gemma3n提供E2B和E4B两个版本,虽然原始参数量分别为5B和8B,但通过架构创新,其内存占用仅相当于传统2B和4B模型,分别只需2GB和3GB内存即可运行。 该模型原生支持图像、音频、视频和文本的多模态输入处理,支持140种文本语言和35种语言的多模态理解。
一键生成爆款视频!HeyGen AI视频Agent席卷内容创作界!
近日,AI视频生成领域的领军企业HeyGen推出了一款革命性的AI视频Agent,为视频内容创作带来了全新突破。 据AIbase了解,这款AI视频Agent能够通过简单的素材上传,自动完成从故事规划、脚本编写到镜头选择的整个视频制作流程,让用户在几分钟内即可获得可直接发布的专业级视频内容。 这一创新功能不仅大幅降低了视频创作门槛,还为广告、短视频、产品演示等场景提供了高效解决方案。
YouTube 在搜索结果中添加AI摘要,测试对话式AI工具扩展
近日,YouTube 宣布将推出两项新的人工智能(AI)功能,旨在提升用户的观看体验。 其中一项功能类似于 AI 概览,将出现在搜索结果中,而另一项则是对话式 AI 工具的扩展访问。 这些新功能的推出,将为用户提供更加智能化的内容搜索和互动方式。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
AI新词
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
腾讯
算法
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
AI设计
生成式AI
大型语言模型
搜索
视频生成
亚马逊
AI模型
特斯拉
DeepMind
场景
深度学习
Copilot
Transformer
架构
MCP
编程
视觉