应用
谷歌推出全新 Gemini 2.5 Flash:智慧与速度兼具的 AI 助手
谷歌近日在其 Gemini 系列中推出了全新的 Gemini2.5Flash,这一版本正在进行预览,旨在为开发者提供更强大的推理能力。 借助 “思考” 过程,开发者可以根据需求灵活控制成本和延迟,打造更具性价比的解决方案。 与前一版本2.0Flash 相比,Gemini2.5Flash 的升级主要体现在推理能力上。
4/18/2025 9:01:28 AM
AI在线
Midjourney图像编辑器迎来重大更新:全新UI、图层功能与智能工具上线
全球领先的AI图像生成平台Midjourney于2025年4月17日宣布,其图像编辑器迎来了一次重要更新。 此次更新不仅优化了用户体验,还引入了多项创新功能,进一步巩固了Midjourney在AI创意工具领域的领先地位。 以下是AIbase为您整理的最新资讯,带您深入了解这一激动人心的升级。
4/18/2025 9:00:50 AM
AI在线
微软 BitNet b1.58 2B4T 登场:内存占用仅 0.4GB,20 亿参数模型颠覆 AI 计算
微软研究团队推出了一款开源大型语言模型 BitNet b1.58 2B4T,区别于传统训练后量化的方式,这款拥有 20 亿参数的大型语言模型(LLM)以 1.58 位低精度架构原生训练而成。
4/18/2025 8:54:22 AM
故渊
OpenAI 最强推理模型 o3 / o4-mini 发布后,“照片查位置”成最新热门玩法
ChatGPT 已成为一种强大的“定位工具”。X上的用户很快发现,o3等新模型善于从各种细节中推断城市、地标,甚至具体的餐馆和酒吧。
4/18/2025 8:16:02 AM
清源
通义万相2.1开源首尾帧生视频模型Wan2.1-FLF2V-14B
阿里通义宣布开源 Wan2.1系列模型,其中包括强大的首尾帧生视频模型。 这一模型采用了先进的 DiT 架构,在技术上实现了多项突破,显著降低了高清视频生成的运算成本,同时确保了生成视频在时间与空间上的高度一致性。 此次开源为开发者和创作者提供了强大的工具,推动视频生成技术的发展。
4/18/2025 8:01:08 AM
AI在线
字节 Seed 开源 UI-TARS-1.5:基于视觉-语言模型构建的多模态智能体
UI-TARS-1.5 昨日正式发布并开源。这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。
4/18/2025 7:48:14 AM
清源
谷歌也要“送 AI 进校园”:美国大学生可限时免费订阅 Google One AI Premium 计划
这一订阅方案不仅提供2TB云存储空间,还包含多项 AI 工具,帮助学生“更高效地学习”。其中,Gemini 2.5 Pro 驱动的 Gemini Advanced,是谷歌为对抗 ChatGPT Plus 推出的旗舰级产品。
4/18/2025 7:39:43 AM
清源
性能依旧领先!OpenAI深夜上线o3满血版和o4 mini
昨天晚上 1 点,OpenAI 的直播如约而至。 其实在预告的时候,几乎已经等于明示了。 没有废话,发布的就是 o3 和 o4-mini。
4/18/2025 1:02:47 AM
数字生命卡兹克
95%设计师不知道的Zero-UI,可能是未来必然的设计趋势
Zero-UI,也就是零用户界面,最近又悄悄地火了起来。 事实上,它并不是一个新概念,大家熟悉的智能家居的语音交互,就是非常典型的例子。 随着 AI 技术的发展,它将越来越多地融入到我们的生活和工作场景中,未来设计趋势也将随之转变。
4/18/2025 12:50:57 AM
58UXD 团队
防赔款指南!5分钟搞懂AI字体版权问题(附查询网站)
嗨大家好! 今天的干货不是 AI 技巧方面的,而是来自法律方面的。 前几天我发了一条字体设计的提示词模板的内容,相信有的朋友已经看过了,我看到评论区很多朋友提出了疑问,那就是如果我用 AI 做的字体侵权了怎么办?
4/18/2025 12:42:00 AM
阿真Irene
业界首个,阿里通义万相“首尾帧生视频模型”开源
它可根据用户指定的开始和结束图片,生成一段能衔接首尾画面的 720p 高清视频,此次升级将能满足用户更可控、更定制化的视频生成需求。
4/17/2025 10:55:39 PM
汪淼
刚刚,豆包1.5·深度思考模型上线,特供「视觉版本」,大模型多模态推理的时代真来了
这几天的大模型圈子,特别热闹。 凌晨是 OpenAI 的 o3 和 o4-mini,一觉醒来,国内这边的豆包大模型又上新了一波。 巧合的是,都是能看懂图像、能调用工具的新一代推理模型。
4/17/2025 8:49:00 PM
机器之心
报名开启|ICLR 2025新加坡,蚂蚁集团闭门研讨会、交流晚宴等你来!
当春风吹过狮城,ICLR 2025 如约而至,全球技术精英汇聚一堂。 从前沿展示到深度对话,再到思想碰撞的夜晚,蚂蚁集团邀你开启一场科技与灵感的奇妙之旅,共同见证技术的力量! 蚂蚁集团 ICLR 2025 之旅ICLR 2025 论文录取结果已揭晓,大会共接收 11,565 份投稿,收录率为 32.08%,入选 Spotlight 和 Oral Presentation (口头报告) 的比例约为 5.1%。
4/17/2025 8:39:00 PM
机器之心
联想展示 AI换脸防诈技术,精准识别 Deepfake伪造视频
随着人工智能和大模型技术的迅猛发展,它们为人们的生活带来了前所未有的便利与变革。 从DeepSeek等应用的爆火,到AI PC等端侧AI设备的加速普及,AI 的身影无处不在。 然而,AI 技术的滥用也带来了新的安全威胁。
4/17/2025 6:19:00 PM
新闻助手
腾讯开启史上最大就业计划,三年新增 28000校招岗位,今年六成面向技术人才
4月17日,腾讯宣布启动史上最大就业计划,三年内将新增 28000个实习岗位并加大转化录用,其中仅 2025年,就将迎来 10000名校招实习生,有六成面向技术人才开放。 腾讯方面表示,今年开放的校招实习岗位涵盖技术、产品、设计、市场、职能等五大类70余种岗位,包括大模型、研发、算法、市场、策划、运营、销售、美术等多个岗位职能。 同时,在大模型加速落地的背景下,腾讯加大了人工智能、大数据、云计算、游戏引擎、数字内容等技术类岗位的招聘力度,技术类岗位“扩招”力度空前,占比超60%。
4/17/2025 6:17:00 PM
新闻助手
攻克胰腺癌早筛难题,阿里AI模型获国际权威认定“突破性医疗器械”
4月17日消息,阿里巴巴AI模型DAMO PANDA被FDA认定为“突破性医疗器械”。 DAMO PANDA是阿里巴巴达摩院研发的胰腺癌筛查AI模型,可精准识别平扫CT影像中的细微病灶,攻克了胰腺癌早期筛查的国际难题。 这也是中国头部科技企业首次拿下该项权威认可。
4/17/2025 6:08:00 PM
新闻助手
视频扩散革新技术FramePack:仅需6GB显存,1.5秒/帧
近年来,生成式AI技术的飞速发展不断推动着视频生成领域的创新。 近日,一项名为FramePack的视频扩散技术引发了业界广泛关注。 据AIbase从社交媒体平台X的最新信息整理发现,FramePack以其超低的显存需求和高效的生成性能,有望将视频生成技术推向全新的“大众GPU时代”。
4/17/2025 6:01:15 PM
AI在线
姚班学霸、OpenAI姚顺雨:AI发展已从模型创新到产品思维
随着人工智能(AI)技术的不断成熟,业内专家提出,AI 发展的重心正在发生显著转变。 从早期的模型训练和算法创新,转向更加关注任务定义与评估优化。 这一观点由 OpenAI 的研究员姚顺雨提出,他强调,在 AI 的下半场,产品思维将成为推动技术应用和商业化的关键。
4/17/2025 6:01:15 PM
AI在线
资讯热榜
OpenAI 开源模型被 Meta 研究员“逆改”!只动0.3%参数,gpt-oss-20B 解锁无约束基座
大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷
让AI创作不千篇一律,提示词随机插词汇就行
谷歌最新「0.27B」Gemma 3开源!身板小却猛如虎,开发者直呼救命稻草
从GPT-2到gpt-oss,深度详解OpenAI开放模型的进化之路
蚂蚁AI健康管家AQ上线四大打假功能 向假医疗广告宣战
阿里千问踢馆子了!Qwen3新作秒杀ChatGPT,侧脸杀切换第一人称视角,表情包绝绝子,小编:再也不用美图秀秀去水印了
AI版华尔街之狼!o3-mini靠「神之押注」狂赚9倍,DeepSeek R1最特立独行
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
Anthropic
英伟达
代码
训练
算法
Stable Diffusion
芯片
LLM
AI新词
蛋白质
开发者
腾讯
生成式
Claude
苹果
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
人形机器人
xAI
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
场景
大型语言模型
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
特斯拉
应用