资讯列表
这家 AI 驱动的创业工作室计划每年孵化 10 万家新公司
近年来,创业热潮愈演愈烈,尤其是在疫情影响下,很多人开始重新审视自己的职业发展。 在这样的背景下,亨里克・维尔德林(Henrik Werdelin)创办了名为 Audos 的初创工作室,计划利用人工智能技术帮助普通人实现创业梦想。 他的目标是每年孵化10万家新公司,而不再局限于过去在 Prehype 时帮助的几十家。
谷歌重启 AI 驱动的 “Ask Photos” 功能,提升搜索速度!
近日,谷歌宣布其 AI 驱动的 “Ask Photos” 搜索工具将重新开放访问,并对该功能进行了一系列改进。 在此之前,谷歌曾悄然暂停了该工具的推出,以便进一步优化用户体验。 “Ask Photos” 工具由谷歌的 Gemini AI 模型提供支持,用户可以通过提出复杂的问题来快速找到所需的照片。
YouTube 在搜索结果中添加AI摘要,测试对话式AI工具扩展
近日,YouTube 宣布将推出两项新的人工智能(AI)功能,旨在提升用户的观看体验。 其中一项功能类似于 AI 概览,将出现在搜索结果中,而另一项则是对话式 AI 工具的扩展访问。 这些新功能的推出,将为用户提供更加智能化的内容搜索和互动方式。
一键生成爆款视频!HeyGen AI视频Agent席卷内容创作界!
近日,AI视频生成领域的领军企业HeyGen推出了一款革命性的AI视频Agent,为视频内容创作带来了全新突破。 据AIbase了解,这款AI视频Agent能够通过简单的素材上传,自动完成从故事规划、脚本编写到镜头选择的整个视频制作流程,让用户在几分钟内即可获得可直接发布的专业级视频内容。 这一创新功能不仅大幅降低了视频创作门槛,还为广告、短视频、产品演示等场景提供了高效解决方案。
重磅!谷歌开源Gemma3n多模态模型,手机也能跑出云端AI性能
谷歌于本周五凌晨正式发布并开源全新端侧多模态大模型Gemma3n,这一突破性产品为手机、平板、笔记本等端侧设备带来了此前只能在云端体验的强大多模态功能。 核心特性:小体积大能力Gemma3n提供E2B和E4B两个版本,虽然原始参数量分别为5B和8B,但通过架构创新,其内存占用仅相当于传统2B和4B模型,分别只需2GB和3GB内存即可运行。 该模型原生支持图像、音频、视频和文本的多模态输入处理,支持140种文本语言和35种语言的多模态理解。
谷歌推出Offerwall工具:帮助出版商应对AI搜索冲击,测试显示收入提升9%
AIbase报道 — 功能特性与应用场景Offerwall允许出版商为网站读者提供多种内容访问方式,包括小额支付、参与调查、观看广告等选项。 出版商还可添加自定义选项,如订阅新闻通讯等。 该工具现已在Google Ad Manager中免费提供,并由AI智能决定何时向访客展示,以最大化参与度和收益。
1999元起!小米AI眼镜颠覆智能穿戴,拍摄、支付、音乐一镜全能!
6月26日,小米在“人·车·家生态”发布会上正式推出其首款人工智能穿戴产品——小米AI眼镜。 这款集时尚设计与尖端科技于一身的智能眼镜,以轻量化设计、强大的AI功能和多场景应用为亮点,迅速成为市场关注的焦点。 据AIbase了解,小米AI眼镜不仅具备第一人称拍摄、语音助手和开放式耳机功能,还通过创新的电致变色技术为用户带来个性化体验,定价从1999元(约275美元)起,目前已在中国市场正式开售。
第一次用Cursor?四步骤快速安装+五大功能界面说明
Cursor 是一款长得像Visual Studio Code实际上也确实是在人家基础上二次开、塞进AI 功能的程序编辑器,让写整个开发流程都能靠AI 一路加速。 使用Cursor 可以一键导入原本你在VsCode中已经设置过的主题、快捷键、extensions,不用再重新设置;它也整合了像 GPT 和Claude等顶尖AI 模型,能依上下文生成整段功能代码。 写程序写到一半遇到bug,只要把错误讯息丢给Cursor,AI 就会协助分析、提供建议,甚至重构程序代码、帮你优化结构,让整体更好维护。
突破通用领域推理的瓶颈!清华NLP实验室强化学习新研究RLPR
余天予,清华大学计算机系一年级博士生,导师为清华大学自然语言处理实验室刘知远副教授。 研究兴趣主要包括高效多模态大模型、多模态大模型对齐和强化学习,在 CVPR、AAAI等人工智能领域的著名国际会议和期刊发表多篇学术论文,谷歌学术引用1000余次。 Deepseek 的 R1、OpenAI 的 o1/o3 等推理模型的出色表现充分展现了 RLVR(Reinforcement Learning with Verifiable Reward,基于可验证奖励的强化学习)的巨大潜力。
谷歌开源Gemma 3n:2G内存就能跑,100亿参数内最强多模态模型
端侧设备迎来了新架构的 AI 模型。 本周五凌晨,谷歌正式发布、开源了全新端侧多模态大模型 Gemma 3n。 模型、权重:::,Gemma 3n 代表了设备端 AI 的重大进步,它为手机、平板、笔记本电脑等端侧设备带来了强大的多模式功能,其性能去年还只能在云端先进模型上才能体验。
91岁零基础!硬核爷爷用AI两天爆肝应用,350美元玩转氛围编程
一位91岁老人用Claude和Replit编写了一个复杂的教会活动管理系统! 退休电气工程师John Blackman分享了他如何用Claude和Replit构建应用程序。 John从没碰过代码,但在孙子推荐下,只花两天就搞定了这个教会志愿者管理系统。
标谷歌推出 Doppl 应用,让你轻松体验虚拟试衣
近日,谷歌正式推出了一款名为 Doppl 的 AI 试衣应用,旨在为用户提供一种全新的虚拟试穿体验。 通过这款应用,用户只需上传一张全身照片,就可以选择自己喜欢的服装进行试穿,无论这些服装来自旧货店、朋友的穿搭,还是社交媒体上的图片,都能轻松实现。 Doppl 的操作流程非常简单。
扎克伯格亲自出马!Meta重金挖角OpenAI三大AI顶尖专家
Meta成功从OpenAI挖走三位顶级人工智能研究员:卢卡斯·贝耶尔(Lucas Beyer)、亚历山大·科列斯尼科夫(Alexander Kolesnikov)和翟晓华,引发业界广泛关注。 这三位研究员在机器学习和计算机视觉领域享有盛誉,以开发可扩展图像模型和视觉转换器(ViT)架构的突破性工作而闻名。 值得注意的是,他们此前曾在Google DeepMind工作,并于2024年底刚刚参与在苏黎世开设OpenAI办事处。
Gemini 将取代 Google 助手,Android 用户迎来新体验
近日,Google 宣布即将推出的 Gemini 功能将会在 Android 设备上取代 Google 助手。 根据 Android Police 获得的一封内部电子邮件,Gemini 的更新将在7月7日开始推送。 这项更新将允许用户在关闭 Gemini 应用时,仍然可以通过该 AI 助手来控制手机的电话、信息、WhatsApp 等应用。
Gemini 即将取代 Google 助手,隐私保护新模式来袭!
Google 近期宣布,将在7月7日推出一项重大更新,让其全新的 AI 助手 Gemini 成为用户手机的智能助理。 这一更新允许 Gemini 在用户的手机上执行多项任务,比如拨打电话、发送信息、使用 WhatsApp 等,且无需开启 Gemini 应用。 听起来是不是很方便?不过,随着这一变化,许多用户对隐私问题表示担忧。
杀疯了,这个 AI+Python 智能体救了看门老大爷!
最近AiPy很火,我用了有一段时间了,感觉严重影响睡眠,感觉这东西容易上瘾,今天推荐给大家。 AiPy它是基于AI Python,官方的说法是他们给大模型装上了手脚,也就是说,用大白话就能自动操作电脑、控制手机、甚至连家里的智能灯泡也能控制,听起来有点逆天。 然后AiPy是个开源项目,有命令行版和客户端。
超过GPT-image-1!大黑马Black Forest刚开源新模型,只用文本实现一键PS
今天凌晨,知名开源平台Black Forest开源了,文生图模型FLUX.1-Kontext的开发者版本。 该版本主要专注于图像编辑任务,支持迭代编辑,在各种场景和环境中都能出色地保留角色特征,还允许进行精确的局部和全局编辑,例如,用户想给一个人脸加上胡子或者更改衣服穿着、场景,FLUX.1-Kontext都能轻松实现。 简单来说,FLUX.1-Kontext开发版的主要功能可以像PS一样,让用户通过自然语言就能实现一键P图。
五款大模型考「山东卷」,Gemini、豆包分别获文理第一名
果然,高考已经快被 AI 攻克了。 近日,5 款大模型参加了今年山东高考,按照传统的文理分科方式统计:豆包 Seed 1.6-Thinking 模型以 683 分的成绩拿下文科第一,Gemini 2.5 Pro 则凭借 655 分拔得理科头筹。 测评来自字节跳动 Seed 团队。