摄像头
谷歌Gemini Live正式登陆iPhone:让AI“看懂”你的屏幕与摄像头!
近日,在2025年 I/O 开发者大会上,谷歌宣布其最新功能 Gemini Live 正式向 iOS 和安卓用户开放。 这项革命性的功能可以实时识别并回应用户手机摄像头和屏幕上的内容,进一步提升了人机交互的体验。 最初,Gemini Live 只面向 Gemini Advanced 高级用户,但谷歌在今年4月宣布计划扩大其覆盖范围,现在,这一功能已经成功引入到 iOS 平台,成为所有用户的新玩具。
5/21/2025 9:01:06 AM
AI在线
英国测试 AI 摄像头抓酒驾:可通过驾车行为和道路使用情况判断
据BBC当地时间14日报道,英国交通管理部门正在德文郡和康沃尔郡测试一种新型摄像头,利用人工智能技术识别可能存在酒驾或毒驾行为的驾车者。
12/16/2024 4:31:23 PM
清源
美国华盛顿装上 AI 防空摄像头,22 年老设备下岗
美国国防部刚刚部署了一个摄像系统,该系统使用了一种基于人工智能的视觉识别系统,名为增强型区域态势感知(ERSA)系统。ERSA 系统还具有机器学习功能,使其在各种锁定模式下追踪物体的能力大大增强,甚至能够捕捉到像以各种模式飞行的鸟儿这样的小目标。
11/27/2024 9:52:51 PM
远洋
人机交互大迈步,OpenAI GPT-4o 演示视频引热议:AI 之间也能聊天
OpenAI 昨日凌晨发布 GPT-4o 模型,可以视为 GPT-4 的升级版本,可以实时推理处理音频、视觉和文本内容,而且能更加无缝地和 ChatGPT 交互。OpenAI 总裁兼联合创始人格雷格・布罗克曼(Greg Brockman)随后发布了上手演示,让两台运行 GPT-4o 的设备进行语音或视频交互。布罗克曼在演示开始之前,表达了自己的期望:让两台 AI 聊天机器人互相交流。布罗克曼向其中 A 聊天机器人讲述了他的期望,并让 B 聊天机器人可以调用摄像头观察周围世界。B 聊天机器人会调用前置摄像头,并清晰地
5/15/2024 6:04:08 AM
故渊
为巴黎奥运安保“铺路”,戛纳电影节将部署可识别可疑行为的 AI 摄像头
5 月 14-25 日,包括一些举世闻名的影星、名人在内的约 4 万人将飞抵法国蔚蓝海岸,出席一年一度的戛纳电影节。据法新社报道,当地政府部门近日宣布投入了 17 台配备 AI 技术的实验性摄像头,它们可以识别可疑事件或行为,也可以帮助检测被不慎遗弃的包裹。戛纳市长 David Lisnard 表示,当地市政厅从 2019 年起,就已经要求投入监控系统,最后为了应对今年 7 月的巴黎奥运安保工作,监控系统相关法律得到修改之后才获准部署。David 还表示,戛纳已经拥有全法“最为密集”的摄像头网络 —— 一共 884
5/12/2024 5:58:23 PM
清源
微软限制执法机构使用 Azure 人工智能进行实时面部识别
微软似乎并不希望执法部门利用 Azure OpenAI 进行实时面部识别,该公司最近修改了其有关警方使用人工智能服务的行为准则。图源 PixabayIT之家注意到,执法机构近年来越来越多地采用人工智能技术。例如,军警技术供应商 Axon 最近宣布,他们将利用 GPT-4 模型的功能来转录移动摄像头录制的音频,这可以大大加快警方报告的制作速度。然而,最近更新的 Azure 人工智能行为准则直接针对移动摄像头。The Register 发现,微软严格禁止将 Azure 人工智能用于警用执法记录仪和车载摄像头的实时面部识
5/8/2024 6:55:59 PM
远洋
- 1
资讯热榜
智谱AI全新企业级超级助手Agent CoCo正式上线
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
ChatGPT 语音功能升级,实时翻译对话更自然流畅
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊