摄像头
谷歌Gemini Live正式登陆iPhone:让AI“看懂”你的屏幕与摄像头!
近日,在2025年 I/O 开发者大会上,谷歌宣布其最新功能 Gemini Live 正式向 iOS 和安卓用户开放。 这项革命性的功能可以实时识别并回应用户手机摄像头和屏幕上的内容,进一步提升了人机交互的体验。 最初,Gemini Live 只面向 Gemini Advanced 高级用户,但谷歌在今年4月宣布计划扩大其覆盖范围,现在,这一功能已经成功引入到 iOS 平台,成为所有用户的新玩具。
5/21/2025 9:01:06 AM
AI在线
英国测试 AI 摄像头抓酒驾:可通过驾车行为和道路使用情况判断
据BBC当地时间14日报道,英国交通管理部门正在德文郡和康沃尔郡测试一种新型摄像头,利用人工智能技术识别可能存在酒驾或毒驾行为的驾车者。
12/16/2024 4:31:23 PM
清源
美国华盛顿装上 AI 防空摄像头,22 年老设备下岗
美国国防部刚刚部署了一个摄像系统,该系统使用了一种基于人工智能的视觉识别系统,名为增强型区域态势感知(ERSA)系统。ERSA 系统还具有机器学习功能,使其在各种锁定模式下追踪物体的能力大大增强,甚至能够捕捉到像以各种模式飞行的鸟儿这样的小目标。
11/27/2024 9:52:51 PM
远洋
人机交互大迈步,OpenAI GPT-4o 演示视频引热议:AI 之间也能聊天
OpenAI 昨日凌晨发布 GPT-4o 模型,可以视为 GPT-4 的升级版本,可以实时推理处理音频、视觉和文本内容,而且能更加无缝地和 ChatGPT 交互。OpenAI 总裁兼联合创始人格雷格・布罗克曼(Greg Brockman)随后发布了上手演示,让两台运行 GPT-4o 的设备进行语音或视频交互。布罗克曼在演示开始之前,表达了自己的期望:让两台 AI 聊天机器人互相交流。布罗克曼向其中 A 聊天机器人讲述了他的期望,并让 B 聊天机器人可以调用摄像头观察周围世界。B 聊天机器人会调用前置摄像头,并清晰地
5/15/2024 6:04:08 AM
故渊
为巴黎奥运安保“铺路”,戛纳电影节将部署可识别可疑行为的 AI 摄像头
5 月 14-25 日,包括一些举世闻名的影星、名人在内的约 4 万人将飞抵法国蔚蓝海岸,出席一年一度的戛纳电影节。据法新社报道,当地政府部门近日宣布投入了 17 台配备 AI 技术的实验性摄像头,它们可以识别可疑事件或行为,也可以帮助检测被不慎遗弃的包裹。戛纳市长 David Lisnard 表示,当地市政厅从 2019 年起,就已经要求投入监控系统,最后为了应对今年 7 月的巴黎奥运安保工作,监控系统相关法律得到修改之后才获准部署。David 还表示,戛纳已经拥有全法“最为密集”的摄像头网络 —— 一共 884
5/12/2024 5:58:23 PM
清源
微软限制执法机构使用 Azure 人工智能进行实时面部识别
微软似乎并不希望执法部门利用 Azure OpenAI 进行实时面部识别,该公司最近修改了其有关警方使用人工智能服务的行为准则。图源 PixabayIT之家注意到,执法机构近年来越来越多地采用人工智能技术。例如,军警技术供应商 Axon 最近宣布,他们将利用 GPT-4 模型的功能来转录移动摄像头录制的音频,这可以大大加快警方报告的制作速度。然而,最近更新的 Azure 人工智能行为准则直接针对移动摄像头。The Register 发现,微软严格禁止将 Azure 人工智能用于警用执法记录仪和车载摄像头的实时面部识
5/8/2024 6:55:59 PM
远洋
- 1
资讯热榜
全新开源的DeepSeek-OCR,可能是最近最惊喜的模型!
AI 模型“炒股”比拼!DeepSeek 收益超14%,Gemini2.5Pro 惨亏四成
具身智能学界业界思想「惊人的统一」?美团在IROS开了个学术年会
OpenAI强化Sora 2保护政策,确保艺人声音与肖像权不被侵犯
刚刚,ChatGPT终于可以走遍整个互联网了!OpenAI深夜炸街:原生ChatGPT集成、即时理解、主动执行,浏览器赛道鲨疯了
OpenAI首款ChatGPT浏览器发布!现在就能免费下载使用
告别抽卡!Vidu Q2多图参考生视频功能重磅上线
Andrej Karpathy评DeepSeek-OCR论文:图像输入可能成为大语言模型新方向
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
芯片
腾讯
AI for Science
Stable Diffusion
苹果
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
研究
AI视频
生成
大语言模型
RAG
百度
具身智能
Sora
工具
GPU
华为
计算
字节跳动
AI设计
搜索
大型语言模型
AGI
视频生成
场景
深度学习
DeepMind
架构
视觉
生成式AI
预测
Transformer
编程
AI模型
伟达
特斯拉
Copilot