AI在线 AI在线

夸克AI超级框升级 上线“拍照问夸克”功能:啥都能答

4月25日,阿里巴巴旗下的夸克AI超级框宣布推出一项创新功能——“拍照问夸克”。 这一新功能基于先进的视觉理解和思考推理模型,能够更精准地理解和回答用户在物理世界中遇到的各类问题。 在日常生活中,用户常常会遇到难以用文字准确描述的情况,尤其是在面对复杂的物体、表格和图形时。

4月25日,阿里巴巴旗下的夸克AI超级框宣布推出一项创新功能——“拍照问夸克”。这一新功能基于先进的视觉理解和思考推理模型,能够更精准地理解和回答用户在物理世界中遇到的各类问题。

在日常生活中,用户常常会遇到难以用文字准确描述的情况,尤其是在面对复杂的物体、表格和图形时。夸克的“拍照问夸克”功能通过精准识别图片中的人物、物体和细节,深入理解用户需求,并联想相关问题,从而提供更准确的答案。

夸克AI超级框上新“拍照问夸克”功能:拍照就行、啥都能答

例如,用户在拍照搜索文物时,该功能可以自动关联文物的历史背景;上传商品图片时,能够一键跳转到淘宝同款链接。无论是人物、动物、植物、建筑、风景、美食、艺术品、商品、外文资料还是故障代码,夸克都能在秒级内完成识别。

此外,“拍照问夸克”功能还将搜索、扫描、修图、翻译、创作等多种能力聚合为一个统一的入口。对于较为复杂的图像,用户可以一次性上传多达10张图片,进行深度推理并完成各类复杂任务。

夸克目前拥有超过100个专业Agent和原子能力,涵盖搜索、健康、学习、旅游、商品、创作等多个领域。在旅行中,用户可以利用“拍照问夸克”获取文物讲解和景点攻略;在工作中,它能够辅助分析数据图表、优化代码逻辑,并生成工作总结文档;在健康领域,上传体检报告后,它还能提供指标异常分析和康复方案建议。

在娱乐场景中,“拍照问夸克”支持棋牌指导、截图找剧、情头配对等趣味功能,并能一键完成高清化、去水印、原文溯源等操作。此外,该功能还支持多种语言的提问和翻译解读。

相关资讯

​夸克 AI 超级框全新上线 “拍照问夸克” 功能

阿里巴巴旗下的夸克 AI 超级框正式推出了一项名为 “拍照问夸克” 的全新功能。 这一功能的亮点在于,它能够通过 AI 相机识别图像中的人物、物体以及其他细节,进而回答用户在现实生活中的各种问题。 这项技术基于先进的视觉理解与推理能力,使得用户不再需要用复杂的语言描述需求,只需简单拍照即可。
4/27/2025 2:00:48 PM
AI在线

阿里云通义开源Qwen2.5-VL,视觉AI超越Claude 3.5

阿里云通义千问开源了全新的视觉模型Qwen2.5-VL,并推出了3B、7B和72B三个尺寸版本。 其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,超越了GPT-4o与Claude3.5。 阿里云官方介绍称,新的Qwen2.5-VL能够更准确地解析图像内容,并突破性地支持超过1小时的视频理解。
1/29/2025 10:15:00 AM
AI在线

火山引擎发布豆包1.5深度思考模型:结合视觉理解与智能项目管理

在近日举行的火山引擎FORCE LINK AI创新巡展上,火山引擎总裁谭待正式公布了豆包1.5深度思考模型,标志着这一创新技术将正式面向企业提供服务。 豆包1.5不仅在基础功能上进行了升级,还引入了更多智能化的应用场景,助力企业实现更高效的数字化转型。 谭待在发布会上表示,豆包1.5深度思考模型能够结合视觉理解,提供更多创新功能。
4/17/2025 11:01:15 AM
AI在线
  • 1