AI在线 AI在线

微软推出Copilot Vision AI助手赋能网页浏览与决策

微软Copilot正日益智能化,这家由萨蒂亚·纳德拉领导的公司刚刚宣布,其AI助手现已具备“视觉”功能,能够与用户一起浏览互联网。 虽然该功能在今年10月就已首次宣布,但公司目前正面向部分Pro订阅用户进行预览。 据微软介绍,这些用户将能够在其Edge浏览器上打开的网页上触发Copilot Vision,并就屏幕上可见的内容与其进行交互。

微软推出Copilot Vision AI助手赋能网页浏览与决策

微软Copilot正日益智能化,这家由萨蒂亚·纳德拉领导的公司刚刚宣布,其AI助手现已具备“视觉”功能,能够与用户一起浏览互联网。

虽然该功能在今年10月就已首次宣布,但公司目前正面向部分Pro订阅用户进行预览。据微软介绍,这些用户将能够在其Edge浏览器上打开的网页上触发Copilot Vision,并就屏幕上可见的内容与其进行交互。

该功能仍处于开发的早期阶段,且相当受限,但一旦完全成熟,对微软的企业客户而言将可能是一个颠覆性的改变——它将在客户与微软生态系统中的产品(如OneDrive、Excel、SharePoint等)互动时,帮助他们进行分析和决策。

从长远来看,观察Copilot Vision如何与更加开放且功能强大的代理式产品(如Anthropic和Emergence AI的产品)相抗衡也将颇有趣味。这些产品允许开发者整合代理,以跨不同供应商的应用程序进行查看、推理和采取行动。

Copilot Vision能带来什么?

当用户打开一个网站时,他们可能有一个明确的目标,也可能没有,但是,当他们有目标时,比如为学术论文进行研究,执行所需任务的过程就包括浏览网站、阅读所有内容,然后做出决定(比如是否将网站内容作为论文的参考),同样的道理也适用于其他日常网络任务,如购物。

通过全新的Copilot Vision体验,微软旨在简化整个流程。本质上,用户现在拥有了一个助手,它位于浏览器的底部,可以随时被调用以阅读网站内容,包括所有文本和图像,并帮助用户进行决策。

它能够立即扫描、分析并提供所有所需信息,同时考虑到用户的既定目标——就像另一双眼睛一样。

这一功能具有深远的好处——它可以极大地加速你的工作流程——同时考虑到代理正在阅读和评估你浏览的所有内容,它也具有重大影响,然而,微软已保证,一旦Vision会话关闭,用户共享的所有上下文和信息都将被删除。它还指出,网站数据不会被捕获/存储用于训练底层模型。

“简而言之,我们优先考虑版权、创作者以及我们用户的隐私和安全——并将它们置于首位。”Copilot团队在宣布该功能预览的博客文章中写道。

基于反馈进行扩展

目前,美国已报名参加早期访问Copilot Labs计划的部分Copilot Pro订阅用户将能够在其Edge浏览器中使用视觉功能。该功能为可选加入,这意味着用户不必担心AI一直在读取他们的屏幕。

此外,在这一阶段,该功能将仅适用于部分网站。微软表示,它将根据早期用户的反馈逐步改进该功能,并扩大对更多Pro用户和其他网站的支持。

从长远来看,该公司甚至可能将这些功能扩展到其生态系统中的其他产品,如OneDrive和Excel,从而让企业用户能够更轻松地工作和做出决策,然而,目前尚无官方确认。更不用说,鉴于此处所表明的谨慎态度,这可能需要一些时间才能实现。

微软推出Copilot Vision预览之际,正是竞争对手在代理式AI领域不断提高标准之时。Salesforce已在其Customer 360产品中推出了AgentForce,以实现跨销售、营销和服务等领域的工作流程自动化。

与此同时,Anthropic推出了“Computer Use”,允许开发者整合Claude以与计算机桌面环境进行交互,执行以前仅由人类工作者处理的任务,如打开应用程序、与界面互动和填写表单。

相关资讯

​微软 Copilot AI 实现邮件和文件直接连接,提升办公效率

近日,微软宣布对其 Copilot AI 助手进行了重要升级,允许用户直接连接 Outlook、Gmail 等多款个人生产力应用。 这项新功能的推出,使得用户在处理日常工作任务时更加高效,能够更轻松地获取所需信息。 根据微软的介绍,这项连接器功能是可选的,用户可以在设置中选择需要连接的服务。
10/14/2025 12:11:13 PM
AI在线

微软 Copilot 现已入驻三星电视,免费帮你找片、提建议

微软的 AI 助手 Copilot 现已登陆三星2025年的部分电视和显示器系列,包括 Neo QLED、OLED、The Frame 以及 M7、M8和 M9显示器。 此举标志着 AI 技术与家庭娱乐设备进一步深度融合,为用户带来全新的交互体验。 核心功能与操作体验Copilot 集成在三星的 Tizen 操作系统中,用户可以通过遥控器上的麦克风按钮轻松唤醒它。
8/29/2025 9:27:21 AM
AI在线

GitHub Copilot 推出视觉功能:图片可秒变代码

GitHub 宣布了其 AI 编程助手 Copilot 的一系列重大更新,此次更新中最引人注目的功能之一是 Copilot 的“Vision”功能。该功能允许用户在聊天中上传截图、照片或图表,Copilot 将基于这些图像生成相应的界面、代码以及替代文本(alt text),从而将用户的视觉想法转化为实际的编程成果。
2/8/2025 9:30:22 AM
远洋
  • 1