资讯列表
Claude桌面版重磅升级:支持发截图,Caps Lock变身AI语音神键
近日,Claude桌面版正式面向所有用户开放,这标志着AI工具从浏览器向原生应用的深度融合迈出关键一步。 本次更新聚焦Mac平台,引入了截图共享和Caps Lock语音交互两大创新功能,让用户无需切换窗口,即可与Claude实现无缝协作。 以下是AIbase整理的最新细节。
重磅对话:三位顶尖科学家齐聚知乎,共议AI如何重塑科研未来!
一场围绕“AI时代科研变革”的重量级讨论近日在知乎平台展开,标志着知乎2025科学季迈向高潮。 知乎联合科普中国、上海人工智能实验室、Bioart生物艺术等权威机构共同发起本次活动,特邀三位荣获2025年世界顶尖科学家协会奖的科学家——孙理察、斯科特·埃默尔和韦斯·桑德奎斯特,共同探讨前沿科学议题。 讨论聚焦AI对科研范式的颠覆性影响。
Sesame完成B轮2.5亿美元融资,革命性AI语音引百万用户尝鲜,测试版应用同步上线
对话式人工智能初创公司和智能眼镜制造商 Sesame 于本周二宣布,公司已成功完成 2.5亿美元的 B 轮融资,并向一组选定的用户开放了其 iOS 应用的早期 Beta 测试版。 这家由前 Oculus 联合创始人兼首席执行官 Brendan Iribe 和 AR 初创公司 Ubiquity6前首席技术官 Ankit Kumar 共同领导的初创公司,正致力于开发一款能够使用自然人声与用户互动的个人 AI 代理。 Sesame 的最终目标是将这款强大的个人 AI 代理嵌入到一款轻便、可全天佩戴并通过语音互动的智能眼镜中。
前 Oculus 创始人 AI 初创企业 Sesame 融资 2.5 亿美元,智能眼镜 Beta 版现已上线
Sesame 是一家由前 Oculus 首席执行官 Brendan Iribe 和前 Ubiquity6首席技术官 Ankit Kumar 创立的会话 AI 初创企业,近日宣布完成2.5亿美元的 B 轮融资,并开始向一部分测试者开放其 Beta 版应用程序。 这家公司致力于打造一款配备 AI 个人助手的智能眼镜,用户可以通过自然的语音与其进行交互。 Sesame 首次在2月份从隐秘中浮出水面,展示了其技术的两个示范 AI 声音 “玛雅” 和 “迈尔斯”。
多模态人工智能初创公司 Fal.ai 的估值已超过 40 亿美元 半年内价值翻三倍
为开发者提供图像、视频和音频 AI 模型的初创公司 Fal.ai 近日完成新一轮融资,估值已突破 40亿美元,据两位知情人士透露,本轮融资规模约为 2.5亿美元。 知情人士指出,本轮融资的主要投资者是著名的风险投资机构 **凯鹏华盈(Kleiner Perkins)**和 红杉资本(Sequoia Capital)。 不过,Fal 官方尚未对此置评,红杉资本和凯鹏华盈也拒绝置评。
开源创业公司 LangChain 获 12.5 亿美元融资,估值飙升至 12.5 亿美元
近日,开源框架开发公司 LangChain 宣布成功融资1.25亿美元,企业估值达到12.5亿美元。 这一消息在10月21日公布,标志着 LangChain 成为了一家独角兽企业。 此前,TechCrunch 在7月曾报道,该公司正在以至少10亿美元的估值进行新一轮融资。
YouTube 推出 AI “肖像识别” 工具,打击虚假内容
近日,YouTube 宣布为其合作创作者推出一项新的 AI 工具 —— 肖像识别功能。 该工具旨在帮助创作者识别和举报未经授权使用他们肖像的深度伪造视频。 根据 YouTube 的介绍,创作者在验证身份后,可以在 YouTube 工作室的内容检测标签中查看被标记的视频。
奇瑞墨甲机器人实现 L3 级别!未来将着眼于多个行业应用
在10月19日举行的全球发布会上,奇瑞墨甲机器人宣布其技术实现了从 L2到 L3的重大飞跃。 这一进展标志着奇瑞在智能机器人领域的布局正在加速,未来将着眼于多个行业应用。 奇瑞汽车集团董事长尹同跃表示,公司将以汽车行业的高标准来打造机器人,确保价格亲民且质量可靠。
OpenAI秘密启动“Mercury”项目:聘百名前银行家,训练AI系统自动化金融建模
Mercury”(水星)**的雄心勃勃的内部项目,旨在将初级投资银行家通常处理的重复性任务自动化,目标直指华尔街的核心基础工作。 据彭博社报道,OpenAI 已秘密聘请了 100多名前银行家和金融专家,利用他们专业的金融建模经验来训练其人工智能系统。 该项目的最终目标是教会 AI 如何独立生成复杂的金融模型,从而有望省去初级分析师耗费数小时进行的繁琐基础工作。
OpenAI发布AI浏览器ChatGPT Atlas:重塑网络交互体验,直闯谷歌核心领地
当地时间周一,OpenAI 正式推出 AI 浏览器 ChatGPT Atlas。 这款仅适用于 macOS 系统的产品,以深度整合 ChatGPT 为核心亮点,向谷歌 Chrome 在浏览器市场的霸主地位发起直接挑战。 分析认为,此举不仅是 OpenAI 从单一应用向多元计算平台转型的关键一步,更试图重新定义人们在线工作与网络交互的方式,开启浏览器 “智能体时代” 的新篇章。
特斯拉Karpathy对AI Agent的冷静判断:十年成熟论背后的技术理性
为什么一个曾经推动特斯拉自动驾驶技术突破的AI专家,会对当下最火热的AI Agent泼冷水? 最近在红杉资本的AI峰会上,OpenAI创始成员、前特斯拉AI总监安德烈·卡帕西(Andrej Karpathy)发表了一个让很多人意外的观点。 当所有人都在为AI Agent的"即将爆发"而兴奋时,这位技术大牛却给出了一个相当冷静的判断:真正实用的AI Agent,可能还需要十年左右的时间才能成熟。
墙体的AI革命!智能超表面如何让建筑「听懂」6G信号?
5G基站极高的功耗一直被业内诟病。 其主导原因是,基站只能部署在室外,但96%的流量需求却源于室内用户。 信号穿墙而过,强度下降了90%~99.9%。
一张照片,一个3D「你」:计算所等提出HumanLift,实现高保真数字人重建
创建具有高度真实感的三维数字人,在三维影视制作、游戏开发以及虚拟/增强现实(VR/AR)等多个领域均有着广泛且重要的应用。 尽管现有技术在从多视角图片重建高质量、可动画化的三维人体模型任务中展现出诸多优势,但从单张参考图像重建真实感三维数字人,依旧面临技术复杂、资源消耗大的挑战。 如何兼顾三维一致性与参考图像一致性,重建出高质量、高真实感的人物外观与姿势,以及如何生成高真实度且细节一致的服饰、人脸等,都是亟待解决的难题。
文本已死,视觉当立!Karpathy狂赞DeepSeek新模型,终结分词器时代
DeepSeek再次让全世界大吃一惊! 他们最新成果DeepSeek-OCR,从根本上改变了游戏规则——文本并非通用的输入。 反而,视觉将取而代之!
AI牛马实现“干中学”!上海AI Lab联合推出智能体自我进化新框架
在人工智能的广阔世界里,我们早已习惯了LLM智能体在各种任务中大放异彩。 但有没有那么一瞬间,你觉得这些AI“牛马”还是缺了点什么? 没错,它们缺少的是我们人类最宝贵的职场技能:经验的积累和持续的自我进化。
被H-1B签证折磨10年,前微软科学家用AI「掀桌」
一位前微软科学家正在用AI改造美国签证体系,让一个10万美元的「昂贵流程」变得透明而又简单。 专注移民科技的初创公司Casium,在H‑1B新政落地后迎来窗口期,获Maverick Ventures领投的500万美元种子轮。 Casium创始人Priyanka KulkarniCasium由前微软科学家Priyanka Kulkarni创办,多年在美国移民体系下生存的她和许多其他科技移民一样,经常体会到工作签证背后那份无形困扰与束缚。
AGI前夜重磅:RL突破模型「认知上限」,真·学习发生了!
在AI研究圈,一个核心争论是:强化学习(RL)是否能够赋予模型超越其基础模型(base model)的推理能力。 怀疑派观点:早在四月份,清华的黄高团队[arXiv:2504.13837]指出,尽管经过 RLVR 训练的模型在较小的采样值 (k)(例如 (k=1))时能优于其基础模型,但当采样数较大时,基础模型往往能取得相同或更好的 pass@k 表现。 他们通过覆盖率(coverage)和困惑度(perplexity)分析推断,模型的推理能力最终受限于基础模型的支持范围。
Embedding黑箱成为历史!这个新框架让模型“先解释,再学Embedding”
让模型先解释,再学Embedding! 来自UIUC、ANU、港科大、UW、TAMU等多所高校的研究人员,最新推出可解释的生成式Embedding框架——GRACE。 过去几年,文本表征(Text Embedding)模型经历了从BERT到E5、GTE、LLM2Vec,Qwen-Embedding等不断演进的浪潮。