AI新词
Deepmind推出新一代机器人AI模型:Gemini Robotics On-Device
Google DeepMind正式发布其新一代机器人AI模型Gemini Robotics On-Device,标志着机器人AI技术迈向更高效、更独立的里程碑。 这一模型不仅能够在无互联网连接的情况下在机器人本地运行,还展现出强大的通用性和任务适应能力,为工业、仓储及家庭服务机器人领域带来革命性突破。 突破云端限制,机器人AI本地化运行Gemini Robotics On-Device是一款基于Google Gemini2.0打造的视觉-语言-动作(VLA)模型,最大特点是完全运行于机器人本地硬件,无需依赖云端计算资源。
Wispr Flow获3000万美元A轮融资,语音AI挑战键盘霸权
语音输入技术初创公司Wispr Flow宣布完成3000万美元的A轮融资,由Menlo Ventures领投,NEA、8VC、Opal CEO Kenneth Schlenker、Pinterest创始人Evan Sharp、Carta CEO Henry Ward及Lindy CEO Flo Crivelli等知名投资者跟投。 Wispr Flow累计融资金额已达5600万美元。 这一轮融资将助力Wispr Flow扩展其AI驱动的语音输入技术,进一步挑战传统键盘输入方式,开启人机交互的新篇章。
加州法院裁定使用版权内容训练 AI 合规,引发创作者担忧
美国加州北区地方法院作出了一项重要裁决,允许使用受版权保护的作品来训练人工智能模型。 这个决定引发了广泛的关注和争议,尤其是在创意产业中,许多艺术家和内容创作者对此表示担忧。 裁决支持了被告 Anthropic 公司在没有授权的情况下使用盗版材料来训练其 AI 模型 Claude,进一步引发了关于创作者权益的讨论。
联邦法官首次裁定AI训练使用版权书籍属合理使用,Anthropic获胜但仍面临盗版指控
在一项具有里程碑意义的裁决中,联邦法官威廉·阿尔苏普(William Alsup)裁定,Anthropic公司在未经作者许可的情况下使用已出版书籍训练其人工智能模型属于合法行为。 这是法院首次认可AI公司关于合理使用原则的辩护论点,为科技行业在版权争议中奠定了重要先例。 行业影响深远这一判决对正在进行的AI版权大战产生重大影响。
讯飞星火医疗大模型 V2. 国际版发布,超越人类医生的实用性!
科大讯飞正式推出了星火医疗大 V2.5国际版,标志着医疗人工智能领域的一次重要突破。 这款模型是业界唯一基于全国产算力训练的医疗大模型,显示出中国在这一领域的领先地位。 根据权威评测平台 MedBench 的最新排名,星火医疗大模型以98.4分的优异成绩位列综合能力榜首,显示出其卓越的性能。
苹果iOS 26升级:图乐园功能焕然一新,AI 生成图像更真实!
近日,科技媒体 MacRumors 披露了苹果即将推出的 iOS26系统中的新特性,特别是增强版图乐园(Image Playground)。 此次更新不仅让图像生成效果更自然,更加入了 ChatGPT 的强大功能,使得用户体验得到显著提升。 iOS26的图乐园功能最早在 iOS18中引入,用户可以通过输入简短的描述,生成各种风格的图像。
ElevenLabs 推出移动应用,免费用户享10分钟文本转语音额度
在人工智能领域,ElevenLabs 又迈出了重要一步,正式推出其独立的移动应用,支持 iOS 和 Android 用户随时随地生成语音片段。 此前,用户仅能通过网页应用利用 ElevenLabs 的 AI 语音库,现在,这款移动应用让语音合成变得更加便捷。 用户在应用中只需输入或粘贴文本,然后选择适合的语音模型,就可以生成音频片段。
Harvey AI 融资再创新高,估值飙升至50亿美元
Harvey AI是一家专注于法律工作自动化的初创公司,近日成功完成了3亿美元的 E 轮融资,公司的估值达到了50亿美元。 这轮融资由知名风险投资公司 Kleiner Perkins 和 Coatue 共同主导,现有投资者包括 Conviction、Elad Gil、OpenAI 创业基金和红杉资本也参与了此次融资。 图源备注:图片由AI生成,图片授权服务商Midjourney此次融资仅在Harvey AI 宣布其在今年2月由红杉资本主导的3亿美元 D 轮融资之后的四个月内进行,当时公司的估值为30亿美元。
Claudia发布!优雅界面赋能Claude Code,跨平台AI编程新体验
随着AI编程工具的快速发展,Claude Code凭借其强大的代码生成能力备受开发者青睐。 然而,命令行界面(CLI)的操作门槛限制了其普及。 近日,一款名为Claudia的开源图形界面工具横空出世,为Claude Code带来了优雅、直观的桌面体验。
立体几何成大模型 “拦路虎”,SolidGeo 基准助力 AI 突破空间推理瓶颈!
在人工智能领域,多模态大模型(MLLM)一直在不断进化,然而最近一个新发布的基准测试 ——SolidGeo,给这些模型带来了前所未有的挑战。 由中国科学院自动化研究所的研究团队推出的 SolidGeo,专注于立体几何的推理能力,成为了首个系统评估多模态模型在三维空间理解方面的基准。 与传统的平面几何相比,立体几何的复杂性在于它需要理解三维结构及其空间关系。
DeepMind 推全新Gemini2.5Flash-Lite 模型 可实时生成交互界面
在人工智能不断发展的时代,谷歌旗下的 DeepMind 最近推出了全新的 Gemini2.5Flash-Lite 模型,这一创新技术标志着人机交互的又一次飞跃。 Gemini2.5Flash-Lite 具备了实时生成交互界面的能力,这意味着用户在点击按钮的瞬间,系统能够根据之前的屏幕内容动态生成下一屏幕的用户界面(UI)代码和内容。 这项技术的引入,不仅提升了个性化体验,还增强了用户的互动灵活性。
LinkedIn 上的 AI 岗位激增,个人资料中 AI 技能添加量激增二十倍
近日,LinkedIn 首席执行官瑞安・罗斯兰斯基(Ryan Roslansky)表示,该平台上提到 AI 的职位招聘数量在过去一年中增长了六倍。 同时,用户在个人资料中添加 AI 技能的数量则呈现出更加显著的增长,增加了整整二十倍。 这一变化表明,越来越多的专业人士开始重新塑造自己的职业形象,将 AI 相关技能纳入其中,尽管他们的实际经验可能并不丰富。
Perplexity 联合创始人承诺出资 1 亿支持 AI 研究
计算机科学家、Databricks 和 Perplexity的联合创始人安迪・孔维斯基(Andy Konwinski)宣布,他将投入1亿美元,成立一个新型研究基金,以支持人工智能(AI)领域的研究人员。 这个新的基金已经获得了 Ion Stoica 新实验室的支持,标志着孔维斯基对 AI 研究的重视和投入。 安迪·康温斯基 (Andy Konwinski) 周一宣布,他的公司 Laude 正在组建一个新的人工智能研究机构,由他自己的1亿美元资金支持。
细节控!即梦灰测图片3.1模型 电影感增强,风格化艺术感更强
昨日晚间,即梦悄悄灰测了图片3.1模型。 相较于3.0版本,3.1模型生成的图片电影感和故事感更强,场景更丰富。 对于一些艺术类的提示词响应效果也更好了。
OpenAI惊爆抄袭丑闻?65亿美元收购Jony Ive公司IO,背后暗藏IYO智能耳塞技术之争!
近日,人工智能领域掀起了一场轰动性的争议风暴。 谷歌X实验室分拆出来的初创公司IYO指控OpenAI及其首席执行官Sam Altman涉嫌抄袭其智能耳塞技术,并通过以65亿美元收购Jony Ive的公司IO,试图掩盖这一行为。 IYO指控:OpenAI涉嫌窃取智能耳塞技术IYO是一家自2018年起专注于研发人工智能驱动智能耳塞的初创公司,其产品旨在通过语音控制和无屏幕交互技术,取代传统智能设备。
ElevenLabs隆重推出AI语音助理11ai:语音优先并支持集成MCP
ElevenLabs正式发布其全新语音优先AI个人助理11ai,标志着语音AI技术在生产力工具领域的又一重大突破。 作为一家以创新文本转语音和对话AI技术闻名的公司,ElevenLabs此次推出的11ai不仅集成了前沿的语音交互功能,还通过多工具集成和自定义MCP(多通道协议)支持,为用户提供了高度个性化的工作流体验。 语音优先,生产力为核心11ai以语音交互为核心设计,旨在通过自然、流畅的对话提升用户的工作效率。
微软发布创新小参数模型Mu:性能比肩Phi-3.5-mini,赋能Windows智能体
今天凌晨,微软正式发布了其最新创新小参数模型Mu。 这款模型参数仅为3.3亿,却在性能上能与微软此前发布的Phi-3.5-mini相媲美,而其体量仅为Phi-3.5-mini的十分之一。 更令人瞩目的是,Mu在离线NPU笔记本设备上能实现每秒超过100个token的响应速度,这在小参数模型领域是极为罕见的突破。
英国数据中心面临 AI 可持续发展挑战
随着人工智能的快速发展,数据中心基础设施面临前所未有的压力,尤其是在电力供应和可持续性方面。 最近,在一次行业圆桌会议上,专家们讨论了英国数据中心行业所面临的重大挑战,尤其是在支持 AI 创新的同时,如何维持环境承诺。 图源备注:图片由AI生成,图片授权服务商MidjourneySalute 公司 EMEA 地区销售与解决方案副总裁理查德・克利福德指出,“我们最大的挑战之一是电力的可用性及其可供给的时间。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
AI新词
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
腾讯
算法
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
AI设计
生成式AI
大型语言模型
搜索
视频生成
亚马逊
AI模型
特斯拉
DeepMind
场景
深度学习
Copilot
Transformer
架构
MCP
编程
视觉