AI
全球首款GESP融合视觉传感器ALPIX-Pizol问世, 锐思智芯拓宽机器感知动态新视界
3月31日,领先的融合视觉传感器研发商锐思智芯® 正式发布全球首款将全局曝光图像技术与EVS事件感知技术实现像素级融合的融合视觉传感器——ALPIX-Pizol®。 作为全球首款将出色的暗光性能、高帧率运动捕捉、高光比动态成像和超低功耗感知特性集于一身的视觉传感器,ALPIX-Pizol® 为低算力、低功耗端侧AI感知、超低功耗成像、无人机、机器人与智慧城市领域的前沿客户提供突破性的多模态融合视觉方案,赋能端侧AI与空间智能产业生态。 GESP像素设计 三合一模式,重构AI感知新维度ALPIX-Pizol® 是一款1/4英寸、由1.3M GESP™ (Global Event Sensing Pixel)像素组成的视觉传感器,它提供了图像、事件和融合等三种工作模式,每个工作模式下可以选择常规与低功耗设置,模式间可实现毫秒级切换。
对抗灾害,理解极端气候的智能模型概述
编辑丨toileter近年来,人工智能(AI)通过改进天气预报、模型仿真、参数估计和极端事件预测,深刻影响了包括地球系统科学在内的各个领域。 通过嵌合 AI,灾难响应与沟通效率得到极大提高。 由西班牙瓦伦西亚大学( Universitat de València)引导的团队强调不同领域合作的必要性,以创建实用、可理解和值得信赖的 AI 解决方案,以增强灾难准备和降低风险。
Gemini 2.5疯狂反扑OpenAI,智商130碾压人类!一键3D打印蛋糕、秒解魔方
要说这几天AI圈最火的模型,那肯定非GPT-4o莫属。 为了应对DeepSeek V3的一次「小升级」以及谷歌Gemini 2.5 Pro的推出,奥特曼带队上线了GPT-4o的原生图像生成功能。 随之而来的是一股吉卜力风席卷全网,火速出圈儿。
AI「癌症神探」降临:准确度近100%,医生也自叹不如!
逆天! 新型AI识别癌症,近100%精准度碾压医生。 AI在医学领域越来越厉害啦!
医疗保健领域的GenAI:当前趋势和未来展望
GenAI正迅速改变医疗保健行业。 为了解不断变化的行业格局,自2023年以来,麦肯锡一直在对医疗保健领域的领导者进行关于GenAI的观点和方法调查。 2024年第四季度开展的最新调查显示,85%的受访者——来自支付方、医疗系统和医疗保健服务与技术(HST)集团的医疗保健领导者——正在探索或已经采用了GenAI功能。
13.8倍吞吐提升!浙大上海AI Lab等提出视觉生成新范式,从“下一个token”到“下一个邻域”
在图像/视频生成任务中,传统的“下一个token预测”方法正面临严重的效率瓶颈。 来自浙大、上海AI Lab等机构的研究人员提出了一种全新的视觉生成范式——邻近自回归建模(Neighboring Autoregressive Modeling, NAR)。 与传统的“下一个token预测”不同,NAR模型采用了“下一个邻域预测”的机制,将视觉生成过程视为一种逐步扩展的“外绘”过程。
如何用 Spring AI + Ollama 构建生成式 AI 应用
一、故事背景:Java 老炮儿与 AI 新秀的较量上周,产品经理拍着桌子说:"三天内必须上线智能客服! 要能回答订单查询、退换货政策,还要会讲冷笑话! " 我盯着需求文档陷入沉思:传统规则引擎就像老黄牛,拉不动这么重的活;调用 OpenAI 又怕数据泄露——这不是让 Java 程序员在钢丝上跳霹雳舞吗?
不止吉卜力!GPT-4o新玩法全网疯传,网友:AI成精了
万万没想到,GPT-4o图像生成功如此火爆,奥特曼在线直呼太疯狂! 前有「吉卜力风」一夜爆火,今有「文艺复兴」席卷全网。 GPT-4o直接让外国网友Cosplay「文艺复兴名场面」!
业界突破多模态泛化推理能力,OPPO研究院&港科广提出OThink-MR1技术
用上动态强化学习,多模态大模型也能实现泛化推理了? 来自OPPO研究院和港科广的科研人员提出了一项新技术——OThink-MR1,将强化学习扩展到多模态语言模型,帮助其更好地应对各种复杂任务和新场景。 研究人员表示,这一技术使业界突破多模态泛化推理能力。
高中生用「我的世界」评测SOTA模型!Claude暂时领先,DeepSeek紧随其后
「strawberry中有多少个r」和「在LSAT法学考试中获得88分」哪个更难? 对于现如今的LMMs来说,通过各种人类「听着就头痛,看又看不懂」的基准测试似乎已是家常便饭。 比如DeepSeek-R1发布时在6大基准测试(包含AIME、MMLU、MATH-500等)中超过o1取得领先。
自动驾驶首次应用测试时计算!港大英伟达等新技术让AI边开边学,无人车遇变道自如应对
当开车遇到变道、加塞等场景时,驾驶员往往会下意识地激活自己的“安全驾驶思维”,从而做出激进的规避行为。 与之类似,自动驾驶汽车在上述场景中,更会表现得像个谨小慎微的”新手司机”,这是因为模型的决策往往依赖于工程师预设的固定规则,进而导致“不求无功,但求无过”的驾驶风格,但过多的无故急刹、过度避让反而会引发额外的安全隐患。 针对上述问题,来自香港大学、英伟达和德国图宾根大学的联合团队提出Centaur(Cluster Entropy for Test-time trAining using UnceRtainty)方法,能够动态地改善驾驶策略,通过在线的数据驱动,摆脱了对预设规则的依赖,大幅提高了自动驾驶汽车在不确定性场景中的适应性与安全性。
网上晒图要当心!AI六成可能知道你在哪儿
AI轻松击败人类! 这次是看图猜地名:给AI一张全新的照片,它能猜出照片在哪儿拍摄的,而且准确率还相当高。 也就是说,从图像中,AI能识别地理信息方面。
最新 AI 叛变!除了祈祷,程序员还能做什么?
作者 | 腾讯AI编程安全-啄木鸟团队我们是专注AI编程安全的啄木鸟团队,近日GitHub Copilot 和 Cursor 中出现可让AI“叛变”的新漏洞,从手法复现、风险、建议三个角度为你讲解“AI助手叛变”之事始末。 一、你的AI助手已被“策反”你可能还没察觉到,AI已经开始“叛变”程序员了。 这不是危言耸听,安全厂商 Pillar Security 在一份报告中指出了AI“背叛”程序员的证据。
AI Agent来,传统BI危
在互联网时代,数据已成为企业发展的必经之路。 从电商平台的用户行为记录,到工业传感器的实时监测,数据渗透在商业活动的每个环节,成为驱动决策的基础资源。 然而数据的价值并不在于简单的堆砌,未经梳理与解读的原始数据如同散落的拼图碎片,既无法呈现完整图景,也难以支撑业务判断。
Anthropic首次切开Claude大脑,「AI黑箱」彻底破解?心算诡异思考过程曝光
AI的性能愈发强大,一个新模型可能前一天还是SOTA(最佳模型),第二天就被拍了下去。 不过,这些强大的AI上空总有一团迷雾笼罩。 那就是:他们到底是怎么找到答案的?
单张照片生成360°3D场景,支持灵活视角漫游|人大&北师大&字节
从单张图像生成灵活视角3D场景的技术来了,在考古保护、自主导航等直接获取3D数据成本高昂或不可行的领域具有重要应用价值。 这一任务本质上是高度不适定的:单一的2D图像无法提供足够的信息来消除完整3D结构的歧义,尤其是在极端视角(如180°旋转)下,先前被遮挡或缺失的内容可能会引入显著的不确定性。 生成模型,特别是扩散模型,为解决这一问题提供了一种潜在的技术路径。
3D版DeepSeek卷起开源月:两大基础模型率先SOTA!又是VAST
3D生成版DeepSeek再上新高度! 国产、易用、性能强且开源——新模型一露面就刷新SOTA,并且第一时间加入开源全家桶。 顺时针转个圈圈给大家看,效果是这样:加上“皮肤”是这样:再来一个,效果是这样:肉眼可见,这次妥妥升级变成了更细节的细节控~以上效果,都来自3D大模型明星初创公司VAST,其刚刚上新的两个基础模型,TripoSG和TripoSF,为团队的最新研发成果。
马斯克xAI蛇吞𝕏:资本有了,数据有了,商业模式也有了
马斯克旗下两大公司正式合并! xAI以全股票交易的方式收购了X(推特),此次交易中xAI的估值为800亿美元,对X的估值为330亿美元(450亿美元资产减去120亿美元债务)。 马斯克自己在X上发帖宣布这一消息。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉