理论
OpenAI微软关系现裂痕,奥特曼紧急公关,导火索竟是DeepMind联创
一个5000亿美元的大动作,让微软不再是OpenAI独家云计算供应商了。 在OpenAI与甲骨文牵手组建数据中心那一刻起,网友们纷纷看向这个计划之外的微软:他们两个之间的关系约莫是出现裂痕了。 结果奥特曼紧急公关,不是你听我解释,这是形势所迫,为算力折腰啊啊。
Meta-Chunking: 通过逻辑感知学习高效的文本分段
本文是由人大提出的,旨在解决在检索增强生成(RAG)系统中,文本分段这一关键方面被忽视的问题。 具体来说,传统文本分段方法(如基于规则或语义相似性)在捕捉句子间深层语言逻辑联系方面存在不足,导致在知识密集型任务(如开放域问答)中的性能受到影响。 本文通过引入Meta-Chunking的概念及其两种实现策略(边际采样分段和困惑度分段),解决了以下几个关键问题:逻辑连贯性问题:问题:传统文本分段方法往往基于规则或语义相似性,难以捕捉句子间的深层逻辑联系(如因果、过渡、并行和渐进关系)。
DeepSeek新AI模型有多震撼?外媒:相当于30美元iPhone降临
DeepSeek(深度求索)再次推出新版开源AI模型,它的性能与美国最先进的AI模型虽然还有一些差距,但差距极小,成本低很多很多。 西方许多人认为,美国限制中国AI发展的企图遇挫,中国正在加速前进,以更高效率打造高端AI模型。 去年12月,杭州幻方量化推出DeepSeekV3开源大语言模型,它的性能与OpenAI 40和Anthropic Claude 3.5 .
OpenAI新研究:o1增加推理时间就能防攻击,网友:DeepSeek也受益
OpenAI的新Scaling Law,含金量又提高了。 像o1这样的推理模型,随着思考时间的延长,面对对抗性攻击会变得更加稳健。 图片随着大语言模型被越来越多地赋予Agent能力,执行现实世界的任务,模型被对抗攻击的风险也与日俱增。
字节要亲手打造AGI了!神秘“Seed Edge”项目被曝光,已设置5大研究方向,探索下一代AI技术,算力不用愁!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)中国大厂开始发力AGI了! 据媒体报道,字节跳动 AGI 研究团队浮出水面,揭开了字节AGI的秘密布局! 报道称:1 月下旬,字节正式设立代号为“Seed Edge”的研究项目,核心目标是做比预训练和大模型迭代更长期、更基础的 AGI 前沿研究。
字节清华开源力作!UI-TARS原生AI智能体,人人都能拥有“智能助手”
年底国内各个AI玩家杀疯了,前两天完全开源的Deepseek R1 震撼整个AI业界,今天字节又联合清华整活,一个强大的原生的开源 AI Agent UI-TARS震撼上线看了UI-TARS的论文,我给大家划划重点【纯视觉感知】:告别文本依赖,像人眼一样“看”懂GUI! 传统的GUI自动化方案,很多都依赖于解析网页代码(HTML)或者软件的API接口。 但这种方式有两个致命缺陷:一是平台限制,不同平台、不同软件的底层代码和API都不一样,导致自动化方案难以通用;二是容易失效,一旦网页或软件界面改版,代码或API接口变动,自动化脚本就可能直接崩溃。
刚刚,OpenAI发布o1模型新突破,推理时间增强对抗鲁棒性
今天凌晨2点,OpenAI发布了一项新技术研究,通过增加推理时间、算力资源来大幅度提升模型的对抗鲁棒性。 与传统的对抗训练样本方法不同的是,OpenAI提出的新方法不需要对大模型进行专门的对抗训练,也不需要提前了解攻击的具体形式。 只需要通过增加推理时间和算力资源,模型就可以更充分地利用其推理能力表现出更强的鲁棒性。
NVIDIA提出虚拟试衣新方法EARSB,让时尚与科技完美融合!
在数字化浪潮席卷全球的今天,科技正以前所未有的方式融入我们的生活,包括我们追求时尚的方式。 想象一下,无需亲临实体店,只需轻点屏幕,就能轻松试穿心仪的衣物,这不再是遥不可及的梦想。 NVIDIA联合波士顿大学提出了 EARSB,该模型能够智能地识别并修正初始试衣图像中的错误区域,能够针对特定错误进行精准修正,显著提升试衣效果的真实感和细节表现。
「AI没有墙超预期」Anthropic CEO达沃斯惊人预测:2027年实现超人类水平的AI
人类水平的AI或超越所有人类的AI将在两三年内到来,从内部来看,AI的发展没有遇到墙反而超预期 --Anthropic CEO Dario Amodei华尔街日报在达沃斯世界经济论坛对 Anthropic 首席执行官 Dario Amodei 的最新采访。 采访内容主要围绕 Anthropic 的 AI 模型 Claude 的未来发展方向、AI 技术的进步速度及其对社会和劳动力市场的影响、以及 Anthropic 在行业竞争和政策监管方面的策略以下结合采访内容给大家划个重点Claude 的未来发展方向网络访问 (Web Access): Anthropic 正在积极开发 Claude 的网络访问功能,预计很快推出。 尽管企业用户是 Anthropic 的重点,但他们也认识到网络访问对于消费者和高级用户的重要性。
20K合成数据就能让大模型能力飙升!还能实现模型自我迭代,上海AI Lab数据合成新范式
仅使用20K合成数据,就能让Qwen模型能力飙升——模型主观对话能力显著提升,还能实现模型自我迭代。 最近,来自上海AI Lab的研究团队针对合成数据技术展开研究,提出了SFT数据合成引擎Condor,通过世界知识树(World Knowledge Tree)和自我反思(Self-Reflection)机制,探索合成海量高质量SFT数据的方案。 结果,他们还意外发现,在增大合成数据量的情况下,模型性能持续提升。
Anthropic CEO惊人预警:27年AI超越人类!Claude今年更新全剧透
失踪人口终于回归了! 在互联网消失一段时间后,Anthropic首席执行官Dario Amodei一上来就接受了WSJ、CNBC两家采访,连曝AI大瓜。 他坚定地认为,「2027年之前,AI完全可以超越人类智能!
Claude创始人:AI全面超越人类,只剩2-3年
在最新的对话访谈当中,Claude厂家Anthropic的CEO Dario Amodei谈论了他对于AI未来的看法。 他认为,AI确有可能在短期内替代部分人类的工作,但让AI与人类形成互补才是对生产力最有益的方式。 对于当下的年轻人,Amodei也给出了他的建议,鼓励其学会使用AI工具并培养批判思维能力。
最壕DeepSeek玩家8台Mac跑R1,10万+元凑496GB显存才能跑4bit量化版
DeepSeek-R1,正在接受全球网友真金白银的检验。 花30秒用manim代码制作解释勾股定理的动画,一次完成无错误。 为了玩上这样的模型,有人花上10多万元,组7台M4 Pro Mac mini 1台M4 Max Macbook Pro的家用超算。
使用 SHAP 使机器学习模型变的可解释!!!
大家好,我是小寒SHAP 是一种用于解释机器学习模型预测结果的方法,它基于博弈论中的 Shapley值。 旨在为每个特征分配一个“贡献值”,表明该特征对模型预测结果的影响有多大。 SHAP 为复杂的黑箱模型(如深度学习模型、集成方法等)提供了一种统一且理论上有保障的解释框架,帮助我们理解模型的决策过程,提高模型的透明度和可信度。
灵敏度高达94.9%!牛津团队AI多模态ctDNA检测方法,进行癌症早期筛查
编辑 | 2049在癌症诊疗的漫长征程中,早期检测始终是最具挑战性的环节之一,液体活检技术因其无创性和高灵敏度而备受关注。 然而,现有的检测方法大多依赖于深度靶向测序,难以同时整合多模态数据,导致检测灵敏度和特异性受限。 正是基于这一技术痛点,牛津大学的研究团队开发了一种基于全基因组 TET 辅助吡啶硼烷测序(TAPS)的多模态循环肿瘤 DNA(ctDNA)检测方法。
AI伪造论文渗透学术圈:Google Scholar成虚假科学温床,如何应对?
编辑 | 1984随着生成式 AI 技术的普及,学术界正面临着一个新的挑战:越来越多疑似由 AI 生成的研究论文正在渗透到学术期刊、档案库和知识库中。 这些论文通常借助 ChatGPT 等普及型 AI 应用来模仿学术写作风格,其危害不容忽视。 作为广受欢迎的学术搜索引擎,Google Scholar 在展示搜索结果时,并未区分这些可疑论文与经过严格质量把关的研究成果。
一款可快速定位照片的AI工具
由波士顿Graylark Technologies开发的GeoSpy是一款强大的AI工具,可通过分析图像中的建筑风格、植被类型以及建筑物之间的空间关系等特征,在几秒钟内高精度定位照片的拍摄位置。 这项技术引起了公众和执法机构的广泛关注,其市场定位为执法部门、威胁情报公司和政府机构提供服务。 GeoSpy经过数百万张全球图片训练,能够识别“显著的地理标志”,如特定的建筑样式、土壤特征及其空间排列关系。
API存在安全风险:如何在不断发展的数字环境中保护数据
云计算和人工智能技术彻底改变了企业的运营方式。 这两种技术都提供了更高的灵活性和可扩展性。 基于云的基础设施使组织能够更快地进行创新。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉