理论
Stable Diffusion变身3D神器!一个LoRA将2D图像转3D模型
在Stable Diffusion当中,只需加入一个LoRA就能根据图像创建3D模型了? 港科大(广州)与趣丸科技合作推出了全新三维生成大模型——Kiss3DGen,创新性地将3D生成与成熟的图像生成模型进行了对齐。 并且与主流2D扩散模型技术(如ControlNet、Flux-Redux)兼容协同,无需额外训练即可即插即用。
3/27/2025 9:26:30 AM
量子位
轨迹可控视频生成新范式,复旦微软破解视频生成难题,精准控制任意物体运动
轨迹可控的视频生成来了,支持三种不同级别的轨迹控制条件——分别为掩码、边界框和稀疏框。 近年来,视频生成技术快速发展,显著提升了视频的视觉质量与时间连贯性。 在此基础上,(trajectory-controllable video generation)涌现了许多工作,使得通过明确定义的路径精确控制生成视频中的物体运动轨迹成为可能。
3/27/2025 9:24:16 AM
量子位
人形机器人优雅漫步,强化学习新成果!独角兽Figure创始人:之前大家吐槽太猛
注意看,机器人像人一样从容地走出大门了! 甚至,还有一整支机器人队伍迎面走来。 人形机器人独角兽Figure,再次带来他们的新成果——利用强化学习实现自然人形行走。
3/27/2025 9:19:57 AM
量子位
突发!英伟达收购贾扬清新创业的Lepton AI
出品 | 51CTO技术栈(微信号:blog51cto)刚刚,有外媒曝出英伟达即将收购成立两年的 AI 创业公司 Lepton AI。 Lepton AI 的创始人是AI圈内知名人士贾扬清。 据悉这笔收购交易的金额是数亿美元。
3/27/2025 8:50:38 AM
关于智能体 Agent 的实现技术之思维链和函数调用 (function call) 的思考
Agent技术也被业界称为智能体技术,本质上是使得大模型具备独立思考和解决问题的能力;被广泛应用于各种应用场景,而且也被称为是实现通用人工智能的一种技术手段。 但在此之前对于智能体的理解比较肤浅,而今天突然发现原来智能体没我们想象中的那么简单,也没想象中的那么复杂。 今天我们就从Agent的两个实现技术之思维链和函数调用来重新理解智能体。
3/27/2025 8:10:00 AM
AI探索时代
网络犯罪分子利用11种方式使网络钓鱼比以往更有危害力
网络犯罪分子正在改变其社交攻击的欺诈手段,以提高真实性,更好地绕过过滤器,并更有针对性地瞄准潜在受害者。 网络钓鱼一直是安全漏洞的主要来源——这一重大问题,尽管经过了多年的安全意识培训,但至今仍是网络安全方面的首要关注点。 不过,由于战术的改进和AI技术的恶意再利用,这种长期存在的社交攻击手段不断演变,网络犯罪分子正在寻找新的方法来诱骗用户点击恶意链接。
3/27/2025 8:00:00 AM
John Leyden
随着AI大模型和MCP生态发展,传统低代码平台和RPA类产品还有无出路?
今天准备跟大家聊一下随着AI大模型和MCP协议生态的发展,对传统的低代码产品和RPA机器人产品所带来的一些影响。 因为在一年多前我其实就聊过这个话题,但是最近一年的时间AI大模型、AI编程、AI智能体,包括最近的MCP协议生态的发展太快了,导致原来我们对这两个产品的影响分析会出现一些变化。 低代码平台影响分析首先我们先讲一下低代码,大家都知道其实低代码平台的产品,它的本质仍然是辅助我们编程,仍然是可能会生成源代码或者是生成低代码产品模板引擎能够解析的元数据。
3/27/2025 5:00:00 AM
何明璐
星辰与代码:DeepSeek的发展历程
技术突破阶段2024 年,DeepSeek 强势开启生态扩张与技术爆发的新纪元,成为全球 AI 领域瞩目的焦点。 年初 1 月,DeepSeek 便以 DeepSeek-MoE 震撼登场,创新性架构设计以仅 60% 的计算量损耗,成功超越 Llama 2-7B 性能,为后续技术突破奠定坚实基础,在模型效率优化上迈出关键一步。 紧接着 2 月,DeepSeekMath 在 MATH 基准测试中表现惊艳,成绩飙升至 51.7%,无限逼近 GPT-4 水平,数学推理能力实现质的飞跃,极大提升了模型在复杂数学问题求解上的可靠性与精准度。
3/27/2025 3:50:00 AM
小牛呼噜噜
LLM中的分块技术:原理、应用与展望
在大语言模型(LLM)飞速发展的当下,分块技术(Chunking)(RAG 中的分块策略:从基础到前沿的全面剖析)作为提升模型性能的关键手段,受到了广泛关注。 它在优化信息处理、提高检索效率、增强模型理解能力等方面发挥着不可或缺的作用。 深入探究 LLMs 中的分块技术,对于推动自然语言处理(NLP)领域的发展具有重要意义。
3/27/2025 2:50:00 AM
大模型之路
一文详尽大型语言模型的四种量化技术
大型语言模型(比如ChatGPT背后的技术)确实非常"庞大"——这不仅指它们的能力,更直接体现在它们的体积上。 一个中等规模的模型就可能占用几十GB的内存,相当于几百部高清电影的大小。 对于普通开发者、个人研究者或初创公司来说,这样的资源需求无疑是一道难以跨越的门槛。
3/27/2025 2:44:00 AM
云朵君
重磅发布!ChatGPT ImageGen “Shiba” 震撼来袭:你从未见过的强大AI图像生成模型!
引言期待已久的ChatGPT ImageGen终于迎来重大更新! 代号为“Shiba”的全新模型正式发布,而我可以毫不犹豫地说,这绝对是我目前为止使用过的最强大的AI图像生成工具! 无论是在Prompt理解、生成质量,还是在文字排版、编辑能力和角色一致性等方面,“Shiba”都展现出了前所未有的卓越性能,可以说是全面碾压!
3/27/2025 12:04:33 AM
深海幽光
解码衰老时钟:深度学习揭示大脑衰老速度与认知功能衰退的关联
编辑 | 2049人脑的衰老速度与认知衰退、神经退行性疾病风险密切相关。 然而,传统脑龄(Brain Age,BA)模型仅能反映从出生到检测时间点的累积衰老效应,无法捕捉近期或动态的衰老速率。 这一问题在阿尔茨海默病(AD)等神经退行性病变的早期预警中尤为突出。
3/26/2025 2:11:00 PM
ScienceAI
活性提升65倍,山大新AI工具定向进化高活性酶,外部数据集验证成功率达80%
编辑丨&准确预测酶动力学参数对于酶的探索和修饰至关重要,但现有模型面临过拟合导致准确率低或泛化能力差的问题。 以山东大学为主导的团队提出了一种基于预训练模型和分子指纹的深度学习模型 CataPro ,并用它来预测转换数(k(cat))、米歇尔常数(K(m))和催化效率(k(cat)/K(m))。 与以前的基线模型相比,CataPro 在无偏数据集上表现出明显增强的准确性和泛化能力。
3/26/2025 2:10:00 PM
ScienceAI
88%的AI试点未能投入生产,究竟为何?
许多AI的概念验证(POC)项目因目标不明确、数据准备不足以及缺乏内部专业知识而失败。 同样,过于激进的概念验证批准以及来自高层的误导性压力也是导致失败的原因。 概念验证已成为CIO的AI战略的关键组成部分,它提供了一种低风险的方式来测试AI用例,而无需全面投入。
3/26/2025 11:40:28 AM
Evan Schuman
AI巨头画饼被戳穿!研究员警告:比起专注开发诺奖级AI,取代白领工作更有利可图!智能体搞定搜索和办公软件,人类面临数十年漫长过渡
许多AI大佬都给我们画过同样的饼——AI可以成为科学家。 不仅如此,根据他们的说法:诺奖级AI近在眼前,届时所有的研发工作将被自动化,世界也会因为各种科学突破变得愈发繁荣和美好。 OpenAI奥特曼曾表示,AI 可能会像晶体管一样,成为一种可广泛扩展并渗透到经济各个角落的重大突破。
3/26/2025 11:27:37 AM
企业在AI创新与安全之间走钢丝
根据Zscaler的数据,全球范围内AI/ML工具的使用激增,企业纷纷将AI融入运营之中,员工也在日常工作流程中加以运用。 该报告显示,企业使用AI/ML工具的数量同比增长了3000%以上,凸显出各行业迅速采用AI技术,以解锁生产力、效率和创新的新水平。 这些发现基于Zscaler云在2024年2月至12月期间分析的5365亿笔AI和ML交易。
3/26/2025 11:26:37 AM
通过敏捷治理让 GenAI 更好为企业赋能
生成式人工智能指创建各种内容包括编码软件、自动化工业流程、创作音乐、制作深度研究报告等的工具,其正在以惊人的速度发展。 近二十年,我从未见过任何技术发展得如此之快。 现在,企业不再考虑是否使用生成式人工智能,而是考虑如何让其大规模发挥作用。
3/26/2025 11:21:59 AM
晓晓
突发!浪潮六家子公司、智源被列入美国实体清单!50余家中国企业又被“拉黑”
出品 | 51CTO技术栈(微信号:blog51cto)美国当地时间周二,美国商务部工业与安全局在联邦公报上刊发两份文件,将50余个中国科技企业和机构纳入所谓的“实体清单”,预期将于3月28日生效。 美国商务部声称,这些实体“从事为与中国军工复合体密切相关的中国最终用户开发先进人工智能、超级计算机和高性能人工智能芯片的活动”。 图片文件PDF:,在这份实体名单中,中国云计算和大数据服务提供商浪潮集团(Inspur Group)的六家子公司被美国商务部“拉黑”。
3/26/2025 11:13:28 AM
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用