应用
我用AI帮别人优化作品,效率直接飙升300%!
一、做设计为啥这么难? 我们来看看大家做的图,质量与效率的对比:基本上每张图都花了 2-3 天去做,结果还不够好。 然后以下是掌握正确方法,花 30 分重新修改改的图:之前花三天做不好的图,现在只需要花 30 分钟就完成了。
手把手教你打造一个能对话的AI简历,助你当场拿下Offer!
故事是这样的。 我最近一直在招人,想招点人帮我分担一些压力,全职的实习的啥的都可以。 我这再怎么说,也是一个跟 AI 有关的地方,所以很多人在投简历的时候,都会写很多跟 AI 相关的经历,我甚至收到过很多 AI 生成的简历。
字节 Seed 开源统一多模态理解和生成模型 BAGEL
BAGEL 具有 70 亿个激活参数(总共 140 亿个),并在大规模交错多模态数据上进行训练。BAGEL 在标准多模态理解排行榜上超越了当前顶级的开源 VLMs,如 Qwen2.5-VL 和 InternVL-2.5,并且提供了与专业生成器如 SD3 竞争的文本到图像质量。
Meta 计划用 AI 实现广告创作全面自动化
Meta 平台公司(前身为 Facebook)正在大力推进广告领域的人工智能(AI)应用,旨在到明年年底之前,让品牌能够完全通过 AI 来创作和投放广告。 这一计划是 Meta 首席执行官马克・扎克伯格(Mark Zuckerberg)对公司未来愿景的重要组成部分,预计将彻底改变企业与消费者之间的广告互动方式。 据内部人士透露,Meta 正在开发一套先进的 AI 工具,这些工具能够帮助品牌在没有人力干预的情况下,自动生成广告内容并进行精准的受众定位。
英伟达CEO谈AI未来:四大趋势将助力市值迈向五万亿
在最近的财报电话会议上,英伟达(NVIDIA)首席执行官黄仁勋(Jensen Huang)分享了推动公司未来增长的四个关键人工智能(AI)趋势。 他表示,推理 AI、AI 普及、企业 AI 和工业 AI 将为英伟达带来巨大的市场机遇。 随着全球对 AI 技术需求的不断增加,这些趋势可能使英伟达的市值跃升至五万亿美元。
任天堂《塞尔达传说》手机伴侣应用被指使用生成式 AI 配音
任天堂《塞尔达传说》手机伴侣应用塞尔达笔记(Zelda Notes)的西班牙语宣传视频中,旁白被玩家质疑使用生成式AI配音,而非真人配音演员Nerea Alfonso。玩家对比真人配音后认为语气机械,目前配音演员尚未回应。#塞尔达传说##AI配音#
AI奇迹!失声歌手用Suno掩护工具重现完美嗓音,音乐梦想触手可及!
近日,一位因神经性失声而面临声音障碍的歌手,通过Suno AI的“掩护”(Cover)工具,成功将受损的录音转化为清晰、强劲的声乐表演,完美呈现其创作愿景。 这一案例不仅展示了AI在音乐领域的突破性应用,也为身体障碍者重返艺术舞台提供了全新可能。 AIbase综合最新网络信息,为您深入解析这一感人故事与技术背后的奥秘。
水利部发布首个水利标准 AI 大模型,提升标准管理效率
近日,中国水利部在 “水利标准 AI 大模型” 的发布会上,宣布该模型已成功投入使用,标志着我国水利标准化管理进入智能化新阶段。 该模型由中国水科院自主研发,整合了丰富的多源数据,为水利领域的标准制定和管理提供了强有力的支持。 这款 AI 大模型以 “SkyLIM” 体系为基础,搭载了 “海量知识库 DeepSeek/Qwen 双模型 标准服务” 的技术架构。
智元远征A2创造纪录,成首个中美欧三区域认证的人形机器人
智元机器人旗下远征A2人形机器人近日成功通过中国CR、欧盟CE-MD、欧盟CE-RED、美国FCC四项产品认证,创造了人形机器人行业的历史性突破,成为全球首个同时拥有中、美、欧三个主要区域认证的人形机器人产品。 远征A2不仅是全球首个获得三区域认证的人形机器人,同时也是国内首个获得CR和CE-MD认证的人形机器人,在多个维度实现了"首个"突破。 这四项认证覆盖了全球最重要的三大市场:中国CR认证确保产品符合国内安全标准,欧盟CE-MD和CE-RED认证分别涵盖医疗设备和无线电设备指令要求,美国FCC认证则保障了产品在美国市场的合规性。
英伟达与 MIT、香港大学联手推出 Fast-dLLM 框架,推理速度提升惊人
在最近的科技进展中,英伟达与麻省理工学院(MIT)和香港大学联合推出了名为 Fast-dLLM 的新框架,显著提升了扩散模型(Diffusion-based LLMs)的推理速度,最高可达27.6倍。 这一创新的成果为语言模型的应用开辟了新天地。 扩散模型被视为自回归模型的有力竞争者,采用了双向注意力机制,使其在理论上能够实现多词元同步生成,从而加快解码速度。
提前交付超预期!美国FDA的AI助手Elsa正式上线,药品审查将提速
美国食品药品监督管理局(FDA)今日正式推出名为Elsa的生成式人工智能工具,标志着美国政府部门在AI应用领域迈出重要一步。 该工具的成功部署不仅提前于原定时间表,还实现了预算节约,为政府机构AI转型树立了新标杆。 提前交付的成功案例FDA局长Marty Makary医学博士表示,Elsa的推出比原计划提前且低于预算,这得益于与机构科学审查员此前开展的成功试点计划。
水利部发布首个水利标准 AI 大模型 助力智能化标准管理
近日,中国水利部国科司主办,水利科学研究院自主研发的 “水利标准 AI 大模型” 正式发布。 这一创新成果旨在提升我国水利标准的管理效率,推动水利领域的智能化发展。 该模型的发布标志着我国在水利标准化工具方面迈出了重要的一步。
Salesforce 收购 Moonhub,强化 AI 招聘工具
近日,Salesforce 公司悄然收购了 Moonhub,这是一家专注于招聘和人力资源管理的人工智能初创公司。 虽然收购的具体条款尚未公开,但这一消息引发了业界的广泛关注。 图源备注:图片由AI生成,图片授权服务商Midjourney根据 Moonhub 在其官方网站上发布的声明,公司的整个团队将加入 Salesforce。
万字实录:VLA 范式,具身智能的曙光与迷雾丨GAIR Live
整理丨赖文昕编辑丨陈彩娴VLA(视觉-语言-动作模型)作为具身智能领域的关键新范式,能有效整合视觉信息、语言指令与行动决策,显著提升机器人对复杂环境的理解和适应能力,对推动机器人从单一任务执行向多样化场景自主决策的跨越至关重要 ,已成为当下学术界和工业界炙手可热的研究焦点。 圆桌主持人为北京大学计算机学院助理教授、智源学者仉尚航,并邀请了清华大学交叉信息院助理教授、千寻智能联合创始人高阳,清华大学交叉信息院助理教授、星海图联合创始人赵行,与北京大学人工智能研究院助理教授、北大-灵初智能联合实验室主任杨耀东一起进行了一场深度的讨论。 会上,主持人仉尚航带领讨论 VLA,先是探讨其定义、起源及相关模型区别;接着分析技术路线与新成果,探讨不同路线的优缺点;随后围绕机器人常见任务,剖析核心技术瓶颈与主流输出范式;还研究强化学习结合、泛化能力提升、异构数据利用与协同训练;最后关注落地场景,并探讨执行长程任务的难点与可能。
智源研究院开源轻量级超长视频理解模型Video-XL-2
近日,智源研究院联合上海交通大学等机构正式发布了一款新一代超长视频理解模型——Video-XL-2。 这一模型的推出标志着长视频理解技术在开源领域取得了重大突破,为多模态大模型在长视频内容理解方面的发展注入了新的活力。 在技术架构方面,Video-XL-2主要由视觉编码器、动态Token合成模块(DTS)以及大语言模型(LLM)三个核心组件构成。
英伟达与MIT合作推出 Fast-dLLM 框架,AI 推理速度提升 27.6 倍
近日,科技巨头英伟达联合麻省理工学院(MIT)与香港大学,发布了名为 Fast-dLLM 的新框架。 这一创新的框架旨在显著提高扩散模型(Diffusion-based LLMs)的推理速度,最高可达27.6倍,为人工智能的应用提供了更为强大的技术支持。 扩散模型的挑战与机遇扩散模型被视为传统自回归模型(Autoregressive Models)的有力竞争者。
Andrej Karpathy 盛赞!斯坦福团队新作,让Llama-1B 实现毫秒级推理
斯坦福 Hazy Research 团队刚刚公布了一项重量级优化成果:他们将开源模型 Llama-3.2-1B 的前向推理整合成了一个“Megakernel”,并将低延迟推理能力推向了极限。 在某些实时性极高的应用中,例如对话式 AI 和人类参与的交互式工作流中,大语言模型的响应速度不仅重要,甚至可以决定用户体验的成败。 团队认为限制 LLM 推理速度的瓶颈其实是在内存加载的问题上,他们经过研究发现,现有的开源推理引擎(如 vLLM、SGLang),在极低延迟的单序列生成任务下,即使在顶级 GPU(如 H100)上,也只能利用不到 50% 的内存带宽。
Agent 元年,小厂碎步快跑反超
过去三年,大模型从生成走向理解,从多模态走向执行,让 AI 第一次具备了承接复杂任务链的能力。 到了 2024 年,Agent 概念迅速崛起,成为 AI 应用落地的新焦点。 所以进入 2025 年,越来越多业内人认定——这就是 Agent 元年。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉