应用
OpenAI 发布关于 AI 模型使用的官方建议,助力用户更高效工作
近日,OpenAI 在其帮助中心发布了针对企业用户的全新指南,详细说明了其多种人工智能模型的最佳使用时机。 这一举措旨在帮助用户根据不同的任务需求,选择最合适的 AI 模型,从而提升工作效率和成果质量。 OpenAI 的最新订阅计划 ——ChatGPT Enterprise,提供了企业级的安全与隐私保护,同时允许用户无限制地高速访问其先进的 GPT-4o 和 OpenAI o3推理模型。
快手祭出“内容净化器”KuaiMod!多模态AI专治各种劣质内容
在短视频已经成为亿万用户日常生活的重要组成部分的今天,它不仅仅是一种娱乐方式,更是人们获取信息、表达观点和进行社交的主要渠道。 随着短视频内容的爆炸式增长,各大平台正面临前所未有的挑战:一方面需要高效识别和管理内容,另一方面则需要精准地将优质内容推送给真正感兴趣的用户。 为了解决这些问题,快手作为国内领先的短视频平台,推出了基于多模态大模型的创新方案 KuaiMod,旨在优化短视频平台生态并提升用户体验。
Meta 开源 LlamaFirewall 防护工具,助力构建安全 AI 智能体
Meta AI 公司最新推出 LlamaFirewall,应对 AI 智能体不断演变的威胁格局,为生产环境中的 AI 智能体提供系统级安全保护。
OpenAI 突破传统微调,RFT 技术可精准定制 o4-mini 模型
OpenAI 公司在其 o4-mini 推理模型上,推出了强化微调技术(Reinforcement Fine-Tuning, 简称 RFT),为定制基础模型以适应特定任务带来了突破性工具。
渥太华医院引入 AI 语音助手,医生工作负担减轻 70%
近年来,医疗行业面临着医生工作负担过重与患者就医难的双重挑战。 为了应对这一问题,加拿大渥太华医院(TOH)于去年引入了微软的 DAX Co pilot,取得了显著成效。 最新数据显示,该系统不仅节省了每位医生每次就诊约七分钟,还将医生报告的倦怠和疲劳降低了70%。
Meta FAIR最新五大AI感知突破:从3D对象定位到协作推理,开源助力产业升级
Meta人工智能研究团队(FAIR)近日公开发布五项前沿研究成果,标志着AI感知领域的重大突破。 这些开源项目从视觉编码器到3D空间理解,再到协作式推理框架,共同构建了通向高级机器智能(AMI)的关键路径,为未来AI如何理解和感知世界带来全新可能。 "机器之眼"再升级:Meta感知编码器引领视觉理解新标准Meta感知编码器(Perception Encoder)作为大规模视觉编码器,在图像和视频处理领域显示出卓越能力,成为AI系统的"眼睛"。
音频同步与视频编辑!腾讯混元开源一致性视频生成工具HunyuanCustom
腾讯开源的一致性视频生成工具 “HunyuanCustom”,该模型不仅能生成生动的视频内容,还能实现音频与口型的同步。 这一创新技术的发布,标志着在深度伪造视频领域的一次重要进步。 一图生成,深度伪造不再遥远HunyuanCustom 的最大亮点在于用户只需提供一张图像,就能创造出深度伪造风格的视频。
Netflix 推出 GPT 驱动的自然语言搜索功能,仅限 iOS 用户
Netflix 宣布推出一项全新的搜索功能,采用 OpenAI 的 ChatGPT 技术,旨在让用户能够使用自然语言进行内容搜索。 用户可以通过简单的短语,如 “我想看一些搞笑的,但不要太傻” 来寻找适合的影片,而无需再输入具体的标题或关键词。 这一功能目前正在 iOS 设备上进行测试,早期测试已在澳大利亚和新西兰展开。
腾讯混元视频生成工具 HunyuanCustom 宣布开源,融合文本、图像、音频、视频等多模态输入生视频的能力
腾讯表示,Hunyuan Custom 模型能实现单主体视频生成、多主体视频生成、单主体视频配音、视频局部编辑等能力,其生成的视频与用户输入的参考主体能保持高度一致。
商汤坐上大模型核心牌桌
过去两年,关于大模型的讨论视角很少从商汤这样成立不过十年、资源与技术积累正当青壮年的人工智能公司出发。 造成这一现象的主要原因是两个技术周期的迥异:2023 年之前,商汤的人工智能技术路径以计算机视觉模型为主,不同于 ChatGPT 为代表的新技术浪潮:以自然语言处理为主、大规模参数模型为核心。 一个是视觉、一个是语言,在外界看来两个赛道还没有发生直接的关系。
重磅突破!ICEdit推出LoRA尺度修改功能:AI图像编辑迎来精细控制新时代
备受瞩目的AI图像编辑工具ICEdit迎来重大更新,其Hugging Face演示空间正式上线LoRA尺度修改功能,为全球创作者带来前所未有的图像精细控制体验。 这一革命性功能允许用户通过简单调整LoRA权重,实现对编辑强度与效果的灵活掌控,大幅提升创作自由度。 AIbase观察到,此次升级显著增强了ICEdit在多任务图像编辑领域的核心竞争力,迅速吸引了全球开发者和创意人士的热切关注。
Pinterest 凭借 AI 驱动个性化推荐实现 16% 收入增长
在刚刚过去的第一季度,Pinterest 发布了强劲的财报,收入达到了8.55亿美元,同比增长了16%。 与此同时,活跃用户数也稳步增长,达到5.7亿,较去年同期增加了10%。 Pinterest 首席执行官比尔・瑞迪在电话会议上表示,这一增长的主要原因在于公司对人工智能(AI)的持续投资,尤其是在吸引 Z 世代用户方面取得了显著成效。
微软为华盛顿州科研项目颁发AI公益奖,助力健康与可持续发展
在庆祝公司成立50周年之际,微软公司于4月29日宣布了 “AI for Good” 奖项,旨在利用人工智能技术来应对社会和科学领域的挑战。 此次奖项共颁发给20个来自华盛顿州的多样化实体,UW 医学中心的多个研究机构获得了其中的三项大奖。 在西雅图的 UW 保罗・艾伦计算机科学与工程学院的颁奖典礼上,微软同时向华盛顿州立大学的计算与工程信息通信技术实验室颁发了奖项。
路透社总裁谈新闻行业与人工智能的未来
在当今快速变化的媒体环境中,路透社总裁保罗・巴斯科伯特(Paul Bascobert)分享了他对新闻行业与人工智能(AI)关系的看法。 作为一家自1851年成立的新闻和信息服务公司,路透社经历了无数技术变革,而现在,面对智能手机和生成式 AI 的崛起,新闻传播的模式也在不断演变。 巴斯科伯特指出,尽管媒体行业在数字化浪潮中面临诸多挑战,但路透社正努力适应新的传播环境。
开源社区新添利器:DeerFlow深度研究框架融合AI与专业工具
DeerFlow,一个由社区驱动的全新深度研究框架日前发布,旨在将语言模型与专业工具相结合,为开源社区提供强大的自动化研究解决方案。 这款基于LangGraph构建的模块化多智能体系统,秉持"源于开源,回馈开源"的理念,为研究人员和开发者提供了一套完整的工具链。 DeerFlow的核心优势在于其全面的功能整合。
告别对话断层:Mem0动态存储技术实现AI代理记忆永续
Mem0 研究团队近日发布突破性内存架构,旨在解决AI系统在长期对话中的"健忘症"问题。 名为Mem0 和Mem0g的两种新型内存系统,能让大型语言模型(LLM)在数周甚至数月的对话中保持连贯一致性,实现更接近人类的记忆能力。 传统AI系统受限于固定上下文窗口,无法在长期交互中有效记忆关键信息。
苹果加速智能眼镜芯片研发,瞄准人工智能和未来 Mac 设备
苹果公司正积极推动其晶硅设计团队开发新一代芯片,这些芯片将为未来的设备提供核心处理能力。 其中包括苹果首款智能眼镜、性能更强的 Mac 电脑以及专门针对人工智能(AI)应用的服务器。 这一举措显示出苹果在智能眼镜领域的雄心,意在与 Meta Platforms Inc.
Meta任命前谷歌DeepMind主管为AI研究实验室新负责人
根据彭博社的报道,Meta 公司已任命 Robert Fergus 为其基础 AI 研究实验室(FAIR)的新负责人,接替于四月宣布离职的 Joelle Pineau。 Fergus 在担任 Meta 新职务之前,曾在 Google DeepMind 工作了约五年,担任研究总监。 在此之前,他还曾在 Meta 担任研究科学家。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉