AI
风格迁移重大突破!西湖大学等提出StyleStudio攻克「过拟合」难题 | CVPR 2025
近年来,随着扩散模型的发展,风格迁移技术在文本引导的图像生成任务中取得了显著突破。 然而,尽管现有方法可以实现优秀的风格化效果,但其对文本信息的精准控制仍存在明显不足,大多数方法在融合风格图像与文本描述时,往往会让生成结果过度依赖参考风格图像,导致对文本内容的响应能力下降。 「风格主导的失衡问题」使得用户在输入文本提示时难以精准控制图像的颜色、结构或其他细节属性,还可能引入不稳定因素,例如棋盘格效应,进一步限制了其实用性。
3/7/2025 8:50:00 AM
新智元
智源BGE-VL拍照提问即可精准搜,1/70数据击穿多模态检索天花板!
BGE系列模型自发布以来广受社区好评。 近日,智源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩充了原有生态体系。 BGE-VL在图文检索、组合图像检索等主要多模态检索任务中均取得了最佳效果。
3/7/2025 8:40:00 AM
新智元
阿里千问QwQ-32B推理模型开源,比肩671B满血DeepSeek-R1!笔记本就能跑
凌晨,阿里重磅开源全球最顶尖AI模型——通义千问QwQ-32B推理模型。 它仅用320亿参数,便与目前公认的开源最强6710亿参数的满血版DeepSeek-R1(370亿被激活)相媲美。 甚至,QwQ-32B在多项基准测试中全面超越o1-mini。
3/7/2025 8:30:00 AM
新智元
AI如何彻底改变创新
AI时代已经到来,正在重写创新的规则。 创新一直是人类进步的支柱,它变革产业、革新企业、改善生活。 我们所讨论的不仅仅是渐进式的改进。
3/7/2025 7:00:00 AM
David Henkin
揭秘黑客窃取数据的内幕
一旦黑客突破了组织的防御,在网络内部移动和访问信息就相对容易,可能会持续数天甚至数月而未被发现。 这对于存储有宝贵的敏感和个人身份信息的银行和金融服务机构来说,是一个重大隐患。 网络安全的目标是最小化风险和入侵的影响。
3/7/2025 12:00:05 AM
Portkey AI Gateway:轻松整合多种大语言模型的开源AI解决方案
随着开源 AI 框架的快速发展,开发者们在部署 AI 模型时获得了前所未有的灵活性。 Portkey AI Gateway 作为一款开源项目,旨在简化 AI 模型的编排,提供统一的 API 接口,助力开发者轻松整合多种 AI 模型。 除了支持大型语言模型(LLMs),Portkey 还涵盖了视觉、音频(文本转语音和语音转文本)、图像生成等多模态生成 AI 模型。
3/6/2025 6:00:00 PM
AI在线
SiMa.ai 连续第三年入选《福布斯》最佳初创企业雇主名单
SiMa.ai 公司近日宣布,其被评选为《福布斯》2025年美国最佳初创企业雇主名单,这已是该公司连续第三年获得此殊荣。 SiMa.ai 致力于打造卓越的工作环境,吸引优秀人才,以推动人工智能(AI)在各个行业的应用,服务于全球客户。 图源备注:图片由AI生成,图片授权服务商MidjourneySiMa.ai 是一家专注于软件的嵌入式边缘机器学习系统芯片(MLSoC)公司。
3/6/2025 5:51:00 PM
AI在线
Manus合伙人:低估了大家的热情 服务器容量确实有限
近日,Manus AI的合伙人张涛在平台发布声明,分享了团队在过去17个小时内所经历的意外冒险。 张涛表示,团队最初只是希望分享在探索agent产品形态过程中的阶段性收获,因此服务器资源是按照行业里发布一个demo的标准来准备的,未曾预料到会引发如此巨大的反响。 面对突如其来的用户热情,张涛坦言团队完全低估了大家的期待。
3/6/2025 5:46:00 PM
AI在线
全球最大呼叫中心运营商采用AI技术实时修改印度员工口音
在全球商业沟通中,人工智能的角色引发了热烈的讨论。 全球最大的呼叫中心运营商 Teleperformance 开始采用美国初创公司 Sanas 开发的人工智能技术,实时修改印度员工的口音,以便更好地服务西方客户。 该公司声称,这项技术可以减少误解,提高生产效率,甚至保护呼叫中心员工免受语言攻击。
3/6/2025 5:18:00 PM
AI在线
开源中国完成数亿元C轮融资,加速AI战略布局
3月6日,开源技术生态领军企业开源中国(开源共识(上海)网络技术有限公司)宣布完成数亿元C轮融资。 本轮融资由北京信息产业发展投资基金(北京信产基金)领投,深报一本股权投资基金(深报一本)及北京上河动量私募股权基金(上河动量)跟投,指数资本担任财务顾问。 融资将用于深化AI战略,扩展产品矩阵,推进软硬件协同的智能解决方案,促进AI在产业领域的落地。
3/6/2025 5:12:00 PM
AI在线
Nvidia GTC2025:人工智能与加速计算的全球盛会即将启幕
Nvidia 今日宣布,其全球顶级人工智能会议 GTC2025将于3月17日至3月21日在加利福尼亚州圣何塞盛大举行。 此次会议预计将吸引25,000名现场参会者以及300,000名线上观众,共同见证人工智能与加速计算技术的最新突破。 黄仁勋主题演讲备受瞩目Nvidia首席执行官黄仁勋(Jensen Huang)的主题演讲无疑是本次大会的重头戏。
3/6/2025 4:38:00 PM
AI在线
全球首款通用AI智能体Manus正式入驻微博 网友在线求邀请码
今日中午,全球首款通用AI智能体Manus正式入驻微博,引发了广大网友的热烈关注和讨论。 据微博AI官微介绍,Manus不仅是一款智能助手,更是一位能够“手脑并用”的超级同事,它无需复杂指令,只需一句话就能完成简历筛选、旅行规划、数据分析、PPT制作甚至写代码部署网页游戏等多种任务,成为职场白领、学生党以及创业达人的效率神器。 Manus作为一个通用的AI代理,连接了思想和行动,它不仅具备思考能力,更重要的是能够直接提供结果。
3/6/2025 4:27:00 PM
AI在线
一夜刷屏的国产AI 品Manus邀请码被炒到天价,高达5万元
今日,国产出海人工智能产品 Manus 在科技圈引发了广泛关注,成为热议话题。 据报道,Manus 由中国创业公司 Monica 推出,是全球首款通用型 AI 智能体。 官方表示,Manus 在 GAIA 基准测试中取得了卓越的成绩,性能超越了 Open AI 的同类大模型。
3/6/2025 3:22:00 PM
AI在线
苹果在iOS 18.4中推出AI驱动的应用评论摘要功能
随着 iOS18.4软件更新的公测启动,苹果公司正式推出了应用商店(App Store)评论的 AI 驱动摘要功能。 这项新功能利用苹果自主研发的 AI 技术 “Apple Intelligence”,通过分析用户留下的评论,生成一段简短的总体总结,帮助用户快速了解应用的评价情况。 根据苹果官网的介绍,这些评论摘要将由大型语言模型(LLMs)生成,提取用户反馈中的关键信息并整合成一段文字。
3/6/2025 3:11:00 PM
AI在线
Manus创始人肖弘:90后AI新星比前辈梁文峰年轻
一款名为Manus的通用AI代理产品席卷全球科技圈,其背后创始人肖弘(英文名Red)成为备受瞩目的焦点人物。 公开资料显示,Manus创始人肖弘是一名90后,1992年出生,比DeepSeek创始人梁文峰(1985年出生)年轻7岁。 这位华中科技大学软件工程专业毕业的年轻创业者,以敏锐的洞察力和卓越的执行力,在AI领域崭露头角,成为中国科技界的新星。
3/6/2025 3:00:28 PM
AI在线
Manus回应邀请码被炒至5万:从未投放推广,呼吁理性参与
2025年3月6日,全球首款通用AI智能体Manus自开启部分内测以来,引发全球用户追捧热潮。 然而,其稀缺的邀请码却在二手交易市场上掀起波澜。 据报道,在某二手交易平台上,Manus邀请码的价格从999元被炒至高达5万元,令人咋舌。
3/6/2025 3:00:27 PM
AI在线
Cohere发布全新多模态AI模型Aya Vision,提供32B和8B两个版本
人工智能初创公司 Cohere 的非营利研究实验室本周发布了一款多模态 “开放” AI 模型 ——Aya Vision。 该实验室声称,该模型在行业内处于领先地位。 Aya Vision 能够执行多项任务,包括撰写图片说明、回答与照片相关的问题、翻译文本以及生成23种主要语言的摘要。
3/6/2025 2:54:00 PM
AI在线
特朗普分享 “加沙度假胜地” AI 视频,创作者称其为政治讽刺
近日,特朗普在其社交平台 Truth Social 上分享了一段名为 “特朗普加沙” 的 AI 生成视频,该视频展示了战火纷飞的加沙地带被描绘成一个类似迪拜的度假天堂。 视频中,一家人从废墟中走出,来到一座高楼林立的海滨度假区,而特朗普则与以色列总 理内塔尼亚胡一同在日光椅上饮用鸡尾酒,旁边的埃隆・马斯克则正在撕扯扁面包作小吃。 这一视频的创作者是洛杉矶的电影制作人索洛・阿维塔尔,他表示这段视频是对特朗普所谓的 “加沙地产开发计划” 的政治讽刺。
3/6/2025 2:40:00 PM
AI在线
资讯热榜
昆仑万维面向全球发布天工超级智能体Skywork Super Agents
超多案例!让 Lovart 作图更好看更高效的提示词在这里了!
Flowith NEO发布!全球首款无限步骤、上下文与工具的AI Agent
昆仑万维天工超级智能体发布!AI Office革命来袭,Deep Research碾压OpenAI,成本仅40%!
谷歌发布Flow AI剪辑工具:Veo3 与Imagen4 驱动、镜头控制与场景扩展
告别“单打独斗”!AI 协作新范式 MoA,如何集结大模型“梦之队”?
字节跳动开源多模态模型 BAGEL:图文生成与编辑的新突破
Google搜索推出AI Mode实验,探索全新智能问答体验
标签云
人工智能
AI
OpenAI
AIGC
ChatGPT
模型
DeepSeek
AI绘画
机器人
数据
谷歌
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
芯片
英伟达
生成式
蛋白质
开发者
腾讯
Anthropic
神经网络
研究
3D
计算
Sora
机器学习
AI设计
AI for Science
生成
苹果
GPU
AI视频
搜索
华为
场景
百度
训练
人形机器人
Claude
预测
伟达
xAI
深度学习
Transformer
大语言模型
智能体
字节跳动
模态
文本
具身智能
神器推荐
Copilot
驾驶
LLaMA
视觉
API
算力
应用
安全
干货合集
工具
大型语言模型
视频生成
Agent