AI在线 AI在线

资讯列表

智谱开源文生图模型CogView4,支持中英双语提示词输入

智谱AI最新开源文生图模型CogView4正式亮相,CogView4不仅在参数数量上达到了6亿,还全面支持中文输入和中文文本到图像的生成,被称其为“首个能在画面中生成汉字的开源模型”。 CogView4以支持中英双语提示词输入为核心亮点,尤其擅长理解和遵循复杂的中文指令,成为中文内容创作者的福音。 作为首个能在图像中生成汉字的开源文生图模型,它填补了开源领域的一大空白。
3/4/2025 1:44:00 PM
AI在线

中文开源图片模型终于来了!智谱霸气发布 CogView4:中文 prompt 随便喂,汉字都能给你画出来!

还在苦苦寻觅能听懂中文的开源图片模型?现在,你可以彻底告别英文 prompt 的“束缚”了!国内 AI 巨头智谱 AI 霸气开源了全新文生图模型 CogView4,直接把中文图片生成技术推向了新高度! 这下,设计师们、内容创作者们,甚至是对 AI 绘画感兴趣的 “小白” 们,都能扬眉吐气,用咱自己的母语,玩转 AI 图像生成了!CogView4最大的亮点,就是它对中文的“超强理解力”!你再也不用对着翻译软件吭哧吭哧地把中文 prompt 翻译成英文,直接用最自然的中文 “指令”,就能让 CogView4秒懂你的 “画意”,精准生成你想要的画面! 更让人拍案叫绝的是,它可是首个能直接在画面中 “写” 出汉字的开源模型!
3/4/2025 1:44:00 PM
AI在线

智谱发布首个能生成汉字的开源文生图模型CogView4

2025年3月4日,北京智谱华章科技有限公司宣布推出首个支持生成汉字的开源文生图模型——CogView4。 该模型在DPG-Bench基准测试中综合评分排名第一,成为开源文生图模型中的SOTA(State of the Art),并遵循Apache2.0协议,是首个支持该协议的图像生成模型。 CogView4具备强大的复杂语义对齐和指令跟随能力,支持任意长度的中英双语输入,并能生成任意分辨率的图像。
3/4/2025 1:39:00 PM
AI在线

DeepSeek R1与OpenAI模型文风相似度高达74.2%?新研究质疑DeepSeek训练数据

在 DeepSeek 生成的文本中,有 74.2% 的文本在风格上与 OpenAI 模型具有惊人的相似性? 这是一项新研究得出的结论。 这项研究来自 Copyleaks—— 一个专注于检测文本中的抄袭和 AI 生成内容的平台。
3/4/2025 1:25:00 PM
机器之心

半个世纪后,著名的麦凯猜想终获证明!数学家夫妇终结了一个未解群论难题

故事始于 2003 年,一位名叫 Britta Späthen 的德国研究生首次接触到了麦凯猜想(McKay conjecture),这是数学群论中最大的未解难题之一。 作为群论的一个著名猜想,麦凯猜想由数学家约翰・麦凯(John McKay)于 1972 年提出,主要涉及有限群的表示论,特别是关于群的不可约特征标的性质。  最开始, Britta Späthen 的目标并没有那么大。
3/4/2025 1:21:00 PM
机器之心

北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
3/4/2025 1:19:00 PM
机器之心

上海交通大学医学院人工智能蛋白质设计课题组诚聘助理研究员、博士后、客座学生

课题组长简介张海仓,上海交通大学医学院研究员、实验室PI。 博士毕业于中国科学院计算技术研究所计算机专业,曾先后在字节跳动担任人工智能算法工程师、美国哥伦比亚大学担任博士后科学家、中国科学院计算技术研究所担任任副研究员。 研究方向聚焦人工智能算法及“AI  生命科学”交叉领域,尤其在AI 蛋白质设计 与 AI 药物设计方面有长期积累。
3/4/2025 1:04:00 PM
ScienceAI

OpenAI GPT-4.5 登顶 6 小时即失守,xAI Grok-3 上演 1 分逆袭

目前 Grok-3 总分第一,只在总体带风格控制、困难提示词带风格控制和略输 GPT-4.5 一点。
3/4/2025 1:02:06 PM
汪淼

耶鲁、剑桥等开发MindLLM,将脑成像直接转换为文本

编辑 | 萝卜皮将功能性磁共振成像 (fMRI) 信号解码为文本一直是神经科学界面临的一项重大挑战,它有望推动脑机接口的发展,并加深对大脑机制的了解。 然而,现有的方法往往存在预测性能不佳、任务种类有限以及跨受试者泛化能力较差等问题。 针对这一问题,耶鲁大学(Yale University)、达特茅斯学院(Dartmouth College)和剑桥大学(University of Cambridge)的研究人员提出了 MindLLM,一种专为主题无关且用途广泛的 fMRI 到文本解码而设计的模型。
3/4/2025 1:01:00 PM
ScienceAI

首个强化生成模型AbNovo实现多目标、多约束抗体从头设计,发表于ICLR 2025

编辑 | ScienceAI近期,上海交通大学医学院张海仓课题组联合中原人工智能产业技术研究院与中国科学院计算技术研究所,提出了一项名为AbNovo 的抗体设计新方法。 该方法基于强化学习与深度扩散模型,能够在多目标、多约束条件下实现抗体从头设计。 该研究以「Multi-objective antibody design with constrained preference optimization」为题发表在国际机器学习顶会ICLR2025上。
3/4/2025 1:00:00 PM
ScienceAI

智谱首个能生成汉字的开源文生图模型 CogView4 发布,60 亿参数

据悉,该模型在 DPG-Bench 基准测试中的综合评分排名第一,在开源文生图模型中达到 SOTA(最先进的)。该模型也是首个遵循 Apache 2.0 协议的图像生成模型。
3/4/2025 12:23:59 PM
汪淼

周鸿祎谈AI幻觉与网络安全:问题不可夸大也不应忽视

在今年全国两会前夕,全国政协委员、360集团创始人周鸿祎就DeepSeek大模型及AI安全问题发表看法,强调正确认识AI安全,既不可夸大也不应忽视。 周鸿祎指出,当前AI安全议题需警惕被夸大的趋势。 他批评以OpenAI为代表的美国五大AI公司倾向于通过渲染AI不安全来为其垄断和闭源策略辩护,借此推动政府加强监管,阻挠后来者追赶。
3/4/2025 12:00:28 PM
AI在线

德国电信计划年内推出 AI 手机:集成 Perplexity、谷歌等合作方 AI 服务

德国电信宣称其 AI 手机能在单一应用中解决客户对内容搜索、叫出租车、餐厅预订、购物的需求。
3/4/2025 11:50:04 AM
溯波(实习)

超强视频生成模型 Wan2.1 GP:低配GPU也能搞定大片!

近日,DeepBeepMeep 团队在 GitHub 上发布了 Wan2.1GP,一个针对低端 GPU 用户优化的视频生成模型。 该模型基于阿里巴巴的 Wan2.1,旨在为缺乏高性能 GPU 资源的用户提供强大的视频生成能力。 Wan2.1GP 的推出标志着视频生成技术的一个重要进步,尤其是在开放源代码领域。
3/4/2025 11:50:00 AM
AI在线

微软推出面向临床医生的 AI 语音助手 Dragon Copilot

Dragon Copilot 将于 5 月在北美地区推出,之后将很快登陆英国、德国、法国和荷兰。
3/4/2025 11:49:31 AM
汪淼

颠覆城市建模!AI生成3D城市模型GaussianCity,生成速度提升 60 倍!

南洋理工大学研究团第一项名为“GaussianCity”的超大规模3D城市模型生成技术引发了不少关注,这款由研究团队开发的全新框架,不仅在生成速度上实现了惊人的60倍提升,还突破了传统方法在规模上的限制,支持无边界的3D城市生成。 这一技术成果已被CVPR2025(计算机视觉与模式识别顶级会议)接收,成为虚拟现实、自动驾驶和数字孪生领域的重大突破。 据了解,GaussianCity在生成无人机视角和街道视角的3D城市模型方面达到了最先进的水平。
3/4/2025 11:37:00 AM
AI在线

微软拥抱 DeepSeek,Copilot+ PC 本地运行 7B 和 14B 模型

模型将从搭载高通骁龙 X 处理器的 Copilot+ PC 开始上线,随后是英特尔酷睿 Ultra 200V 和 AMD 锐龙的设备。
3/4/2025 11:33:33 AM
汪淼

火山引擎宣布大模型应用开源:上线“大模型应用实验室”,释放 AI 创新潜力

火山引擎今日通过 X 平台宣布,其大模型应用正式开源,并推出全新“大模型应用实验室”平台。 这一举措标志着火山引擎在 AI 技术生态建设上的重大突破,旨在通过开放核心应用和技术资源,加速开发者社区的创新步伐。 此次开源的应用包括手机助手、Deep Research、DeepSeek 联网版、实时视频理解、互动双语视频生成器以及语音实时通话-青青等一系列前沿 AI 工具,引发了 X 用户的广泛热议。
3/4/2025 11:23:00 AM
AI在线