应用
中文创意写作能力超GPT-4,「最会写」的中文大模型Weaver来了
ChatGPT 等通用大模型支持的功能成百上千,但是对于普通日常用户来说,智能写作一定是最常见的,也是大模型最能真正帮上忙的使用场景之一。尽管大模型经常能写出看起来像模像样的文字,但是大多数情况下内容的创意程度和文风都经不起深究。尤其是在创作领域,大模型常见的 “GPT 文风” 更是让利用大模型进行创意写作看起来简单,实际却困难重重。近日,波形智能的大模型团队发布了一款专精 AI 写作的专业大模型 Weaver。通过写作领域专业预训练和一套创新性的数据生成和 Alignment 算法,Weaver 在写作领域的各种
2/4/2024 3:45:00 PM
机器之心
看房、打碟、开特斯拉车门、吸尘攒金币:刚刚,第一批把Vision Pro抱回家的人已经开玩了
在全新的 App Store 中,Vision Pro 已经有超过 600 种第三方应用程序体验可供用户探索,包括 OpenAI 的 ChatGPT。切洋葱不用怕辣眼睛、吃油条不用怕弄脏键盘、吸尘不用怕无聊…… 谁能想到,一下子解决这么多问题的居然是苹果 Vision Pro。在刚刚过去的一天,第一批用户已经从苹果零售店拿到了自己的 Vision Pro,第一个拿着它走出来的人甚至享受了明星般的待遇。这一天,苹果 CEO 库克也亲自到场,为取货的人打开大门。有人说,买家现在的心态就像这样: 因为选错提货方式还没拿
2/4/2024 3:41:00 PM
机器之心
击败OpenAI,权重、数据、代码全开源,能完美复现的嵌入模型Nomic Embed来了
模型参数量只有 137M,5 天就能训练好。一周前,OpenAI 给广大用户发放福利,在下场修复 GPT-4 变懒的问题后,还顺道上新了 5 个新模型,其中就包括更小且高效的 text-embedding-3-small 嵌入模型。我们知道,嵌入是表示自然语言或代码等内容中概念的数字序列。嵌入使得机器学习模型和其他算法更容易理解内容之间的关联,也更容易执行聚类或检索等任务。可见,嵌入在 NLP 领域是非常重要的。不过,OpenAI 的嵌入模型并不是免费给大家使用的,比如 text-embedding-3-small
2/4/2024 3:31:00 PM
机器之心
一句指令自动玩手机,网上冲浪神器Mobile-Agent来了
一直以来,让 AI 成为手机操作助手都是一项颇具挑战性的任务。在该场景下,AI 需要根据用户的要求自动操作手机,逐步完成任务。随着多模态大语言模型(Multimodal Large Language Model,MLLM)的快速发展,以 MLLM 为基础的多模态 agent 逐渐应用于各种实际应用场景中,这使得借助多模态 agent 实现手机操作助手成为了可能。本文将介绍一篇最新的利用多模态 agent 实现 AI 操作手机的研究《Mobile-Agent: Autonomous Multi-Modal Mobil
2/4/2024 3:25:00 PM
机器之心
像人类一样在批评中学习成长,1317条评语让LLaMA2胜率飙升30倍
除了分数,打出分数背后的理由对于大模型对齐更具价值。现有的大模型对齐方法包括基于示例的监督微调(SFT)和基于分数反馈的强化学习(RLHF)。然而,分数只能反应当前回复的好坏程度,并不能明确指出模型的不足之处。相较之下,我们人类通常是从语言反馈中学习并调整自己的行为模式。就像审稿意见不仅仅是一个分数,还包括许多接受或者拒绝的理由。那么,大语言模型能否也像人类一样利用语言反馈来改善自身呢?最近,香港中文大学和腾讯 AI Lab 的研究者们提出了一项名为对比式非似然训练(Contrastive Unlikelihood
2/4/2024 3:21:00 PM
机器之心
独家 | 月之暗面正在进行两亿美元融资,投前估值高达 15 亿美元
作者丨郭 思编辑丨陈彩娴AI 科技评论独家获悉,月之暗面近日正在进行 2 亿美元融资,本轮投资由蚂蚁和阿里集团共同投资,投前估值预计 15 亿美元。 据了解,月之暗面团队成员人数在100人至200人之间。 团队创始人杨植麟是一个90后,本科毕业于清华大学计算机科学与技术系,博士就读于全美自然语言处理排名第一的卡内基梅隆大学语言技术研究所(LTI),师从苹果AI研究负责人Ruslan Salakhutdinov、谷歌首席科学家William Cohen。
2/4/2024 11:24:00 AM
郭思
如何借助AI让用户体验更智能?来看手机天猫的实战案例!
AI 当前如火如荼,正以惊人的速度改变着我们的生活和工作方式。我们淘宝设计团队也在探索如何借助 AI 的能力,打破谈及 AI 即聊天对话的思维惯性,构建更高效、实用、符合电商场景的体验范式,来帮助用户解决全链路购物场景问题,重塑用户的购物体验。
更多天猫设计案例:手猫 AI 购物助手
一、回归需求本身
谈到 AI 智能工具,大家对 Chat GPT 这类沉浸式聊天对话式 AI 产品一定不陌生。
但对电商平台来说,用户场景更为复杂,用户常常在搜索和查看商品间反复横跳,在商品详情页庞杂的信息中翻找,在多个商品间纠结不知
2/4/2024 5:12:27 AM
扎克伯格分红7亿刀,Meta股价大涨14%,开源大计成了?
Meta 正在走出阴霾。伴随着 Meta 的股价周四盘后上涨近 14%,升至历史新高,这家公司宣布了有史以来的首次股息派发。最近一次财报电话会议公布内容显示,Meta 公布的 2023 全年营收为 1349 亿美元,较 2022 年增长 16%;净利润为 391 亿美元,同比增长 69%。其中,第四季度营收为 401 亿美元,超出预期的 391.8 亿美元,同比增长 25%。从 3 月份开始,Meta 将按季度向 A 类和 B 类普通股派发现金股息 50 美分。根据彭博社汇编的数据,首席执行官扎克伯格持有约 3.5
2/2/2024 5:30:00 PM
机器之心
比肩GPT-4,商汤日日新大幅升级4.0,多模态能力领先一步
大模型的未来时刻,已经来了?速度太快了。商汤一下子把多模态大模型的发展进度条,快进到了落地阶段。商汤的大模型体系「日日新 SenseNova」今天刚刚发布了 4.0 版,不论语言能力还是文生图能力都有全面升级,还自带低门槛的落地工具。新一代 SenseNova 不仅在大语言模型、文生图模型等方面进行了重大升级,部分垂直领域能力超越 GPT-4,还发布了全新多模态大模型,并面向数据分析、医疗等场景提供了全新版本,让大模型通用能力适配到了更多领域。API 申请网址:,商汤还推出了日日新・商量大语言模型 Function
2/2/2024 5:28:00 PM
机器之心
年龄两岁,教龄一年半:婴儿AI训练师登上Science
只用 61 个小时的数据:人们终于证明了,利用当代 AI 工具,实现「真正的语言学习」是可行的。在公开采访中,图灵奖得主 Yann LeCun 多次提到,现在的 AI 模型和人类婴儿相比,学习效率实在是太低了。那么,如果让一个 AI 模型去学习婴儿头戴摄像头拍到的东西,它能学到什么?最近,Science 杂志上的一篇论文进行了初步尝试。研究发现,即使数据有限,AI 模型也能从 10 到 100 个例子中学到单词 - 视觉所指对象之间的映射,而且能够零样本地泛化到新的视觉数据集,并实现多模态对齐。这说明,利用当今的人
2/2/2024 5:23:00 PM
机器之心
2B参数性能超Mistral-7B:面壁智能多模态端侧模型开源
千元机也能本地运行。在大模型不断向着大体量方向前进的同时,最近一段时间,人们在优化和部署方面也取得了成果。2 月 1 日,面壁智能联合清华 NLP 实验室在北京正式发布了旗舰端侧大模型「面壁 MiniCPM」。新一代大模型被称为「性能小钢炮」,直接拥抱终端部署,同时也具有同量级最强的多模态能力。面壁智能本次提出的 MiniCPM 2B 参数量仅有 20 亿,使用 1T token 的精选数据训练。这是一个参数量上与 2018 年 BERT 同级的模型,面壁智能在其之上实现了极致的性能优化与成本控制,让该模型可以「越
2/2/2024 5:13:00 PM
机器之心
中国初创Xreal获新融资,以699 美元提供Apple Vision Pro风格的XR体验
机器之能报道编辑:SIA毫无疑问,苹果将在 2024 年成为空间计算热议的中心,中国厂商又会带给大家什么样的惊喜?据彭博社报道,中国增强现实(AR)设备制造商 Xreal 正在以超过 10 亿美元的估值筹集新资金,该公司已在一轮保密战略融资中筹集了 6000 万美元,以扩大其可穿戴 AR 设备的消费产品线。Xreal 在今年消费电子展上推出了最新产品 Xreal Air 2 Ultra —— XREAL Air 2 系列中的顶级型号(该系列其他型号包括 XREAL Air 2 和 XREAL Air 2 Pro),
2/2/2024 2:45:00 PM
机器之能
个性经济时代,MiniMax 语音大模型如何 To C?
大约一个月前,距离 GPT Store 上线还有两周,一位名为 Kyle Tryon 的国外开发者在个人博客上分享了其基于 ChatGPT Plus 开发的三个 Agent(又称“GPTs”),其中一个 Agent 是关于美国费城旅游出行的个人指南“PhillyGPT”,它能访问当地 SEPTA 公共交通 API,为个人提供费城当地的实时天气、旅游资讯、文艺演出活动、出行路线、公交车站与地标数据、预计抵达时间等等。 具体可访问 PhillyGPT 链接:,实际是人们对于 GPT 时代 C 端个性消费产品的真正想象。 无独有偶,1 月 11 日 OpenAI 正式上线 GPT Store 后,公布 300 万个 GPTs 之余,也将与用户日常消费活动息息相关的徒步路线指南“AllTrails”放在推荐榜单上。
2/2/2024 2:22:00 PM
王悦
Midjourney Niji 6 重磅更新!风格全面升级,支持文本生成!
大家好我是花生~
在 V6 模型推出 1 个多月后,Midjourney 终于在昨天上线了 Niji 6 模型,其出图质量与 Niji 5 相比有了很大的提升,风格感也变得更强了,今天我们一起来看看 Niji 6 的特性以及相关使用技巧~
上期回顾:Niji 本身就是一个“动漫风”模型,可以生成高质量的二次元图像以及插画,这点大家在使用过程中肯定都有感受到。而在生成非动漫主题的图像时,Niji 模型也偏向于将其处理成插画风,并赋予图像一种鲜明的风格,或者是朦胧梦幻,或者是绚烂多彩,让原本偏写实的图像更具美感。
下图
2/2/2024 6:11:18 AM
夏花生
品牌设计实战! AI 产品 Perplexity 是如何重塑品牌的?
编者按:一个 AI 的品牌要如何进行视觉和体验设计?知名设计机构 Smith & Diction 接到来自新锐 AI 平台 Perplexity 的品牌设计订单,看看他们是怎么落地设计的。
当来自 Perplexity 的 Henry 和 Phi 找上我们的时候,直言「我们希望让我们的品牌感觉上,像斯堪的纳维亚的地铁系统一样,干净清爽,周密成熟,但是以一种润物细无声的方式来呈现」。他们不想给人太过浮华、现代或年轻化的印象。结合产品的功能气质,他们希望产品看起来像承载事实的容器。
通常,这样的风格不是我们 S&D 的
2/2/2024 5:03:30 AM
陈子木
蚂蚁集团NextEvo全面开源AI Infra技术,可实现大模型训练“自动驾驶”
近日,蚂蚁集团AI创新研发部门NextEvo全面开源AI Infra技术,可帮助大模型千卡训练有效时间占比超过95%,能实现训练时“自动驾驶”,这推动了AI研发效率。图:蚂蚁集团的自动化分布式深度学习系统DLRover现已全面开源该技术框架名为DLRover,目标在于大规模分布式训练的智能化。目前很多企业的训练作业都是跑在混合部署的集群中,运行环境复杂多变,不管多么“崎岖的地形”,DLRover都可以“轻松行驶”。2023 年大模型技术的发展,带来了工程实践的爆发,如何管理数据,提高训练和推理效率,最大化利用现有算
2/1/2024 6:50:00 PM
新闻助手
“千帆杯”第一期赛题公布!一起探索 AI 原生应用的时间魔法
提到“春节”,你首先会想到什么?热气腾腾的年夜饭,大门前福气满满的春联,摩肩接踵的车站,还是一眼看不到排队尽头的游玩景点?不知从什么时候起,各大主题乐园不再只是为孩子打造的童话世界,也俨然成为了成年人的理想国。无数的成年人换上霍格沃茨制服,挑选自己的魔杖,逃离“麻瓜世界”,前往环球影城;许多成年的迪士尼粉丝,也蜂拥至上海迪士尼乐园,在全球首个“疯狂动物城主题园区”亦或是香港迪士尼乐园的全球首个“冰雪奇缘主题园区”,寻找自己的快乐。春节将至,热门主题乐园也会成为大家过节的经典选项,巨大的客流量,也意味着排队,将为主题
2/1/2024 5:19:00 PM
新闻助手
亚马逊部署超过750,000+ 台机器人,工业创新基金投资生成式AI
机器之能报道编辑:吴昕亚马逊工业创新基金有了新趋势。新负责人表示进一步支持生成式 AI,他们甚至投资了一家未公开的生成式 AI 初创公司,称该公司的技术可能会对机器人技术产生重大影响。2013 年,亚马逊只有 1000 台机器人。十年过去了,今天的亚马逊已经部署了超过 750,000 个机器人来解锁 AI 机会。他们正在测试各种先进的机器人技术,不仅关乎效率,更是在重塑人类和机器的协作方式。亚马逊已经部署了超过 750,000 个机器人来解锁 AI 机会2022 年,亚马逊设立一项 10 亿美元的工业创新基金,
2/1/2024 5:00:00 PM
机器之能
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
腾讯
Agent
Claude
芯片
Stable Diffusion
蛋白质
具身智能
xAI
开发者
生成式
人形机器人
神经网络
机器学习
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
字节跳动
华为
AGI
计算
大型语言模型
AI设计
搜索
生成式AI
视频生成
亚马逊
DeepMind
AI模型
特斯拉
场景
深度学习
Transformer
架构
MCP
Copilot
编程
视觉