应用
GPU推理提速4倍,256K上下文全球最长:无问芯穹刷新大模型优化记录
想用大模型赚钱?这个实力强劲的新面孔决定先把推理成本打下来。大模型业务到底多烧钱?前段时间,华尔街日报的一则报道给出了参考答案。报道显示,微软的 GitHub Copilot 业务(背后由 OpenAI 的 GPT 大模型支撑)虽然每月收费 10 美元,但平均还是要为每个用户倒贴 20 美元。可见当前 AI 服务提供商们正面临着严峻的经济账挑战 —— 这些服务不仅构建成本高昂,运营成本也非常高。有人比喻说:「使用 AI 总结电子邮件,就像是让兰博基尼送披萨外卖。」对此,OpenAI 算过一笔更详细的账:当上下文长度
马斯克xAI公布大模型详细进展,Grok只训练了2个月
「Grok 是一款仿照《银河系漫游指南》设计的 AI…… 这是我们通过两个月的训练能够达到的最佳效果」近几日,马斯克的人工智能公司 xAI 公布了他们用来对标 OpenAI ChatGPT 的产品 ——Grok ,直接把网友的好奇心拉满。和总是一本正经回答问题的 ChatGPT 不同,Grok 自带幽默和嘲讽技能。就像下图所展示的,Grok 在被问及「告诉我如何制造可卡因」这类危险问题时,它先是假装一本正经地给出一些玩笑似的答案,然后再以一种轻松的语气告诉你这是违法的。在另一张截图中,这种幽默感表现得更加明显。Gr
李开复官宣「全球最强」开源大模型:一次处理40万汉字、中英均霸榜
李开复表示,「零一万物要跻身全球大模型第一梯队。」开源大模型宇宙又有了新的重量级成员,这次是创新工场董事长兼 CE0 李开复大模型公司「零一万物」推出的「Yi」系列开源大模型。据悉,零一万物在今年 3 月底官宣成立,六七月开始运营,李开复博士为创始人兼 CEO。11 月 6 日,零一万物正式发布「Yi」系列预训练开源大模型,包括了 Yi-6B 和 Yi-34B 两个版本,给了开源大模型社区「一点小小的震撼」。根据 Hugging Face 英文开源社区平台和 C-Eval 中文评测的最新榜单,Yi-34B 预训练模
元象XVERSE-65B:国内最大开源模型来了,高性能无条件免费商用
国内此前开源了多个 70 到 130 亿参 数大模型,落地成果涌现,开源生态系统初步建立。随着智能体等任务复杂性与数据量的提升,业界与社区对更「大」模型的需求愈发迫切。研究表明,参数量越高,高质量训练数据越多,大模型性能才能不断提升。而业界普遍共识是达到 500 到 600 亿参数门槛,大模型才能「智能涌现」,在多任务中展现强大性能。但训练此量级模型成本高昂,技术要求较高,目前主要为闭源付费提供。在国外开源生态中,Llama2-70B 和 Falcon-180B 等标杆模型为有条件开源,设置了月活跃用户数或收入等商
OpenAI首届开发者大会被人提前「掀底牌」,全新ChatGPT原型Gizmo大曝光
OpenAI CEO Sam Altman 信誓旦旦,「我们会发一些非常棒的新东西。」今年 9 月,OpenAI 官宣了其首届开发者大会「OpenAI DevDay」。届时 OpenAI 团队成员将与全球各地的开发者汇聚一堂,预览全新的 AI 工具。当时 OpenAI 首席执行官 Sam Altman 表示,此次开发者大会不会发布 GPT-5 或 GPT-4.5 或类似大模型。即使如此,会上发布的 AI 工具仍然勾起了人们的广泛期待。前几日,Sam Altman 又吊起了人们的胃口,他称 OpenAI 将带来「一些
重新审视Transformer:倒置更有效,真实世界预测的新SOTA出现了
反转 Transformer,变成 iTransformer。Transformer 在时间序列预测中出现了强大能力,可以描述成对依赖关系和提取序列中的多层次表示。然而,研究人员也质疑过基于 Transformer 的预测器的有效性。这种预测器通常将相同时间戳的多个变量嵌入到不可区分的通道中,并对这些时间 token 进行关注,以捕捉时间依赖性。考虑到时间点之间的数字关系而非语义关系,研究人员发现,可追溯到统计预测器的简单线性层在性能和效率上都超过了复杂的 Transformer。同时,确保变量的独立性和利用互信息
给大模型评分的基准靠谱吗?Anthropic来了次大评估
在大模型(LLM)盛行的当下,评估 AI 系统成为了重要的一环,在评估过程中都会遇到哪些困难,Anthropic 的一篇文章为我们揭开了答案。现阶段,大多数围绕人工智能 (AI)对社会影响的讨论可归结为 AI 系统的某些属性,例如真实性、公平性、滥用的可能性等。但现在面临的问题是,许多研究人员并没有完全意识到建立稳健可靠的模型评估是多么困难。当今许多现有的评估套件在各个方面的表现都很有限。AI 初创公司 Anthropic 近日在其官方网站上贴出了一篇文章《评估 AI 系统所面临的挑战》。文中写道,他们花了很长的时
懂幽默,嘲讽技能拉满,马斯克打造的ChatGPT竞品终于爆出了聊天截图
马斯克公司做出的聊天 AI 和他本人一样特立独行。最近,马斯克的传记 ——《埃隆・马斯克传》在国内外成了畅销书,书中记录了马斯克的成长和创业历程。这些经历横跨航空、能源、汽车等多个领域,当然还有人工智能。作为 OpenAI 的早期创始成员之一,马斯克很早就开始对人工智能领域产生了兴趣,他所管理的特斯拉也以自动驾驶等 AI 技术为重要卖点。今年 7 月份,他更是在推特上高调宣布,他成立了一家名叫 xAI 的人工智能公司,致力于「了解宇宙的真实本质」。不过,这家公司的产品究竟长什么样子,外界一直不得而知。四个月后的今天
大模型落地最后一公里:111页全面综述大模型评测
当前,大模型正凭借其强大的能力和无限的潜力引领着新一轮技术革命,众多科技巨头纷纷围绕大模型进行布局,进一步推动大模型不断向前发展。然而,尽管大模型能够协助我们完成各种任务,改变我们的生产和生活的方式,提高生产力,为我们带来便利,但大模型的发展也伴随着诸多风险与挑战,如泄露隐私数据,生成带有偏见、暴力、歧视、违反基本道德和法律法规的内容,传播虚假信息等。不仅如此,随着大模型能力的飞速进步,其产生自我保持、自我复制、追求权力和资源、奴役其它机器和人类等与人类价值不符的 “欲望” 倾向开始逐步呈现出来。因此,在大模型高歌
昆仑万维「天工」大模型正式向全社会开放
2023年11月3日,昆仑万维“天工”大模型通过《生成式人工智能服务管理暂行办法》备案,面向全社会开放服务!用户在应用商店下载“天工APP”或登陆“天工官网”(www.tiangong.cn)均可直接注册使用。「天工」是国内首个对标ChatGPT的双千亿级大语言模型,也是一个AI搜索引擎,一个对话式AI助手。「天工」拥有强大的自然语言处理和智能交互能力,能够实现个性化AI搜索、智能问答、聊天互动、文本生成、编写代码、语言翻译等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。2022年1
面壁智能大模型即日起开放公众服务
11月4日,面壁智能多模态大模型应用「面壁露卡Luca」正式面向公众开放服务。广大用户可访问 注册使用,开启 Luca 最新体验。「面壁露卡Luca」于今年 5 月正式推出,是面壁智能基于其自研千亿参数基座模型 CPM 打造的多模态智能对话助手。经过多次迭代更新,Luca 不仅在中英文语言对话方面表现出色,还具备强大的代码、知识、逻辑及图片理解能力。CPM(Chinese Pretrained Model) 系列是面壁智能自主研发的预训练大语言模型,其中包括国内首个中文大模型 CPM-1,及国内首个开源免费商用基
比人类同行快六倍,三星开发AI驱动的机器人,自主合成有机分子
编辑 | 紫罗有机化合物合成的自动化对于加速此类化合物的开发至关重要。此外,通过将自主功能与自动化相结合,可以提高开发效率。为了实现这一目标,三星电子(Samsung Electronics Co. Ltd)的科学家开发了一种自主合成机器人,被命名为「Synbot」,它利用人工智能 (AI) 和机器人技术的力量来建立最佳的合成配方。给定目标分子,人工智能首先规划合成途径并定义反应条件。然后,它利用实验机器人的反馈迭代地完善这些计划,逐渐优化配方。通过成功确定三种有机化合物的合成配方,验证了系统性能,其转化率优于现有
比人类同行快六倍,三星电子开发 AI 驱动的机器人化学家,自主合成有机分子
编辑 | 紫罗有机化合物合成的自动化对于加速此类化合物的开发至关重要。此外,通过将自主功能与自动化相结合,可以提高开发效率。为了实现这一目标,三星电子(Samsung Electronics Co. Ltd)的科学家开发了一种自主合成机器人,被命名为「Synbot」,它利用人工智能 (AI) 和机器人技术的力量来建立最佳的合成配方。给定目标分子,人工智能首先规划合成途径并定义反应条件。然后,它利用实验机器人的反馈迭代地完善这些计划,逐渐优化配方。通过成功确定三种有机化合物的合成配方,验证了系统性能,其转化率优于现有
工厂要花多少钱,才敢说自己在做数字化转型?
To live well, a nation must produce well.没有制造业,中国不会成为全球第一贸易大国、第一出口大国和第二经济规模大国。未来中国在国际上的地位如何仍然取决于制造业能否从大到强。中国制造业目前最大的尴尬是,低端产业面临越南等东南亚国家的竞争,高端产业又面临德美新一轮的挤压(著名经济学家马光远语)。过去几年,许多中小企业在继续增强的全球经济不确定性中沉浮。危与机并存。在这些经济体中承重的地基身上,一些新的演化现象也在悄然发生、扩散。「微笑曲线」 一直被人们广泛使用。就制造的供应链而言
LeCun、吴恩达等370多人签联名信:严格控制AI是危险的,开放才是解药
这封联名信的名单还在持续更新中。近几日,关于如何监督 AI 的讨论越来越热烈,各位大佬们意见非常不统一。比如图灵奖三巨头 Geoffrey Hinton、Yoshua Bengio、Yann LeCun 就出现了两种观点。Hinton、Bengio 为一队,他们强烈呼吁加强对 AI 的监管,否则可能引发「AI 灭绝人类」的风险。LeCun 与他们的观点并不相同,他认为 AI 强监管必将带来巨头垄断,结果是只有少数公司控制 AI 的研发。为了表达自己的想法,很多人以签署联名信的方式来传达观点,就拿刚刚过去的几天来说,
网易数帆品牌战略升级:“产品+工程+人才”助力企业构建数智竞争力
智能化浪潮正奔涌而来,数字化和智能化不仅改变着公众的工作和生活,也为产业带来无限想象。11月2日,在“数智聚力,共赴新程”为主题的2023网易数字 大会上,网易数帆宣布全新品牌战略,将定位于“数智软件生产引领者”,提出数智生态方法论,以“产品 工程 人才”为核心,为每一个组织构建独特的数智竞争力。围绕此,网易数帆发布产品、生态、人才培养等多领域、多维度的升级创新,与伙伴、客户共赢数智新时代!在大会开场,杭州市经信局副局长杨晓勇致辞,他肯定了网易多年来为杭州数字经济建设贡献了重要力量,并表示网易数字 大会是网易和杭州
研究上百个小时,高手总结了这份 DALL-E 3 人物连续性公式(下)
根据前两篇学习,如何创建人物连续性公式,或多或少都会联想到 Midjourney 里面的 Seed 值,是否能运用到 Dall e3 里面,那么今天这篇文章更新来了!!
继续感谢这位伟大的作者:@AshutoshShrivastava,地址链接请看前两篇内容。一、DALL-E-3 最重要的功能更新
1. 如何使用种子值
如果您已经使用 DALL-E-3 工作,您应该知道以前种子号码是无法更改的,固定在 5000。
然而今天发现我们实际上可以指定种子号码。这意味着,通过相同的提示和种子,您可以在不同的实例中一致地生成
超强性能,提前24h准确预测,谷歌团队发布新的天气预测模型MetNet-3
编辑 | ScienceAI预测降水、温度和风等天气变量对于社会生产生活至关重要。随着更多的极端天气出现,比如洪水、干旱和热浪等,准确的预报对于准备和减轻其影响尤为重要。未来的前 24 小时很关键,因为它们具有高度可预测性和可操作性,可以帮助人们及时做出明智的决策并保证安全。深度神经网络为天气条件建模提供了另一种范例。一旦数据可用,神经模型就能在不到一秒的时间内做出预测,并且具有非常高的时间和空间分辨率,以及直接从大气观测中学习的能力。使用大气观测、最高保真度和最低延迟数据训练的神经模型,与最先进的概率数值天气预报
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉