应用
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
近日,云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的 Gemini-1.5-Pro 和 GPT-4v,仅次于 GPT-4o(69.9)和 Claude3.5-Sonnet(67.9)。而在国内市场,从容大模型的成绩也超过了 InternVL-Chat(61.7)和 GLM-4V(60.8),排名首位。
6/28/2024 6:34:00 PM
机器之心
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
性能翻倍的Gemma 2, 让同量级的Llama3怎么玩?AI赛道上,科技巨头们激烈角逐。前脚有GPT-4o问世,后脚就出现了Claude 3.5 Sonnet。如此激烈的争斗中,谷歌虽然发力较晚,但在短时间内就能有显著的能力跟进,可见其技术发展与创新的潜力。除了Gemini模型外,Gemma这一系列轻量级的SOTA开放模型似乎与我们距离更近。它基于Gemini模型相同的研究和技术构建,旨在让每个人都拥有构建AI的工具。谷歌持续扩展Gemma家族,包括CodeGemma、RecurrentGemma和PaliGem
6/28/2024 6:31:00 PM
机器之心
论坛预告|WAIC 2024腾讯论坛,邀你共话AI,智创未来
主题:智创未来地点:上海世博中心红厅时间:7月5日14:00-17:007月5日,由腾讯华东总部主办,腾讯优图实验室、腾讯云智能、腾讯研究院、腾讯新闻共同协办的 2024 世界人工智能大会腾讯论坛将在上海世博中心红厅举办。今年腾讯论坛以“智创未来”为主题,邀请来自学术界及产业界的嘉宾共同探讨AI领域前沿思想,探索人工智能发展新机遇。相信智慧的碰撞能激发技术的革新,深度的探讨能预见更智慧更美好的未来。为您正式揭晓腾讯论坛嘉宾阵容 蒋杰
6/28/2024 5:02:00 PM
新闻助手
论坛预告|“智启文创,激发无限新质生产力” ——“AI+文创”发展论坛前瞻
论坛主题:智启文创,激发无限新质生产力论坛时间:7月6日 9:30-11:40论坛地点:上海世博中心515会议室近年来,随着人工智能技术的迅猛发展,各行各业在新技术的加持下,迸发出了新的动力。在“AI 文创”新质生产力的培育与发展中,上海积极落实数字中国建设部署,为数字文创和元宇宙新赛道顶层设计和战略布局、打造文创产业创新发展“核爆点”提供了新的机遇。为弘扬中华文化,推动文创产业创新发展,搭建国内外文创领域的交流平台,本次“AI 文创发展论坛”应运而生。论坛邀请全球专家、学者、文创产业精英及行业领军人物齐聚一堂,共
6/28/2024 4:48:00 PM
新闻助手
字节大模型团队Depth Anything V2模型入选苹果最新CoreML模型
近日,苹果公司在HuggingFace上发布了20个新的Core ML模型和4个数据集,字节大模型团队的单目深度估计模型 Depth Anything V2入选其中。CoreML是苹果公司的机器学习框架,将机器学习模型集成到iOS,MacOS等设备上高效运行,可在无需互联网连接的情况下执行复杂的AI任务,从而增强用户隐私并减少延迟。苹果开发者可以利用这些模型更容易地构建智能、安全的AI应用。Depth Anything V2为字节大模型团队开发的单目深度估计模型。相比上一代版本,V2版在细节处理上更精细,鲁棒性更强
6/28/2024 4:42:00 PM
新闻助手
专访 OmniH2O 项目发起人何泰然:探索人形机器人遥操作通向具身智能的可行之路
作者丨饶舒玮编辑丨岑峰“既要又要”是何泰然的野心,也是决心。 在谈到人形机器人遥操作的可行路径时,何泰然表示他既可以实现机器人的全身控制,还可以用强化学习来实现这一点。 在他所探索的这条路上,不必因为技术瓶颈或短期目标而妥协,可以“既要又要”。
6/28/2024 4:17:00 PM
饶舒玮
百度智能代码助手“文心快码”发布:支持 100+ 主流编程语言及多种 IDE
在今日举行的百度 WAVE SUMMIT 深度学习开发者大会上,百度推出了旗下智能代码助手 —— 文心快码(Baidu Comate)。文心快码(Baidu Comate)基于文心大模型,结合百度积累多年的编程现场大数据和外部优秀开源数据,拥有代码智能、场景丰富、创造价值、广泛应用等多重产品优势,可实现“帮你想、帮你写、帮你改”的场景应用形态。百度表示,该公司内部上万工程师中,目前已经有 80% 的人都开始使用文心快码,代码采用率达 44%。据介绍,文心快码有三大方面的优势:更懂研发知识,开发速度快;更懂研发全流程
6/28/2024 3:55:19 PM
问舟
中国AGI能否重演移动互联网的故事?
轰轰烈烈的大模型浪潮,似乎正在进入一个煎熬期。6 月中旬,微软发布了一个出人意料的消息,他们将于 7 月份停止其推出仅三个月的 Copilot GPTs 服务。Copilot GPTs 可以理解为针对各种需求创建的智能助手,比如杂货 Copilot GPT 可以根据你发给它的膳食计划开列采购清单。这一服务和 OpenAI 的 GPT Store 非常相似。而且,后者同样未能成为市场宠儿:数字解决方案公司 CTOL.Digital 的一份报告估计,GPT Store 的流量不到正常 ChatGPT UI 的 2%。要
6/28/2024 3:13:00 PM
机器之心
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
国内大模型的能力,又来到了一个新高度!6月27日,科大讯飞正式对外发布讯飞星火大模型V4.0,以及在医疗、教育、商业等多个领域的人工智能应用。随着新版本的发布,讯飞星火V4.0七大核心能力全面升级,在8个国际主流测试集中排名第一,整体超越GPT-4 Turbo,领先国内大模型。刘庆峰称,当前,星火APP下载量已经达到了1.31亿,涌现出一批用户喜爱的应用助手。在星火大模型的加持下,部分场景下的智能硬件销量同比增长70% ,月均使用时次数超过4000万。另外,星火V4.0大模型是基于全国首个国产万卡算力集群「飞星一号
6/28/2024 3:07:00 PM
机器之心
史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍
DiT 都能用,生成视频无质量损失,也不需要训练。实时 AI 视频生成来了!本周三,新加坡国立大学尤洋团队提出了业内第一种可以实时输出的,基于 DiT 的视频生成方法。该技术名为 Pyramid Attention Broadcast (PAB)。通过减少冗余注意力计算,PAB 实现了高达 21.6 FPS 的帧率和 10.6 倍的加速,同时不会牺牲包括 Open-Sora、Open-Sora-Plan 和 Latte 在内的流行基于 DiT 的视频生成模型的质量。值得注意的是,作为一种不需要训练的方法,PAB 可
6/28/2024 2:55:00 PM
机器之心
ICML 2024 | 揭示非线形Transformer在上下文学习中学习和泛化的机制
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文作者李宏康,美国伦斯勒理工大学电气、计算机与系统工程系在读博士生,本科毕业于中国科学技术大学。研究方向包括深度学习理论,大语言模型理论,统计机器学习等等。目前已在 ICLR/ICML/
6/28/2024 2:48:00 PM
机器之心
寒武纪1号诞生:谢赛宁Yann LeCun团队发布最强开源多模态LLM
就像动物有了眼睛,谢赛宁 Yann LeCun 团队的 Cambrian-1 能让 AI 获得强大的视觉表征学习能力。古往今来,许多哲学家都探究过这个问题:理解语言的含义是否需要以感官为基础?尽管哲学家们看法不一,但有一点却不言而喻:坚实有效的感官定基(grounding)至少能带来助益。比如科学家们普遍相信,寒武纪大爆发期间视觉的出现是早期动物演化的关键一步;这不仅能帮助动物更好地找寻食物和躲避捕食者,而且还有助于动物自身的进化。事实上,人类(以及几乎所有动物)的大多数知识都是通过与物理交互的感官体验获取的,比如
6/28/2024 2:34:00 PM
机器之心
阿里玉伯创业AI原生在线办公,首轮估值过亿;StabilityAI4亿美元债务一笔勾销;Perplexity获新投资丨AI情报局
融资快报Stability AI 获前 Facebook 总裁主导的 8000 万美元投资,并豁免 4 亿美元的债务:由前 Facebook 总裁 Sean Parker 领衔的投资者群体接管这家在商业与运营受阻的 AI 独角兽。 新一轮投资的投资者包括 Greycroft、O’Shaughnessy Ventures 和生物技术投资者 Robert Nelsen,老股东Coatue、Lightspeed 以及 Ashton Kutcher 的Sound Ventures 也承诺投资。 此外,包括前 Google CEO Eric Schmidt 以及伦敦 Stability AI 早期支持者在内的投资者群体已经与供应商达成协议,豁免 Stability AI 欠下的 1 亿美元债务,同时免除公司未来 3 亿美元的义务,这些债务主要用于云计算服务提供商。
6/28/2024 2:28:00 PM
我在思考中
携手云帆,探索无界: 2024 WAIC 云帆奖颁奖典礼暨人工智能青年先锋论坛全日程公布
ChatGPT 的飞速迭代,亦或是 Sora 的惊艳出场,AI 技术的革新不断突破人类的想象。由此引发科学范式、技术创新、软硬件升级、产业变迁等超常化演进,正实现着链式突破,全球涌现出新一轮科技革命与产业变革热潮。我们正处于一个新征程的起点,哪些前沿研究将定义未来十年的 AI 发展?如何推动人工智能技术实现进一步的重大突破?谁又是引领这些变革的关键人物?为了表彰敢于探索、勇于创新的 AI 青年先锋,为 AGI 时代汇聚智慧明星,同时也为了充分发挥 WAIC 云帆奖平台优势,加强海内外人工智能领域交流与合作。在世界人
6/28/2024 2:27:00 PM
机器之心
首个类 Sora 开源复现方案,Open Sora 可在英伟达 RTX 3090 显卡上 AI 生成视频:最高 4 秒 240P
作为全球首个类 Sora(OpenAI 的文本生成视频模型)开源复现方案,Open-Sora 可以在英伟达 RTX 3090 GPU 上基于文本生成视频,最高可以生成 240P 分辨率、时长最长 4 秒的视频。处理 AI 任务的 GPU 云服务提供商 Backprop 展示了基于 Open-Sora V1.2 的 AI 环境,展示 4 个基于提示词生成的视频。Backprop 表示:“在 RTX 3090 GPU 上,用户可以生成最高 240p、时长 4 秒的视频,生成 2 秒视频大约需要 30 秒,4 秒视频大约
6/28/2024 2:11:17 PM
故渊
200 亿估值之后,中国大模型公司还能拿谁的钱?
「200 亿」成为高风险投资代名词的直接原因,是无论美元基金(如红杉、IDG)或人民币基金(如启明、君联),其背后的 LP 主力背景里都有地方政府与国资,后者的投资喜好是风险厌恶。 「200亿是不是一个坎」成为投资者与创业者都要思考的共同问题。 目前,中国只有两家公司(智谱 AI 与月之暗面)在以估值约 30 亿美元、200 亿人民币进行新一轮融资。
6/28/2024 11:23:00 AM
张进
比尔・盖茨喊话环保人士:不要“过分担心”AI 用电问题
据《金融时报》北京时间今日报道,针对当前 AI 系统导致能源消耗加快的问题,比尔・盖茨发起了“辩护”,他认为 AI 技术最终将会“抵消”其耗电量。比尔・盖茨在伦敦演讲时向环保人士和政府发起呼吁,不要“过分担心”运行新一代 AI 系统所需的巨大电力,因为微软等大型科技公司竞相投资数百亿美元建设大型新数据中心。他表示,数据中心将导致全球用电量增加 2-6%。而在今年 5 月,微软承认自 2020 年以来,其温室气体排放量增加了近三分之一,很大程度上是由于建设数据中心导致的。但与此同时,科技公司将在寻求新的能源来源时为清
6/28/2024 11:21:53 AM
清源
计算机视觉华人史:权龙与他的学生们
作者 | 赖文昕编辑 | 陈彩娴「简单,是终极的复杂。 」群星闪耀时1988 年的冬天,一辆火车从法国出发、开往卢森堡。 火车上有一行四人,来自法国南锡,他们精神焕发,兴高采烈地讨论着即将开始的旅程。
6/28/2024 10:38:00 AM
赖文昕
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
Sora
3D
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind