应用
AI Infra 往事之异构计算篇:吴韧与他的学生们
2013年9月底,吴韧受百度邀请,以杰出科学家的身份加入百度深度学习研究院(IDL),此时正值他五十知天命的年纪。 吴韧在人工智能领域耕耘多年,当时已是一名顶尖的AI计算科学家。 2012年深度学习崛起前后,多年在AI领域的研究和工作经验让他坚信:这一轮人工智能竞争其实比拼的是计算能力。
1/30/2024 2:35:00 PM
张进
采摘场面如此魔性,难怪比尔·盖茨也要给它点赞
机器之能报道编辑:sia2023 年,位于意大利东北部艾米利亚-罗马涅波河畔的城市费拉拉迎来苹果收获季节。在意大利三大顶尖种植基地 Vivai Mazzoni 田园诗般的果园里,八个会飞的采摘机器人正熟练地收获苹果。2023 年苹果收获季节,在意大利费拉拉的 Mazzoni 集团果园机器人自如盘旋在果树旁,在 AI 和计算机视觉算法帮助下精确评估每个苹果的大小和颜色,然后用高吸力臂毫不费力地摘下完全成熟的果实,轻轻地放入传送带,滚入收集箱。系统由八个自动飞行机器人组成,连接到自动传送带上,每 2.5 秒采摘并存放一
1/30/2024 11:50:00 AM
机器之能
第五波!2024年1月精选实用设计工具合集
大家好,这是 2024 年 1 月的第5波干货合集!这一期干货合集中有一些非常稀有的东西,比如来自瑞士工作室的在线字体设计工具,也有非常有用的工具,比如免费的 3D 角色素材和免费的 3D 材质库,当然还有非常新的工具,比如可以调整照片内容的 AI 工具。
当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、在线字体排版设计网站
、包豪斯,对于相关的设计感兴趣,那么很大概率你会爱上这个网站。这其实是来自瑞士的独立设计工作室 Studio Feixen 的网站功能的一部分,这个生
1/30/2024 2:24:51 AM
陈子木
Midjourney 再更新!V6 模型支持外绘拓展与局部重绘了!
大家好我是花生~
上周末 Midjourney 又更新了一波新内容,一是 V6 版本增加了 3 个功能,二是 Alpha 内测网站调低了进入门槛,用户只要生成图像超过 5000 张就能体验网站内的图像生成功能,今天就为大家详细介绍一下相关内容~
相关推荐:一、V6 功能完善
此次更新最值得关注的就是 Zoom Out 外绘拓展、Pan 平移外绘和 Vary (Region) 局部重绘 3 种图像编辑功能终于能在 V6 版本中使用了,用法还是和之前也是一样的:先将图像放大,然后通过底部的按钮进行对应操作。官方提到 V
1/30/2024 1:14:20 AM
夏花生
深度解析!ControlNet模型的工作原理与应用场景(附案例解析)
一、川言川语
大家好,我是言川。本期文章是 2024 年的第一篇文章,也是 2023 年农历的最后一篇文章。截至这篇文章完成时,距离春节也只有最后一周的时间了,我无法单独向支持我的朋友们传达祝福之意。所以在本篇文章的开头,向大家说一些祝福之词:
2024 年,祝大家在新的一年里事业有成,大展宏图,前程似锦。同时在事业之外,祝大家健康、快乐以及幸福。
2024 年,辰龙年,祝大家龙飞凤舞,事业腾飞;祝大家金龙献瑞,好运连连;祝大家龙年吉祥,幸福安康。
最后,新年快乐,准备准备回家吃饺子咯~二、生成式 AI 回顾
开始
1/30/2024 12:11:46 AM
言川Artie
基于量子辅助深度学习的逆向分子设计
作者 | 康奈尔大学 Fengqi You 团队编辑 | ScienceAI康奈尔大学Fengqi You教授团队,通过结合量子计算(QC)与生成式AI的优势,提出了一个新颖的逆向分子设计框架。该框架利用QC辅助的深度学习模型来学习和模拟化学空间,从而预测并生成具有特定化学性质的分子结构。生成式AI在此过程中起着核心作用,它能够从大量的分子数据中学习潜在的结构-性质关系,并生成新的分子候选物,这些分子不仅符合预设的性质,还考虑到合成的可行性。量子计算的加入则为这一过程提供了高效的计算能力和优化算法,克服了传统计算机
1/29/2024 5:56:00 PM
ScienceAI
王延峰:迫切需要重新审视我国大模型科研组织模式
ChatGPT 掀起的通用人工智能热潮仍在快速向前,产业竞争关键要素日渐明确,中美在通用人工智能领域的竞争也进入更高的战略层面。上海是中国人工智能发展最先进的城市之一。在 1 月 26 日结束的上海市第十六届人民代表大会第二次会议上,第十六届上海市人大代表王延峰教授提交了《关于上海加快建设具有全球影响力的大模型创新集聚区的建议》(下称《建议》)。王延峰建议,上海应当集中精力,抢抓发展机遇,加快建设具有全球影响力的大模型创新集聚区,避免中美大模型方面的差距进一步拉大。王延峰是上海人工智能实验室主任助理、上海交通大学人
1/29/2024 3:22:00 PM
机器之心
500行代码构建对话搜索引擎,贾扬清被内涵的Lepton Search真开源了
你可以说我「借鉴」,但我是真开源。来了,贾扬清承诺的 Lepton Search 开源代码来了。前天,贾扬清在 Twitter 上公布了 Lepton Search 的开源项目链接,并表示任何人、任何公司都可以自由使用开源代码。项目链接:,你也可以用不到 500 行 Python 代码构建自己的对话搜索引擎了。今天,Lepton Search 又登上了 GitHub trending 榜单。此外已经有人将这个开源项目用来构建自己的 Web 应用程序了,并表示质量非常高,与 AI 驱动的搜索引擎 Perplexity
1/29/2024 3:17:00 PM
机器之心
哈工大联合快手提出CogGPT:大模型也需要认知迭代
在认知科学领域,人类通过持续学习改变认知的过程被称为认知迭代(Cognitive Dynamics)。形象地说,认知迭代就像是我们大脑的「软件更新」过程,手机应用通过不断的更新来修复 bug 和增加新功能,我们的大脑也通过不断学习新知识、经验,来改善和优化思考方式。从我们判断感冒吃什么药效果好,到一代代数学家如何证明费马大定理,无论是个人的心智发展还是人类文明的进步,认知迭代都扮演了不可或缺的角色。如今,像 GPT-4 等大型语言模型(Large Language Models,LLMs)为通用人工智能(Artif
1/29/2024 2:27:00 PM
机器之心
OpenAI新模型用的嵌入技术被网友扒出来了
学起来吧。前几天,OpenAI 来了一波重磅更新,一口气宣布了 5 个新模型,其中就包括两个新的文本嵌入模型。我们知道,嵌入是表示自然语言或代码等内容中概念的数字序列。嵌入使得机器学习模型和其他算法更容易理解内容之间的关联,也更容易执行聚类或检索等任务。使用更大的嵌入(比如将它们存储在向量存储器中以供检索)通常要比更小的嵌入消耗更高的成本、以及更多的算力、内存和存储。而 OpenAI 此次推出的两个文本嵌入模型分别是更小且高效的 text-embedding-3-small 模型和更大且更强大的 text-embe
1/29/2024 11:36:00 AM
机器之心
线上课程开售!暨视频生成前沿研究与应用 AI 技术论坛圆满收官
致力于助力企业和广大从业者掌握 AI 视频生成技术前沿,把握时代机遇的“视频生成前沿研究与应用”——机器之心 AI 技术论坛日前圆满收官。活动当天,北京西城昆仑巢论坛现场门庭若市,来自全国十余个城市的 200 多名参会者亲临现场,在 10 位视频生成领域的技术专家带领下,系统拆解了 AI 视频生成的关键技术,了解并学习了多家国内顶尖团队的技术方案和技术创新,活动的最后依然是两个技术实操来巩固所学知识,高效完成了视频生成技术的积累和升级。快来看看现场的精彩瞬间吧!嘉宾精彩分享每一位嘉宾都带来了精彩的分享,现场收获满满
1/29/2024 11:31:00 AM
机器之心
更适合中文LMM体质的基准CMMMU来了:超过30个细分学科,12K专家级题目
近期,随着多模态大模型(LMM) 的能力不断进步,评估 LMM 性能的需求也日益增长。与此同时,在中文环境下评估 LMM 的高级知识和推理能力的重要性更加突出。在这一背景下,M-A-P 开源社区、港科大、滑铁卢大学、零一万物等联合推出了面向中文大规模多学科多模态理解和推理基准 CMMMU(Chinese Massive Multi-discipline Multimodal Understanding and Reasoning),用于评估基本模型在中文各种任务中的专家级多模式理解能力。CMMMU 涵盖 6 个大类
1/29/2024 11:27:00 AM
机器之心
被大V推荐的AI论文,被引量会翻倍?两位推特博主5年推文背后影响揭秘
在 AI 领域,推特博主的影响力可能比想象中要大。经常在 X 平台(推特)上浏览 AI 论文的研究者应该都很熟悉两位博主:AK (@_akhaliq) 和 Aran Komatsuzaki (@arankomatsuzaki)。他们每天都会精选一些论文进行展示,方便大家重点阅读。数据显示,AK 在 X 平台上的粉丝数已经接近 28 万,Aran Komatsuzaki 也超过了 8 万。一般来说,能够得到这两位博主推荐的论文通常质量都相对有保证,后续也能得到更多研究者的关注。但是,二人的影响力到底有多大,被推荐和不
1/29/2024 11:23:00 AM
机器之心
Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效
融合多个异构大语言模型,中山大学、腾讯 AI Lab 推出 FuseLLM随着 LLaMA、Mistral 等大语言模型的成功,各家大厂和初创公司都纷纷创建自己的大语言模型。但从头训练新的大语言模型所需要的成本十分高昂,且新旧模型之间可能存在能力的冗余。近日,中山大学和腾讯 AI Lab 的研究人员提出了 FuseLLM,用于「融合多个异构大模型」。不同于以往的模型集成和权重合并,前者需要在推理时同时部署多个大语言模型,后者需要合并模型具备相同的结果,FuseLLM 能够从多个异构大语言模型中外化知识,将各自的知识
1/29/2024 11:02:00 AM
机器之心
15岁开公司,22岁再创业公司估值超20亿美金,Cohere CEO自述开挂人生
机器之能报道编辑:SiaAidan Gomez 是明星生成式 AI 创业公司 Cohere 的联合创始人兼 CEO,曾入选 2023 年《时代》杂志 100/AI AI 领域最具影响力人物名单。前段时间,这家位于加拿大多伦多的创业公司完成 C 轮融资,支持者包括英伟达、Salesforce、甲骨文等,估值超 21 亿美元。公司天使轮投资人包括李飞飞、Geoffrey Hinton、Pieter Abbeel 等大腕儿。作为 OpenAI 最大竞争对手之一,与非常注重 2C 部署的 ChatGPT 不同,Cohere
1/29/2024 10:41:00 AM
机器之能
AI全链路营销公司「奥创光年」完成1500万美元A+轮融资,美图、凯辉联合领投
今日,AI全链路营销公司「奥创光年」(Mogic Ai)对外宣布,已获得1500万美元A 轮融资。本轮融资由美图公司、凯辉基金联合领投、彬复资本、万物创投跟投,其中凯辉基金为奥创光年A轮领投基金,万物创投曾参与奥创光年天使轮投资,本轮继续追加投资。这是奥创光年于2023年8月首次披露其A轮千万级美元融资后,仅在半年内再度公布的新一轮融资,本轮融资由华兴资本担任独家财务顾问。奥创光年是一家AI Native营销公司,团队现已推出SaGa视频内容生成模型及Mogic Content AI Studio(CAS)全链路营
1/29/2024 10:08:00 AM
机器之心
手把手教程!用AI快速做挂件+动态的微信红包封面!
春节马上就要到了,一年一度的微信红包封面大战又要开始了。微信公众号奖了我一万多个红包封面,所以这次我打算挑战一下做个最复杂的红包封面,也就是挂件 动态,并且借由这个测试下现在 AIGC 的能力边界。
更详细的红包教程 7 款AIGC 工具教程:本次测试用到的工具有:图像生成:WHEE
视频生成:Runway
图像编辑:Photoshop sketch
视频剪辑:剪映
图像压缩:iloveimg官方文件与帮助文档:、封面图生成
1. 目标拆解
带挂件的红包封面→需要 png 格式→需要抠图→好扣的图→扁平风
扁
1/29/2024 12:51:18 AM
逗砂
Runway 王炸更新!5个笔刷让人人都能成为神笔马良
前言
上周 Runway 再次升级 Gen-2「运动笔刷」更名为「多头运动笔刷」(Multi Motion Brush),这次可以说是 AI 视频可控性的王炸进化!5 个笔刷,可以对视频局部调整,人人秒变神笔马良。
目前所有用户都可以免费使用,额度 100 秒,每使用一次消耗 4 秒。
接下来让我们一起来试一试吧。
更多AI视频干货:一、使用体验
目前,Runway 可以在官网上或者下载手机 APP 使用。
1. 登录网址
打开官网:
进入 Runwayml 主页,点击图片上的粉色「Start with imag
1/29/2024 12:36:24 AM
yaoyao
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
腾讯
Agent
Claude
芯片
Stable Diffusion
蛋白质
具身智能
xAI
开发者
生成式
人形机器人
神经网络
机器学习
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
字节跳动
华为
AGI
计算
大型语言模型
AI设计
搜索
生成式AI
视频生成
亚马逊
DeepMind
AI模型
特斯拉
场景
深度学习
Transformer
架构
MCP
Copilot
编程
视觉