应用
OpenDevin出技术报告了,大模型Agent开发者必读
热门通用大模型 Agent 平台。今年 3 月,「全球首位 AI 软件工程师」Devin 引爆了 AI 圈。与此前 AI 编程助手不同的是,Devin 并不只是辅助编程的角色,而是能够独立地、端到端地完成整个开发项目。Devin 的出世让我们领略了大模型 Agent 的强大能力。很快,业界就出现了众多尝试复刻它的开源项目,其中 OpenDevin 脱颖而出,受到了人们最多的关注。OpenDevin 是一个开发通过软件与世界互动的通用智能体的平台,其特点包括: 大模型 Agent、接口和环境之间交互的交互机制;Age
阿里国际将推出全球首个AI驱动的B2B搜索引擎
继日前OpenAI发布SearchGPT之后,被点燃的“AI Search”赛道再迎一全新的重量级选手:阿里国际研发的AI驱动的B2B搜索引擎将于今年9月正式亮相。当下,AI的出现彻底改变了搜索的体验。而阿里国际的新产品将是全球首个专业版AI搜索引擎,其应用场景和商业价值非常明确:专注于全球B2B电商,面向全世界的中小企业主群体,意在改变全球采购流程,使之更加直观和高效。它能用主动理解采购者的自然语言,并转化为专业的采购请求。更进一步,它还能根据全球市场数据预测需求、提供建议,实现更精准的匹配。据悉,该AI搜索引擎
最强开源文生图模型一夜易主:SD 原班人马打造,要发 SOTA 视频生成模型
感谢AI在线网友 刺客 的线索投递!最强开源文生图模型一夜易主!昨日晚间,开源文生图模型霸主 Stable Diffusion 原班人马,宣布推出全新的图像生成模型 FLUX.1。FLUX.1 包含专业版、开发者版、快速版三种模型,其中前两款模型击败 SD3-Ultra 等主流模型,较小规模的 FLUX.1 [schnell] 也超越了 Midjourney v6.0、DALL・E 3 等更大的模型。▲ FLUX.1 ELO 分数与主流模型对比FLUX.1 在文字生成、复杂指令遵循和人手生成上具备优势。以下是其最强
Nature:谷歌 AI 研究引用量登全球榜首,中国企业腾讯、阿里、华为前十
Nature 最近报道了一个新发布的 AI 行业数据库 PARAT,分析显示,在论文引用、专利申请等方面,美国和中国企业占据了主导地位。在 AI 领域,硅谷巨头 Alphabet(谷歌母公司)和微软的论文引用量最高,远超其他公司。不过,中国企业百度和腾讯在专利方面领先。这些结果来自新兴技术观察站(ETO)发布的 PARAT 数据库,该工具跟踪私营部门的 AI 相关活动,包括研究和专利的发表,以及人才指标,帮助我们洞见 AI 发展趋势。ETO 是隶属于安全与新兴技术中心(CSET),后者的总部设在乔治城大学外交学院,
大模型成私人导游:一键规划 Citywalk,港大 MIT 联合出品
现在,大模型可以做私人导游,为你规划 Citywalk 路线了 ——港大 MIT 等单位联合推出 ITINERA,将 LLM 与空间优化相结合,实现个性化的开放域城市行程规划。举个栗子,用户输入“给我规划一条包含‘巨富长’、以静安寺为终点的 citywalk 路线”。ITINERA 系统立马生成了一条包含若干地点的路线,并提供了相应的介绍文本。甚至“适合情侣一起去的酒吧”“二次元圣地”“途经网红打卡点”这样的个性化需求,ITINERA 也可以理解和满足。单看可能没感觉,咱们直接对比 ITINERA(左侧)和 GPT
OpenAI 喜提姚班学霸姚顺雨:思维树作者,普林斯顿博士,还是个 Rapper
清华姚班学霸姚顺雨,官宣加入了 OpenAI。而就是这么一则简短的消息,却引来了圈内众人的围观和祝福,来感受一下这个 feel:其中不乏像 OpenAI 前沿研究主管、美国 IOI 教练 Mark Chen,以及 AI 领域的教授、投资人等等。那么这位姚顺雨,到底为何能够引来如此关注?从他过往的履历来看,我们可以提炼出这样几个关键词:清华姚班姚班联席会主席清华大学学生说唱社联合创始人普林斯顿计算机博士▲ 姚顺雨,图源:个人主页但除了较为亮点的履历之外,真正让姚顺雨步入公众的视野,还是因为他的多项科研成果:思维树(T
Stable Diffusion 原班人马新公司官宣!新模型一夜刷新 AI 绘画格局,已获 3200 万美元融资
刚刚,Stable Diffusion 原班人马官宣创业新公司!3 月宣布从 Stability AI 出走的 Robin Rombach,就是 Stable Diffusion 的两个主要作者之一,和十来个原公司小伙伴,正式宣布了组团创业的消息。新公司名叫 Black Forest Lab,黑森林实验室。一亮相就 kuku 发了一个系列、共 3 款图片生成模型,其中有 2 个开源。而且支持中文输入。效果怎么样?看过的网友称很狂野(wild)!输入提示词,一次测试出了画面效果和人脸数据等安全措施:一名十多岁戴着滑雪
Suno 承认使用版权音乐训练 AI 模型,“取经”学习不算侵权
感谢音乐 AI 公司 Suno 昨日(8 月 1 日)发布博文,回应三大唱片公司提起的诉讼,承认曾使用过这三大唱片公司的唱片内容来训练 AI,不过该公司认为根据合理使用原则,这样做是合法的。美国唱片协会提起诉讼美国唱片业协会(RIAA)于 6 月 24 日,起诉 Udio 和 Suno 两家音乐生成初创公司,指控这两家公司使用受版权保护的音乐来训练 AI 模型。这些音乐涉及来自环球音乐集团(Universal Music Group)、索尼音乐公司(Sony Music)和华纳音乐公司(Warner Music)三
微软 GitHub 推出 Models 服务:定位 AI 工程师,让开发者试用和部署模型
感谢微软旗下代码托管平台 GitHub 最新推出了 GitHub Models 服务,定位是新一代 AI 工程师,帮助开发者选择适合其应用的 AI 模型。GitHub 在官方新闻稿中表示,GitHub Models 将服务该平台 1 亿多用户,为其提供业界领先的大语言模型(LLM)或者小语言模型(SLM)。 AI在线注:GitHub Models 服务目前处于限量公测阶段,可以对接 OpenAI 的 GPT-4o 和 GPT-4o mini、微软的 Phi 3、Meta 的 Llama 3.1 以及 Mistral
埃斯顿机器人获 4.5 亿元增资;AI 大牛周志华任南京大学副校长;论文也能发弹幕!斯坦福在线论文平台火爆丨AI情报局
今日融资快报埃斯顿:拟4.5亿元对全资子公司埃斯顿机器人增资埃斯顿公告,公司拟使用自有资金4.5亿元对全资子公司南京埃斯顿机器人工程有限公司进行增资,其中3亿元计入注册资本,1.5亿元计入资本公积。 此次增资完成后,埃斯顿机器人的注册资本将由1.5亿元增加至4.5亿元,公司仍持有埃斯顿机器人100%的股权。 埃斯顿于 1993 年在南京注册设立,2015 年在深交所上市,是国产智能工业机器人“四小龙”之一。
AI实战案例!钉钉如何用AI做好教育服务设计?
一、教育钉介绍和业务分析
钉钉教育被人所熟知主要是疫情期间的分期五星好评。
疫情期间,我们支持了全国 14 万所学校、600 万教师、1.3 亿学生的在线上课。我们从大年初二开始在家上班,不记得通宵过多少个晚上,升级功能,优化体验,就是为了学生们有课上。
现在 AI 时代刚刚到来,我们要做怎样的设计?
我也不知道,AI 都会写代码了?设计师会不会被取代?
但我知道的是设计要紧贴业务、设计是为人服务的。AI 无论再怎么发展,创新、同理心、共情是它永远所不具有的。
从宏观的涉众关系来看,办公人群是自上而下的行政管理,搞
欧盟《人工智能法案》正式生效,罚款最高达全球年营业额 7%
感谢在欧盟官方发布《人工智能法案(Artificial Intelligence Act)》最终完整版本 20 天后,全球首部全面监管人工智能的法规于当地时间 8 月 1 日正式生效。据介绍,《人工智能法案》旨在确保在欧盟开发和使用的人工智能是值得信赖的,并有保障措施保护人们的基本权利。该法规旨在在欧盟建立一个统一的人工智能内部市场,鼓励采用这项技术,并为创新和投资创造一个支持性的环境。《人工智能法案》规定,对违反被禁止的人工智能应用程序的罚款可能高达全球年营业额的 7%,对违反其他义务的罚款最高可达 3%,对提供
30 秒让照片动起来,首个国产纯自研视频大模型 Vidu 上线
感谢首个国产纯自研视频大模型 Vidu 上线,目前向用户开放了文生视频、图生视频两大核心功能,提供 4 秒和 8 秒两种时长选择,分辨率最高为 1080P。用户无需申请,使用邮箱注册即可体验。 AI在线附 Vidu 官网:www.vidu.studioVidu 模型于今年 4 月在 2024 中关村论坛首次亮相,由清华大学与生数科技联合发布,其核心技术 U-ViT 架构由团队在 2022 年 9 月提出,早于 Sora 采用的 DiT 架构,是全球首个 Diffusion 与 Transformer 融合的架构。▲
Poe 的新功能好强 !编程0基础,也能10分钟整出一个梗图编辑器
机器之能报道编辑:Sia国内大模型是不是要迅速跟上?最近,「北美知乎」问答社区 Quora 旗下的 AI 聊天平台 Poe,推出了一项名为「 Previews 」的新功能。有了这个实时预览功能,用户就能直接查看和使用在 Poe 聊天中生成的 Web 应用程序。也就是说,在 Poe ,你可以和一些非常擅长编码的 LLM 聊天,如 Claude-3.5-Sonnet 、GPT-4、Gemini 1.5 Pro 。聊天过程中生成的代码片段、网页设计、游戏等内容,都能在这个窗口预览到,还能上手体验。 上手体验第一把
OpenAI 测试长输出版 GPT-4o:单次 64K tokens,每百万 tokens 输入 6 美元、输出 18 美元
感谢OpenAI 于 7 月 29 日宣布,正在测试长输出版 GPT-4o(GPT-4o Long Output),每次请求最多可输出 64K tokens。目前该版本仅限 Alpha 测试参与者使用,可通过使用“gpt-4o-64k-output-alpha”模型名称来访问长输出版 GPT-4o。OpenAI 表示,由于长输出版本推理成本更高,因此该模型的定价有所增加,每百万 tokens 输入价格为 6 美元(AI在线备注:当前约 43 元人民币)、每百万 tokens 输出价格为 18 美元(当前约 130
谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo,苹果15Pro运行飞快
谷歌也来卷「小」模型了,一出手就是王炸,胜过了比自己参数多得多的GPT-3.5、Mixtral竞品模型。今年 6 月底,谷歌开源了 9B、27B 版 Gemma 2 模型系列,并且自亮相以来,27B 版本迅速成为了大模型竞技场 LMSYS Chatbot Arena 中排名最高的开放模型之一,在真实对话任务中比其两倍规模以上的模型表现还要好。如今,仅仅过去了一个多月,谷歌在追求负责任 AI 的基础上,更加地考虑该系列模型的安全性和可访问性,并有了一系列新成果。此次,Gemma 2 不仅有了更轻量级「Gemma 2
邓雅文飞夺中国奥运第8金 阿里云“子弹时间”定格最炫瞬间
7月31日晚,在巴黎奥运会自由式小轮车女子公园赛决赛中,18岁中国选手邓雅文高水平发挥,为中国代表团夺得第8金。在比赛直播中的回放环节,邓雅文骑着小轮车高高跃起的身姿突然定格,镜头环绕,将这个瞬间的美感放大,给观众带来前所未有的视觉享受。这就是网上热议的奥运“子弹时间”,技术来自中国的阿里云。(图 巴黎奥运会资格赛期间进行了多镜头回放系统测试)“子弹时间”覆盖21个项目据奥林匹克广播服务公司(以下简称OBS)介绍,巴黎奥运会采用中国阿里云AI增强的全新转播技术——多镜头回放系统。该系统让转播有了科幻电影般的视觉效果
还没排上SearchGPT?比Perplexity更好用的国产开源平替了解一下?
来自上海人工智能实验室。有 AI 在的科技圈,似乎没有中场休息。除了大模型发布不断,各家科技大厂也在寻找着第一个「杀手级」AI 应用的落脚之地。OpenAI 首先瞄准的是谷歌 1750 亿美元的搜索业务市场。7 月 25 日,OpenAI 带着 AI 搜索引擎——SearchGPT 高调入场。在演示 demo 中,搜索引擎的使用体验不再像以往一样,需要我们逐个点开网页链接,判断信息有没有用。SearchGPT 像端上了一桌精美的套餐,所有答案都帮你总结好了。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉