应用
Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者Julian Schrittwieser
从 AlphaGo、AlphaZero 、MuZero 到 AlphaCode、AlphaTensor,再到最近的 Gemini 和 AlphaProof,Julian Schrittwieser 的工作成果似乎比他的名字更广为人知。 今天的 AI 社区,再次被一则大佬转会消息吸引了目光。 在谷歌工作十年后,大名鼎鼎的谷歌 DeepMind Alpha 系列核心作者 Julian Schrittwieser,宣布加入 Anthropic。
10/29/2024 2:25:00 PM
机器之心
丹麦首台AI超级计算机,NVIDIA技术加持,服务于量子计算、清洁能源、生物技术等领域
编辑 | 萝卜皮2024 年 10 月 23 日 NVIDIA 创始人兼首席执行官黄仁勋携手丹麦国王启动该国最大 AI 超级计算机,旨在实现量子计算、清洁能源、生物技术等领域的突破,服务丹麦社会乃至全球。 丹麦首台 AI 超级计算机以丹麦神话中的女神命名为 Gefion。 Gefion 由丹麦人工智能创新中心 (DCAI) 运营,该公司由全球最富有的慈善基金会 Novo Nordisk 基金会和丹麦出口与投资基金资助成立。
10/29/2024 2:24:00 PM
ScienceAI
神秘模型“小熊猫”一夜刷屏:排名超 Flux、Midjourney
一夜之间,名为“red_panda” (小熊猫)的神秘文生图模型狠狠火了! ! 登顶文生图竞技场,直接将 Flux、Midjourney 等一众顶尖模型踩在脚下 ——其 ELO 得分比 Flux 1.1 Pro 高出 100 多,胜率高达 79%,每 7 秒就能生成一张图像。
10/29/2024 1:35:35 PM
汪淼
古早费曼论文手写公式也能转LaTeX,还能看懂梗图,马斯克Grok新功能上线就火了
Grok 大模型终于能看懂图像了。 设想一下,如果我们能够将所有 LaTeX 时代之前的文本资料输入到先进的大型语言模型(LLM)中,并从中获得格式规范的 LaTeX 文档库,这无疑将极大地推动科学文献的数字化进程和标准化工作。 对于科研工作者而言,这不仅仅是技术层面的飞跃,它更标志着知识管理和信息传播方式的一次重大变革。
10/29/2024 1:29:00 PM
机器之心
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
大型语言模型(LLM)的出现统一了语言生成任务,并彻底改变了人机交互。 然而,在图像生成领域,能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。 近日,智源推出了新的扩散模型架构 OmniGen,一种新的用于统一图像生成的多模态模型。
10/29/2024 1:24:00 PM
机器之心
强化学习训练一两个小时,100%自主完成任务:机器人ChatGPT时刻真来了?
把平均成功率从 50% 拉到了 100%。 最近,AI 的进步有目共睹,现在这些进步已经开始传递到机器人领域。 强大的 AI 技术也能帮助机器人更好地理解其所处的物理世界并采取更合理的行动。
10/29/2024 1:21:00 PM
机器之心
权威AI开源标准1.0版发布:Llama也不算开源
大模型开源的口号,不是随便说说的。 该来的终于来了。 本周,人工智能领域迎来了对于「开源」的官方定义。
10/29/2024 1:17:00 PM
机器之心
国庆期间被 AI 雷军“骂了 7 天”,雷军本人呼吁网友不要再玩
感谢在今年国庆假期期间,一些网友利用 AI 技术克隆雷军的声音,借此吐槽不文明行为或表达对他人的不满,有网友戏称“被 AI 雷军追着骂了整个假期”。 对此,雷军本人今日发布视频回应称,的确让自己挺困扰,也挺不舒服。 雷军表示希望大家不要再玩了,觉得这个事情不太好,不过他还是觉得 AI 是很好的技术,也非常实用。
10/29/2024 12:56:24 PM
汪淼
华为云董理斌:解难题做难事,AI重塑千行万业
10 月 28 日,新浪新闻・2024 探索大会在北京召开,邀请专家学者、行业领袖,以及数字技术领域的探索者和从业者们,就新质生产力赋能产业、企业数字化转型、数字生态构建等热点话题展开深入探讨。 华为云 Marketing 部部长董理斌发表题为 “解难题做难事,AI 重塑千行万业” 的主题演讲,分享华为云在 AI for Science 领域的最新进展,以及盘古大模型、昇腾 AI 云服务等创新技术。 华为云 Marketing 部部长董理斌发表主题演讲人工智能正在改变我们进行科学研究的方式,增强人类探索以前难以解决的问题的能力。
10/29/2024 11:42:00 AM
新闻助手
微软开源 OmniParser 纯视觉 GUI 智能体:让 GPT-4V 秒懂屏幕截图,可操控手机 / 电脑
科技媒体 marktechpost 于 10 月 24 日发布博文,报道称微软公司宣布开源 OmniParser,是一款解析和识别屏幕上可交互图标的 AI 工具。 项目背景传统的自动化方法通常依赖于解析 HTML 或视图层次结构,从而限制了其在非网络环境中的适用性。 而包括 GPT-4V 在内的现有的视觉语言模型(VLMs),并不擅长解读复杂 GUI 元素,导致动作定位不准确。
10/29/2024 10:01:35 AM
故渊
消息称 Meta 正开发自家 AI 搜索引擎:追赶 OpenAI,降低对微软、谷歌的依赖
感谢科技媒体 The Information 昨日(10 月 28 日)发布博文,报道称 Meta 公司一方面为减少对微软、谷歌的依赖,另一方面追赶 OpenAI 在 AI 领域的发展,正开发一款 AI 搜索引擎。 AI在线援引该媒体报道,内置于 Instagram 和 Facebook 的 Meta AI 机器人目前调用谷歌公司的 Google 和微软 Bing 搜索引擎,来回答用户关于近期新闻和事件的问题。 而消息称 Meta 公司早在 8 个月前就组建了专门的团队,通过网络爬虫收集了大数量网页数据,并建立了一个信息数据库。
10/29/2024 8:49:19 AM
故渊
谷歌扩展 AI 总结搜索结果功能至全球 100 多个市场,覆盖 10 亿月活用户
感谢谷歌公司昨日(10 月 28 日)发布博文,宣布在全球 100 多个国家和地区扩展 AI Overviews in Search 功能,覆盖全球 10 亿月活跃用户。 AI在线注:谷歌公司于今年 5 月在美国启动 AI Overviews in Search 功能,并于今年 8 月扩展到部分美国以外的市场,该功能主要用于 AI 总结搜索结果,让用户找到更契合的搜索结果。 谷歌在博文中表示,将于本周开始将会在全球 100 多个国家和地区推出 AI Overviews 功能,覆盖全球 10 亿月活跃用户。
10/29/2024 8:14:46 AM
故渊
AI 电商设计新思路!Midjourney 一站搞定 N 种不同风格的场景素材
大家好,我是花生。 自 Midjourney 的外部编辑功能上线后,我就一直有探索它在不同设计上的应用思路,尤其是电商设计这一块,没想到真得到了一些不错的结果。 虽然只是比较初步的尝试,但从中能看到新版 Midjourney 在电商场景设计方面的巨大应用潜力,相信能给你带来新的启发和灵感。
10/29/2024 7:58:25 AM
夏花生
大厂实战!百度「捏合总结」功能设计复盘
百度APP个人中心 AI 版重构设计复盘前言AI 能力的迅猛发展,为产品设计带来了很多新的可能性和机会。 阅读文章 . 前言.
10/29/2024 1:38:43 AM
百度MEUX 团队
快来加书签!12个超好用的 AI 神器
今天给大家推荐12个好用的AI工具,每一个都值得你加书签收藏! 第三波! 2024年10月精选实用设计工具合集大家好,这是 2024 年 10 月的第 3 波干货合集!
10/29/2024 12:38:40 AM
AGI设计之路
2024 科大讯飞全球 1024 开发者节:AI 文娱论坛“重构内容与表达”完满落幕
10 月 24 日,2024 科大讯飞全球 1024 开发者节 AI 文娱论坛在合肥圆满举办。 论坛以“重构内容与表达”为主题,旨在探讨 AI 时代下文娱产业的最新趋势,见证讯飞 AI 文娱业务的重大发布,与合作伙伴共同推动文娱行业的繁荣发展。 科大讯飞副总裁 & 研究院院长刘聪、科大讯飞消费者事业群副总裁严亚路出席大会,讯飞输入法业务部总经理程坤、数字娱乐业务部总经理 & 讯飞音乐主理人郭嘉、数字娱乐业务部副总经理 & 讯飞音乐首席科学家江源分别作主题演讲。
10/28/2024 9:01:42 PM
汐元
一张显卡“看懂”一部电影:智源联合高校开源 Video-XL,打破长视频理解极限
长视频理解是多模态大模型的核心能力之一,也是迈向通用人工智能(AGI)的关键一步。 然而,现有的多模态大模型在处理 10 分钟以上的超长视频时,仍然面临性能差和效率低的双重挑战。 对此,智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校,推出了小时级的超长视频理解大模型 Video-XL。
10/28/2024 4:29:25 PM
汪淼
先让不懂代码的来测?通义这个新产品,代码刚写完,预览就出来了
这才是未来 AI 该有的样子? 奇怪了。 一款 AI 代码工具刚发布,限量测试却要求「不懂代码」的人优先。
10/28/2024 1:18:00 PM
机器之心
资讯热榜
OpenAI 开源模型被 Meta 研究员“逆改”!只动0.3%参数,gpt-oss-20B 解锁无约束基座
奥特曼:我承认GPT-5发布搞砸了
首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
网易有道发布子曰教育大模型多款AI新品,定义教育AI应用能力L1-L5分级
阿里千问踢馆子了!Qwen3新作秒杀ChatGPT,侧脸杀切换第一人称视角,表情包绝绝子,小编:再也不用美图秀秀去水印了
小红书发布DynamicFace人脸生成技术,实现高质量图像视频人脸融合
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
OpenAI加速推进GPT-6开发,奥尔特曼承诺打造"有记忆"的个性化AI助手
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
Anthropic
英伟达
代码
训练
算法
Stable Diffusion
芯片
AI新词
LLM
蛋白质
腾讯
开发者
生成式
Claude
苹果
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
特斯拉
应用