蚂蚁集团
蚂蚁集团NextEvo全面开源AI Infra技术,可实现大模型训练“自动驾驶”
近日,蚂蚁集团AI创新研发部门NextEvo全面开源AI Infra技术,可帮助大模型千卡训练有效时间占比超过95%,能实现训练时“自动驾驶”,这推动了AI研发效率。图:蚂蚁集团的自动化分布式深度学习系统DLRover现已全面开源该技术框架名为DLRover,目标在于大规模分布式训练的智能化。目前很多企业的训练作业都是跑在混合部署的集群中,运行环境复杂多变,不管多么“崎岖的地形”,DLRover都可以“轻松行驶”。2023 年大模型技术的发展,带来了工程实践的爆发,如何管理数据,提高训练和推理效率,最大化利用现有算
专为数据库打造:DB-GPT用私有化LLM技术定义数据库下一代交互方式
DB-GPT 简化了这些基于大型语言模型 (LLM) 和数据库的应用程序的创建。2023 年 6 月,蚂蚁集团发起了数据库领域的大模型框架 DB-GPT。DB-GPT 通过融合先进的大模型和数据库技术,能够系统化打造企业级智能知识库、自动生成商业智能(BI)报告分析系统(GBI),以及处理日常数据和报表生成等多元化应用场景。DB-GPT 开源项目发起人陈发强表示,“凭借大模型和数据库的有机结合,企业及开发者可以用更精简的代码来打造定制化的应用。我们期望 DB-GPT 能够构建大模型领域的基础设施,让围绕数据库构建大
大幅提升用户行为表征通用性,蚂蚁新模型获CIKM 2023最佳应用论文奖
由美国计算机学会 ACM 主办的 CIKM 2023 学术会议在英国伯明翰举行,大会吸引了 8000 学术从业者参加,并从 235 篇应用研究方向(applied research track)的投稿论文中,评选出了本届最佳应用论文奖,来自蚂蚁集团的用户行为表征模型研究论文获得了该奖项。用户行为表征建模和现在大家熟知的语言模型有很多相似之处,都是从海量的数据中,通过神经网络模型对序列数据进行表征,不同之处在于前者是对用户行为序列进行学习,后者是对语言序列进行学习。那该论文中的用户行为表征模型有什么独特之处呢?目前
大咖云集,看点前瞻:蚂蚁集团主办CNCC2023五大论坛
2023 年 10 月 26-28 日,第二十届中国计算机大会(CNCC2023)将于沈阳举行。CNCC 由中国计算机学会(CCF)主办,是计算领域学术、技术、产业、教育各界宏观探讨发展趋势的年度盛会,为展示学术成果与技术创新搭建平台,促进各界交流合作,加快科研成果转换。本届 CNCC2023 大会以“发展数字基础设施,支撑数字中国建设”为主题,线下参会人数预计达万人。蚂蚁集团作为本次大会合作单位将主办五大论坛,重点关注数据安全与产学研深度融合,邀请多位学者专家到场分享,洞见计算领域新技术,共话数字发展新态势。论坛
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉