淘天
任务级奖励提升App Agent思考力,淘天提出Mobile-R1,3B模型可超32B
现有Mobile/APP Agent的工作可以适应实时环境,并执行动作,但由于它们大部分都仅依赖于动作级奖励(SFT或RL)。 而这些奖励只能引导代理预测每一步中最佳的单一动作,因此难以应对不断变化的移动环境。 比如一句指令:“打开飞猪,进入酒店套餐,进入热门直播,找到飞猪超级VIP,并关注主播”。
7/20/2025 2:48:17 PM
西风
继“阿里星”后,阿里淘天重启顶尖技术人才招聘,百万年薪是标配
7月22日,阿里巴巴淘天集团的“顶尖人才T-Star计划“正式启动。该项目延揽全球前沿技术领域的竞赛、学术和实战高手,为这些“天才少年”提供顶尖技术课题、算力资源、研发平台资源,和百万年薪起步、“大牛主管”专属培养的顶配成长空间。记者了解到,T-Star计划是“阿里星”计划的延续,“阿里星”起源于2011年,吸引最年轻最顶级的技术人才加入是它的宗旨。过往招聘进来的大多是博士,获得副总裁级别带队、上不封顶的年薪。27岁的算法工程师刘佳恒去年通过T-Star计划加入淘天,工作方向是AI大模型。名校博士毕业的他手握多个大
7/22/2024 3:07:00 PM
新闻助手
淘宝“星辰”大模型亮相,布局电商和生活服务场景
感谢据 Tech 星球消息,淘宝天猫集团自研大模型“淘宝星辰”官网已经上线。官网除了显示该大模型的介绍外,还设置有“立即体验”和“登录 / 注册”入口,预计在不久后对外开放。据介绍,星辰大模型基于 Transformer 架构,采用半自研的 Megatron-ama 框架进行训练,从电商消费数据和公开数据中学习,能够给用户提供电商和生活服务场景增强的文案生成、多轮会话、知识问答、智能决策等能力。此举意味着,淘天集团正着手布局电商和生活服务场景的 AI 大模型赛道。淘天大模型主要针对的用户群体为平台商家和消费者。针对
3/21/2024 5:55:05 PM
归泷(实习)
- 1
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用